买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:上海电力设计院有限公司
摘要:本发明公开了基于自然语言描述表格的检索增强生成方法;用于将包括两层以上层级列名和或两层以上层级行名的表格转化为仅有单层级列名和或单层级行名的表格;包括如下步骤;1、导入需要转换的包括两层以上层级列名和或两层以上层级行名的表格作为原始表格;2、建立一个数据区与原始表格的数据区完全相同,但仅有单层级列名和或单层级行名,且存储每一列名或每一行名所在单元格均为空白的结果表格;3、通过文档解析工具提取原始表格中的内容,对结果表格中空白的每一列名或者每一行名的单元格进行填充。本发明对表格进行转化,将多层次复杂的列名或行名,逐层降维拆解,再以自然语言描述形式组合重建成单层的列名或行名。
主权项:1.基于自然语言描述表格的检索增强生成方法;用于将包括两层以上层级列名和或两层以上层级行名的表格转化为仅有单层级列名和或单层级行名的表格;所述表格均包括数据区;所述数据区内的所有数据均存储在呈矩形阵列布置的多个单元格内;所述数据区的上方设有所述列名,和或所述述数据区的一侧设有所述行名;其中,所有所述列名中,最靠近所述数据区的一行所述列名的数量与所述数据区的列数相同,且与所述数据区的每一列一一对应;所有所述行名中,最靠近所述数据区的一列所述行名的数量与所述数据区的行数相同,且与所述数据区的每一行一一对应;其特征在于,包括如下步骤;步骤1、导入需要转换的包括两层以上层级所述列名和或两层以上层级所述行名的所述表格作为原始表格;步骤2、建立一个所述数据区与所述原始表格的所述数据区完全相同,但仅有单层级所述列名和或单层级所述行名,且存储每一所述列名或每一所述行名所在单元格均为空白的结果表格;步骤3、通过文档解析工具提取所述原始表格中的内容,对所述结果表格中空白的每一所述列名或者每一所述行名的所述单元格进行填充,具体步骤如下:步骤3.1、确定待填充的所述单元格是所述列名还是所述行名;若为所述行名,则根据相应行的数据在所述原始表格中定位最靠近所述数据区的一个所述行名的单元格作为目标单元格;若为所述列名,则根据相应列的数据在所述原始表格中定位最靠近所述数据区的一个所述列名的单元格作为目标单元格;步骤3.2、将所述目标单元格中的所述行名或者所述列名填充进待填充的所述单元格;步骤3.3、检查所述目标单元格相对于所述数据区而言的另一侧是否存在存有更高一级的所述行名或者所述列名的所述单元格;若有,则将存有更高一级的所述行名或者所述列名的所述单元格作为新的所述目标单元格;若无,则表示待填充的所述单元格已经完成填充,跳过后续步骤后进行下一个待填充的所述单元格的填充;步骤3.4、在所述目标单元格中的所述行名或者所述列名后增加一个逻辑连接字符后填充进相应的待填充的所述单元格内,置于所述单元格已有内容之前;步骤3.5、检查所述目标单元格相对于所述数据区而言的另一侧是否存在存有更高一级的所述行名或者所述列名的所述单元格;若有,则将存有更高一级的所述行名或者所述列名的所述单元格作为新的所述目标单元格,并重复执行步骤3.4和步骤3.5,直至所述目标单元格相对于所述数据区而言的另一侧不存在存有更高一级的所述行名或者所述列名的所述单元格,则表示待填充的所述单元格已经完成填充,之后进行下一个待填充的所述单元格的填充。
全文数据:
权利要求:
百度查询: 上海电力设计院有限公司 基于自然语言描述表格的检索增强生成方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。