首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

表格数据提取方法、装置、计算机设备和存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:腾讯科技(深圳)有限公司

摘要:本申请涉及一种基于人工智能中自然语言处理技术的表格数据提取方法、装置、计算机设备和存储介质。所述方法包括:获取第一方向边框缺失表格;获取所述第一方向边框缺失表格中的关键字;通过预设语言模型,识别不同表格单元中所述关键字的主从关系,所述预设语言模型用于识别关键字属于同一语句的概率;根据所述主从关系补充所述第一方向边框缺失表格中的第一方向边框;识别并提取所述补充后的表格内的表格数据。本申请中,通过预设语言模型,来识别第一方向边框缺失表格中关键字的主从关系,而后基于确定的主从关系来补充第一方向边框,进而进行表格数据的提取,具备更高的数据提取准确率。

主权项:1.一种表格数据提取方法,其特征在于,所述方法包括:获取第一方向边框缺失表格;获取所述第一方向边框缺失表格中的关键字;通过预设语言模型,获取所述关键字中,不同表格单元中关键字间的语言模型概率;根据所述语言模型概率与预设模型概率阈值,获取不同表格单元中所述关键字的主从关系,所述语言模型概率是指不同表格单元中关键字属于同一语句的概率,所述不同表格单元为表格中沿第二方向的表格单元,所述第一方向为表格列方向,所述第二方向为表格行方向,或所述第一方向为表格行方向,所述第二方向为表格列方向,所述关键字的主从关系,是指某个关键字为不同表格单元的其它关键字的分支关键字的关系;当不同表格单元的关键字间存在主从关系时,在主关键字区域不补充第一方向边框,在从关键字之间的留白位置,以及从关键字的键值之间的留白位置补充第一方向边框,得到补充后的表格;识别并提取所述补充后的表格内的表格数据。

全文数据:

权利要求:

百度查询: 腾讯科技(深圳)有限公司 表格数据提取方法、装置、计算机设备和存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术