恭喜上海浦东发展银行股份有限公司赵逸如获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜上海浦东发展银行股份有限公司申请的专利表格提取方法、装置、计算机设备、存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114283435B 。
龙图腾网通过国家知识产权局官网在2025-05-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111462113.X,技术领域涉及:G06V30/412;该发明授权表格提取方法、装置、计算机设备、存储介质是由赵逸如;李捷;王巍;张玉琦;张瑞雪;徐敏设计研发完成,并于2021-12-02向国家知识产权局提交的专利申请。
本表格提取方法、装置、计算机设备、存储介质在说明书摘要公布了:本申请涉及一种表格提取方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取表格图像,将表格图像输入至表格提取模型,表格提取模型包括文本提取网络块、单元格提取网络块和结构提取块,通过文本提取网络块对表格图像进行文本提取,得到表格图像的表格区域中单元格内的文本信息,通过单元格提取网络块对表格图像进行单元格提取,得到表格图像的表格区域中单元格的单元格信息,通过结构提取块根据单元格的单元格信息生成与表格区域对应的表格结构,按照表格结构将文本信息与单元格融合,得到电子表格。采用本方法能够利用表格提取模型对表格图像进行端到端的表格数据提取,生成结构化电子表格,提高表格提取方法的通用性。
本发明授权表格提取方法、装置、计算机设备、存储介质在权利要求书中公布了:1.一种表格提取方法,其特征在于,所述方法包括:获取表格图像;将所述表格图像输入至表格提取模型,所述表格提取模型包括文本提取网络块、单元格提取网络块和结构提取块;通过所述文本提取网络块对所述表格图像进行文本提取,得到所述表格图像的表格区域中单元格内的文本信息;通过所述单元格提取网络块对所述表格图像进行单元格提取,得到所述表格图像的所述表格区域中单元格的单元格信息;通过所述结构提取块根据所述单元格的单元格信息生成与所述表格区域对应的表格结构;按照所述表格结构,将所述文本信息与所述单元格融合,得到电子表格;其中,所述表格区域中包括多个单元格,每个所述单元格的单元格信息包括单元格坐标,所述单元格坐标包括第一单元格坐标和第二单元格坐标,所述第一单元格坐标和所述第二单元格坐标为所述单元格斜对角上的坐标,所述第一单元格坐标包括第一方向上的第一坐标,以及第二方向上的第二坐标;所述通过所述结构提取块根据所述单元格的单元格信息生成与所述表格区域对应的表格结构,包括:通过所述结构提取块对所述表格区域中多个所述单元格的第一坐标进行排序,根据排序后的所述第一坐标对多个所述单元格进行聚类,确定所述第一方向上的多个第一单元格集合;获取每个所述第一单元格集合中单元格的第一坐标的平均值、中位数或众值,作为与所述第一单元格集合对应的第一参考坐标,并使用所述第一参考坐标对属于所述第一单元格集合的单元格在所述第一方向上进行对齐处理;通过所述结构提取块对所述表格区域中多个所述单元格的第二坐标进行排序,根据排序后的所述第二坐标对多个所述单元格进行聚类,确定所述第二方向上的多个第二单元格集合;获取每个所述第二单元格集合中单元格的第二坐标的平均值、中位数或众值,作为与所述第二单元格集合对应的第二参考坐标,并使用所述第二参考坐标对属于所述第二单元格集合的单元格在所述第二方向上进行对齐处理;根据所述第一参考坐标和所述第二参考坐标进行组合,生成多个参考坐标,并以所述第一参考坐标为基准进行排序得到每个所述参考坐标的第一顺序,以所述第二参考坐标为基准进行排序得到每个所述参考坐标的第二顺序,根据所述第一顺序和所述第二顺序生成每个所述参考坐标的标识;将对齐处理后的每个所述单元格的第一单元格坐标与多个所述参考坐标进行匹配,获取对齐处理后的每个所述单元格的第一单元格坐标与每个所述参考坐标之间的距离,确定与每个所述第一单元格坐标之间的距离小于或等于距离阈值的第一目标参考坐标,将所述第一目标参考坐标的标识作为与所述第一单元格坐标对应的第一结构参考坐标;将对齐处理后的每个所述单元格的第二单元格坐标与多个所述参考坐标进行匹配,获取对齐处理后的每个所述单元格的第二单元格坐标与每个所述参考坐标之间的距离,确定与每个所述第二单元格坐标之间的距离小于或等于所述距离阈值的第二目标参考坐标,将所述第二目标参考坐标的标识作为与所述第二单元格坐标对应的第二结构参考坐标;根据与对齐处理后的每个所述单元格对应的所述第一结构参考坐标和所述第二结构参考坐标,确定每个所述单元格在所述第一方向上的第一起始值和第一结束值,以及每个所述单元格在所述第二方向上的第二起始值和第二结束值;根据每个所述单元格在所述第一方向上的第一起始值和第一结束值确定每个所述单元格在所述第一方向上的第一位置信息,根据每个所述单元格在所述第二方向上的第二起始值和第二结束值确定每个所述单元格在所述第二方向上的第二位置信息,将所述第一位置信息和所述第二位置信息作为结构信息;根据每个所述单元格的结构信息,生成与所述表格区域对应的表格结构。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海浦东发展银行股份有限公司,其通讯地址为:200001 上海市黄浦区中山东一路12号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。