买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:刘保昌
摘要:本申请公开了一种可定制数据结构的单据数据提取处理方法,旨在解决传统单据数据处理中的不灵活、效率低下等问题。通过定制数据结构,创建与单据样式匹配的模板,实现单据图像中目标区域文本信息的精准提取。提取后的文本信息经矩阵化处理,与定制数据结构匹配,生成结构化数据输出。本发明方法灵活、高效,适用于各类单据数据的快速提取与处理,显著提升数据处理效率与准确性,满足实际业务需求。
主权项:1.一种可定制数据结构的单据数据提取处理方法,其特征在于,包括以下步骤:1根据实际业务需要,定制需要从单据中提取的数据结构,该数据结构以层次化形式组织,包括至少一个数据组,每个数据组具有唯一标识符,并包含至少一个数据键值对,其中键用于标识数据类型或属性,值表示具体的数据内容;2使用定制的数据结构以及实际单据的样式和内容,创建单据匹配的样式模板,该模板包含多个定义好的区域,包括用于全局定位的主锚区域、用于局部对齐的基准区域以及至少一个与数据键值对相对应的目标区域,每个目标区域具有明确的坐标范围,用于在单据图像中定位并提取相应的文本信息;3接收待识别的单据图像,并根据单据匹配的样式模板,在单据图像中定位并提取出各个目标区域的文本信息;4对提取出的文本信息进行矩阵化处理,将文本信息与目标区域的坐标范围相结合,形成矩阵形式的数据结构;5将矩阵形式的数据结构与定制的数据结构进行匹配,通过比对键值和结构生成与定制数据结构同构的结构化数据输出。
全文数据:
权利要求:
百度查询: 刘保昌 一种可定制数据结构的单据数据提取处理方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。