买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:重庆理工大学
摘要:本发明公开了一种结构化文档理解模型建立方法,涉及文档智能技术领域。本发明至少包括S1:将数据集中的图像通过OCR技术提取出文本信息和布局信息后,使用两个自注意力编码器分别单独处理每个模态的信息;S2:采用结合了残差思想的门控模块筛选每个模态的信息;S3:引入交叉注意力机制,通过SCA模块融合文本特征和布局特征;S4:通过数据集对GCAF网络进行预训练。本发明提供的方法用于建立一种基于门控机制和交叉注意力的结构化文档理解模型,通过引入交叉注意力机制的SCA模块更好地融合了文档图像的布局特征和文本特征;同时提出新的残差门控模块动态提取每个模态的重要信息。
主权项:1.一种结构化文档理解模型建立方法,其特征在于:至少包括以下步骤:S1:将数据集中的图像通过OCR技术提取出文本信息和布局信息后,使用两个自注意力编码器分别单独处理每个模态的信息;S2:采用结合了残差思想的门控模块筛选每个模态的信息;S3:引入交叉注意力机制,通过SCA模块融合文本特征和布局特征;S4:通过数据集对GCAF网络进行预训练。
全文数据:
权利要求:
百度查询: 重庆理工大学 一种结构化文档理解模型建立方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。