首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

文档处理方法及装置、存储介质、电子设备 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:深圳须弥云图空间科技有限公司

摘要:本公开属于计算机技术领域,涉及一种文档处理方法及装置、存储介质、电子设备。该方法包括:获取预测绘文档,并对预测绘文档进行图像纠正处理得到矫正文档;对矫正文档进行文本识别处理得到文档文本,并对文档文本进行文字纠正处理得到矫正文本;对矫正文本进行规范化处理得到规范文本,并对规范文本进行复合校验处理得到目标文本。本公开大幅度提升了低质量的预测绘文档的识别准确率,提升了文本识别的准确性,更关注于文本内容的准确性以及设计贴合性,提供了自动化且智能化的文本统一方式和多重校验方式,减少了目标文本抽取错误的情况发生,从数据本身和文档所属领域特殊性两方面着重保障文本抽取的准确率,从而提升了业务处理的效率和速度。

主权项:1.一种文档处理方法,其特征在于,所述方法包括:获取预测绘文档,并对所述预测绘文档进行图像纠正处理得到矫正文档;对所述矫正文档进行文本识别处理得到文档文本,并对所述文档文本进行文字纠正处理得到矫正文本;对所述矫正文本进行规范化处理得到规范文本,并对所述规范文本进行复合校验处理得到目标文本;其中,所述对所述矫正文档进行文本识别处理得到文档文本包括:利用文本检测模型对所述矫正文档进行文本检测处理得到所述矫正文档中的文本框;利用复合神经网络模型对所述文本框进行文本识别处理得到文档文本,包括:对所述文本框进行特征提取处理得到图片特征;对所述图片特征进行时序特征转化得到时序特征;对所述时序特征进行特征整合处理得到文档文本;所述对所述文档文本进行文字纠正处理得到矫正文本,包括:获取与所述文档文本对应的文本分值,并获取与所述文本分值对应的分值阈值;根据所述文本分值与所述分值阈值的比较结果获取标准测绘术语,并对所述文档文本与所述标准测绘术语进行相似距离计算得到文字距离;基于所述文字距离,利用所述标准测绘术语对所述文档文本进行文字替换处理得到矫正文本。

全文数据:

权利要求:

百度查询: 深圳须弥云图空间科技有限公司 文档处理方法及装置、存储介质、电子设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。