申请/专利权人:山东环球软件股份有限公司
申请日:2024-06-05
公开(公告)日:2024-07-05
公开(公告)号:CN118298445A
主分类号:G06V30/19
分类号:G06V30/19;G06V30/18;G06V30/244;G06V30/262;G06V10/774;G06V10/764;G06V10/82;G06N3/044;G06N3/0464;G06N3/042;G06N3/08;G06V10/84;G06N7/01
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.07.23#实质审查的生效;2024.07.05#公开
摘要:本发明涉及字符识别技术领域,更进一步地,涉及基于深度学习的OCR错漏检测方法。所述方法包括:步骤1:对目标文本图像进行预处理,得到预处理图像;步骤2:使用卷积神经网络从预处理图像中提取特征;将提取的特征输入递归神经张量网络进行特征表示学习,输出每个时刻的隐藏状态;步骤3:使用条件随机场对递归神经张量网络输出的隐藏状态进行序列标注;步骤4:针对检测出的错漏位置,使用贝叶斯方法进行校正,输出校正的错漏位置。本发明提高了系统的错漏检测和校正能力,增强了系统在处理复杂和多变文本数据时的鲁棒性和适应性。
主权项:1.基于深度学习的OCR错漏检测方法,其特征在于,所述方法包括:步骤1:对目标文本图像进行预处理,得到预处理图像;步骤2:使用卷积神经网络从预处理图像中提取特征;将提取的特征输入递归神经张量网络进行特征表示学习,输出每个时刻的隐藏状态;步骤3:使用条件随机场对递归神经张量网络输出的隐藏状态进行序列标注;再使用极端梯度提升的方法,对序列标注后的隐藏状态进行错漏检测,检测出错漏位置;步骤4:针对检测出的错漏位置,使用贝叶斯方法进行校正,输出校正的错漏位置。
全文数据:
权利要求:
百度查询: 山东环球软件股份有限公司 基于深度学习的OCR错漏检测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。