首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

文本行区域定位方法、版面分析方法及字符识别方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京中安未来科技有限公司

摘要:本发明属于数字图像识别中的光学字符识别技术领域,尤其涉及一种文本行区域定位方法、基于文本行区域定位的版面分析方法及基于版面分析的字符识别方法、装置和存储介质。所述文本行区域定位方法包括以下步骤:获取待识别图像的灰度图像;根据灰度图像获得定位图像;识别定位图像中的正色文本行区域和或反色文本行区域。所述基于文本行区域定位的版面分析方法和所述基于版面分析的字符识别方法,均包括应用文本行区域定位方法获取正色文本行区域和或反色文本行区域。本发明,通过文本行区域,拼接得到仅具有正色文本行区域或仅具有反色文本行区域的结果图像,以实现一次识别获取所有字符信息,从而提高字符识别的效率。

主权项:1.一种文本行区域定位方法,其特征在于,该方法包括以下步骤:获取待识别图像的灰度图像;根据所述灰度图像获得定位图像;识别所述定位图像中的正色文本行区域和或反色文本行区域;其中,所述定位图像中的文本行区域为第一文本行区域,所述第一文本行区域的行内区域为第一行内区域,所述第一行内区域的行外区域为第一行外区域;识别所述定位图像中的正色文本行区域和或反色文本行区域,包括:识别所述定位图像的第一文本行区域;在所述定位图像中选取第一行内区域和第一行外区域;在所述第一行内区域的灰度值小于所述第一行外区域的灰度值的情况下,确定该所述第一文本行区域为正色文本行区域;和或,在所述第一行内区域的灰度值大于所述第一行外区域的灰度值的情况下,确定该所述第一文本行区域为反色文本行区域;或者,所述定位图像包括定位空心二值图像和定位反空心二值图像;所述定位空心二值图像中的文本行区域为第二文本行区域,所述第二文本行区域的行内区域为第二行内区域,所述第二行内区域的行外区域为第二行外区域,所述第二行内区域的灰度值与所述第二行外区域的灰度值之间的差值的绝对值为第二灰度差值;所述定位反空心二值图像中的文本行区域为第三文本行区域,所述第三文本行区域的行内区域为第三行内区域,所述第三行内区域的行外区域为第三行外区域,所述第三行内区域的灰度值与所述第三行外区域的灰度值之间的差值的绝对值为第三灰度差值;识别所述定位图像中的正色文本行区域和或反色文本行区域,包括:识别所述定位空心二值图像中的第二文本行区域和所述定位反空心二值图像中的第三文本行区域;当所述第二文本行区域与至少一个所述第三文本行区域存在重叠区域时,获取该所述第二文本行区域的第二灰度差值和对应于该所述第二文本行区域的第三文本行区域的第三灰度差值;或者,当所述第三文本行区域与至少一个所述第二文本行区域存在重叠区域时,获取该所述第三文本行区域的第三灰度差值和对应于该所述第三文本行区域的第二文本行区域的第二灰度差值;当所述第二灰度差值大于所述第三灰度差值时,确定所述第二文本行区域为正色文本行区域,和或,所述第三文本行区域为反色文本行区域;和或,当所述第二灰度差值小于所述第三灰度差值时,确定所述第二文本行区域为反色文本行区域,和或,所述第三文本行区域为正色文本行区域。

全文数据:

权利要求:

百度查询: 北京中安未来科技有限公司 文本行区域定位方法、版面分析方法及字符识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。