首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

证件图像文字内容识别方法、计算机设备及可读存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:福建晨曦信息科技集团股份有限公司

摘要:本申请涉及文字识别技术领域,具体涉及一种证件图像文字内容识别方法、计算机设备及可读存储介质。本申请的方法包括以下步骤:从证件图像中检测出所有的文字区域;提取文字区域图像的方向特征向量计算出方向角度;计算文本区域的倾斜偏差角度;计算所述证件图像的倾斜角度;根据倾斜角度对证件图像进行校正;从校正后的证件图像中重新检测出所有的文字区域;将所有文字区域进行合并处理得到处理结果集合;对每个文字区域进行文字识别后按指定格式组织数据并输出。本申请的技术方案,能自动对原始的证件图像进行校正处理,还可以将相同语义的文字区域进行合并,实现最终数据信息可直接用于信息化系统,大大提高了数据处理效率。

主权项:1.一种证件图像文字内容识别方法,其特征在于,包括以下步骤:S1、设置文字区域的间隔距离阈值,所述间隔距离阈值包括在x轴方向上的间隔距离阈值以及在y轴方向上的间隔距离阈值;所述在x轴方向上的间隔距离阈值由所有的文字区域的高度平均值乘以预设系数值得到,所述在y轴方向上的间隔距离阈值由所有的文字区域的高度平均值乘以预设系数值得到;S2、使用目标检测算法从证件图像中检测出所有的文字区域;所述文字区域为矩形区域,其四个顶点按顺时针顺序依次为P1x1,y1,P2x2,y2,P3x3,y3,P4x4,y4,其中P1为在直角坐标系中纵坐标值最大且横坐标值最小的顶点;S3、任意选取一个所述文字区域,提取该文字区域图像的方向特征向量;S4、根据所述方向特征向量从已训练的向量库中检索方向特征向量数据,得到所述文字区域图像的方向角度D;所述方向角度D取值为0度或180度;S5、基于所述文字区域的顶点坐标,计算所述文字区域的倾斜偏差角度J,计算公式为:,其中,x1为顶点P1的横坐标值,y1为顶点P1的纵坐标值,x2为顶点P2的横坐标值,y2为顶点P2的纵坐标值;S6、计算所述证件图像的倾斜角度M,计算公式为:M=D+J;S7、根据所述倾斜角度M对所述证件图像进行校正;S8、使用目标检测算法从校正后的所述证件图像中重新检测出所有的文字区域;S9、将所有所述文字区域按照从左到右从上到下的顺序进行排序并设置为未处理;S10、按照顺序选取第一个未处理的所述文字区域作为当前处理文字区域;设置该文字区域为已处理;S11、判断是否存在未处理的所述文字区域;若是则执行步骤S12,否则执行步骤S17;S12、按照顺序选取第一个未处理的所述文字区域作为待匹配文字区域;设置该文字区域为已处理;S13、判断是否当前处理文字区域与待匹配文字区域在水平方向上的距离m小等于间隔距离阈值并且当前处理文字区域与待匹配文字区域在垂直方向上的距离n小等于间隔距离阈值,若是,则执行步骤S14,否则执行步骤S15;S14、计算出包含当前处理文字区域与待匹配文字区域的最小矩形区域,作为新的当前处理文字区域,跳转至步骤S11继续执行;S15、将所述当前处理文字区域加入到文字区域处理结果集合中;S16、将所述待匹配文字区域作为当前处理文字区域,跳转至步骤S11继续执行;S17、将所述当前处理文字区域加入到所述文字区域处理结果集合中;S18、返回所述文字区域处理结果集合;S19、通过文字识别算法对所述文字区域处理结果集合中的每个文字区域进行文字识别;S20、按指定格式组织识别后的文字数据并输出。

全文数据:

权利要求:

百度查询: 福建晨曦信息科技集团股份有限公司 证件图像文字内容识别方法、计算机设备及可读存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。