买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:山东声通信息科技有限公司;上海声通信息科技股份有限公司
摘要:本发明公开一种图片中文字抽取识别处理方法及系统,方法包括:将多张输入的完整字体图片与预设的多字体数据库进行比较匹配,获得目标字体数据库;将待检测的完整字体图片与目标字体数据库进行识别获得第一识别结果目标字;获取历史样本图像数据库,收集多张与第一识别结果目标字匹配对应的目标对象输入历史样本图像;对待检测的完整字体图片和多张目标对象输入历史样本图像进行像素点识别,得到目标对象输入历史样本图像的像素点信息和待检测的完整字体图片的像素点信息,计算相似度特征参数;确定多张目标对象输入历史样本图像中匹配度最高的目标对象输入历史样本图像,确定匹配度最高的目标对象输入历史样本图像中的目标最终文字。
主权项:1.一种图片中文字抽取识别处理方法,其特征在于,包括如下操作步骤:首先将多张输入的完整字体图片与预设的多字体数据库进行比较匹配,获得与当前目标对象的匹配度最高的字体数据库作为目标字体数据库;调用相匹配的所述目标字体数据库;获取待检测的完整字体图片,将待检测的完整字体图片与目标字体数据库进行识别获得第一识别结果目标字;获取历史样本图像数据库,收集多张与第一识别结果目标字匹配对应的目标对象输入历史样本图像;将待检测的完整字体图片作为当前输入图像,并将第一识别结果目标字对应的多张目标对象输入历史样本图像作为目标预测图像;对待检测的完整字体图片和多张目标对象输入历史样本图像进行像素点识别处理,得到目标对象输入历史样本图像的像素点信息和待检测的完整字体图片的像素点信息;根据目标对象输入历史样本图像的像素点信息和待检测的完整字体图片的像素点信息,计算相似度特征参数;根据相似度特征参数,确定多张目标对象输入历史样本图像中匹配度最高的目标对象输入历史样本图像,进而确定匹配度最高的目标对象输入历史样本图像中的目标最终文字;目标最终文字与第一识别结果目标字进行判断,如果确定目标最终文字与第一识别结果目标字为同一个文字,则二次判定结果为正确;将第一识别结果目标字的判定结果视为最终判定结果输出发送;根据目标对象输入历史样本图像的像素点信息和待检测的完整字体图片的像素点信息,计算相似度特征参数,具体操作步骤如下:通过所述目标对象输入历史样本图像的像素点信息和待检测的完整字体图片的像素点信息进行提取文字特征,所述文字特征包括字体特征、笔画特征、角点特征;确认所述待检测的完整字体图片的像素点信息的文字特征中的字体特征;通过所述字体特征确认所述待检测的完整字体图片的书法形式与文字鉴定属性结果;并通过字体特征的书法形式与文字鉴定属性结果确定笔画特征,初始状态下,先利用初始检测模型对该笔画特征进行初始识别得到当前笔画的初始识别结果,根据当前笔画的初始识别结果和文字鉴定属性结果进一步判断该待检测的完整字体图片的字体对应的所述笔画特征中是否可能存在连笔笔画特征;进一步地,根据当前疑似的连笔笔画特征进行确定笔画轨迹相互连接的交点,统计笔画轨迹相互连接的交点数量,确定为实际角点数量;获取当前笔画的初始识别结果,调用当前笔画的初始识别结果对应的预设角点数量阈值d,判断所述实际角点数量是否等于预设角点数量阈值d;若是,则对所述待检测的完整字体图片的角点数量进行保留,即判定角点数量正常;若否,则对判定当前文字特征的笔画特征最终鉴定为连笔笔画特征,提取所述连笔笔画特征的笔画轨迹的角点数量;根据所述目标对象输入历史样本图像的像素点信息提取的文字特征进行直接对所述多张目标对象输入历史样本图像的像素点信息进行判断连笔笔画特征,并根据目标对象输入历史样本图像的连笔笔画特征判断笔画轨迹的角点数量;通过所述目标对象输入历史样本图像与所述待检测的完整字体图片的文字特征进行计算连笔笔画特征的相似度,并通过角点数量进行计算角点特征的相似度。
全文数据:
权利要求:
百度查询: 山东声通信息科技有限公司 上海声通信息科技股份有限公司 一种图片中文字抽取识别处理方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。