恭喜航天信息股份有限公司邓应强获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜航天信息股份有限公司申请的专利一种进行字符识别的方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN112733828B 。
龙图腾网通过国家知识产权局官网在2025-03-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202011611147.6,技术领域涉及:G06V30/14;该发明授权一种进行字符识别的方法及系统是由邓应强;赖新明;杨硕;刘振宇;王亚平设计研发完成,并于2020-12-30向国家知识产权局提交的专利申请。
本一种进行字符识别的方法及系统在说明书摘要公布了:本发明涉及一种进行字符识别的方法及系统,其中方法包括:对待识别的图像文件进行光学字符识别以获得多个文字字符,从多个文字字符中确定多个待调整字符;从每个待调整字符的识别结果列表中选择置信度最大的预定数量的识别结果字符,以构成每个待调整字符的识别结果集合;获取每个待调整文字字符的至少两个邻近字符,并将每个待调整文字字符和至少两个邻近字符组成每个待调整文字字符的待调整字符组,基于关联规则挖掘模型对每个待调整字符的识别结果集合和待调整字符组进行处理以确定文本关联度;选择置信度最大的识别结果字符作为每个待调整字符的目标文字字符,利用目标文字字符替换相应的待调整字符,以获得经过调整的文本文件。
本发明授权一种进行字符识别的方法及系统在权利要求书中公布了:1.一种进行字符识别的方法,所述方法包括:获取包含多个文字字符的待识别的图像文件,对所述待识别的图像文件进行图像处理,确定经过图像处理的图像文件是否满足字符识别要求,当满足字符识别要求时,对待识别的图像文件进行光学字符识别以获得文本文件,其中文本文件中包括多个文字字符,并且每个文字字符包括多个识别结果字符;在获取包含文字字符的待识别的图像文件之前还包括:搜集文本语料,其中文本语料的内容与需要识别的字符所属类型保持一致;使用关联规则挖掘算法对所搜集的文本语料进行分析,为每个文字字符建立与相邻的多个文字字符的关联关系,从而建立关联规则挖掘模型;获取多个文字字符中每个文字字符的所有识别结果字符的置信度,将多个文字字符中所有识别结果字符中最大置信度小于置信度阈值的文字字符确定为待调整字符,以确定多个待调整字符;按照置信度的降序顺序为每个待调整字符的多个识别结果字符进行排序,以获得每个待调整字符的识别结果列表,从每个待调整字符的识别结果列表中选择置信度最大的预定数量的识别结果字符,以构成每个待调整字符的识别结果集合;获取每个待调整文字字符的至少两个邻近字符,并将每个待调整文字字符和至少两个邻近字符组成每个待调整文字字符的待调整字符组,基于关联规则挖掘模型对每个待调整字符的识别结果集合和待调整字符组进行处理以确定文本关联度;通过每个待调整字符的置信度和文本关联度,计算识别结果集合中每个识别结果字符的置信度,选择置信度最大的识别结果字符作为每个待调整字符的目标文字字符,利用目标文字字符替换相应的待调整字符,以获得经过调整的文本文件;还包括,通过将光学字符识别技术与自然语言识别处理相结合,通过对识别的文本内容进行判断、确定自然语言文字之间的关联关系,以及通过判断识别的字符在逻辑上是否符合自然语言的语法规律来对识别的文本进行校正,或者通过促使提取出的文本符合自然语言的逻辑规则来进行文本的校正。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人航天信息股份有限公司,其通讯地址为:100195 北京市海淀区杏石口路甲18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。