恭喜中国科学院信息工程研究所;中国传媒大学曾港艳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜中国科学院信息工程研究所;中国传媒大学申请的专利一种成本高效的场景文字检测方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114220086B 。
龙图腾网通过国家知识产权局官网在2025-03-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111295077.2,技术领域涉及:G06V20/62;该发明授权一种成本高效的场景文字检测方法及系统是由曾港艳;张远;周宇;杨晓萌;王伟平设计研发完成,并于2021-11-03向国家知识产权局提交的专利申请。
本一种成本高效的场景文字检测方法及系统在说明书摘要公布了:本发明公开一种成本高效的场景文字检测方法及系统,属于图像字体识别领域,本发明首先在预训练阶段提出一种无监督域适应方法,通过消除虚拟数据和真实数据的域差异,使虚拟数据在特征上更接近真实数据,从而获得一个较好的迁移学习初始模型;其次在微调阶段提出一个半监督主动学习方法,根据真实数据的标注信息量自适应选择数据进行标注,然后同时利用有标注和无标注的真实数据进行训练,在较小标注成本的条件下尽可能提升场景文字检测性能。
本发明授权一种成本高效的场景文字检测方法及系统在权利要求书中公布了:1.一种成本高效的场景文字检测方法,其特征在于,包括以下步骤:利用作为源域的有标注的虚拟数据和作为目标域的无标注的真实数据,该虚拟数据和真实数据均为图像数据,对加入了熵感知的全局对齐模块和文字区域对齐模块的场景文字检测网络进行预训练,其中熵感知的全局对齐模块对源域和目标域的特征图进行对齐来减小域差异,文字区域对齐模块对分类分支网络预测的分类置信度大于置信度阈值的文字候选区域的特征进行对齐,训练后得到预训练模型;利用预训练模型进行基于不确定性度量的主动学习,从目标域的真实数据中选取若干图像进行人工标注,得到人工标注的真实数据,利用该人工标注的真实数据重新训练一个新的场景文字检测网络;利用预训练模型和重新训练后的场景文字检测网络,对目标域剩余的真实数据进行增强伪标注,得到增强伪标注的真实数据;利用所述人工标注的真实数据和所述增强伪标注的真实数据,对预训练模型进行微调;对微调后的预训练模型移除熵感知的全局对齐模块和文字区域对齐模块,得到参数更新后的场景文字检测网络,利用该参数更新后的场景文字检测网络处理待检测场景图像,得到任意形状的文字检测结果;所述场景文字检测网络包括特征提取模块、区域候选网络模块、感兴趣区域对齐网络模块和检测头网络模块,对输入的图像数据进行处理的步骤包括:利用特征提取模块的卷积神经网络提取场景图像的特征图;利用区域候选网络模块从特征图中选择文字候选区域;利用感兴趣区域对齐网络模块根据特征图和文字候选区域,获得文字候选区域的特征;利用检测头网络模块的分类分支、回归分支、分割分支对文字候选区域的特征进行处理,分类分支预测文字候选区域属于文字区域的置信度分数,回归分支预测文字候选区域与实际文字区域的位置偏移量,分割分支预测文字候选区域中文字的掩膜信息,并根据掩膜信息产生最终的任意形状的文字检测结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院信息工程研究所;中国传媒大学,其通讯地址为:100093 北京市海淀区闵庄路甲89号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。