恭喜清华大学彭良瑞获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜清华大学申请的专利场景文字识别模型的训练方法与识别方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113762241B 。
龙图腾网通过国家知识产权局官网在2025-06-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111028327.6,技术领域涉及:G06V30/144;该发明授权场景文字识别模型的训练方法与识别方法及装置是由彭良瑞;石浩东;闫睿劼;王生进设计研发完成,并于2021-09-02向国家知识产权局提交的专利申请。
本场景文字识别模型的训练方法与识别方法及装置在说明书摘要公布了:本申请实施例提供一种场景文字识别模型的训练方法与识别方法及装置。场景文字识别模型的训练方法包括:获取样本图像;将样本图像输入场景文字识别模型,得到样本图像对应的预测文字和文字几何形状信息的预测特征图;根据预测文字、文字几何形状信息的预测特征图、样本图像对应的目标文字以及文字几何形状信息的目标图,计算总损失函数,并利用总损失函数最小化调整场景文字识别模型的参数,得到满足收敛条件的场景文字识别模型;其中文字几何形状信息包括前景掩膜以及字符轮廓中的至少一种。本申请对具有复杂背景的场景文字具有较好的识别效果。
本发明授权场景文字识别模型的训练方法与识别方法及装置在权利要求书中公布了:1.一种场景文字识别模型的训练方法,其特征在于,包括:获取样本图像;将所述样本图像输入场景文字识别模型,得到所述样本图像对应的预测文字和文字几何形状信息的预测特征图;根据所述预测文字、所述文字几何形状信息的预测特征图、所述样本图像对应的目标文字以及文字几何形状信息的目标图,计算所述场景文字识别模型对应的总损失函数,并利用所述总损失函数最小化调整所述场景文字识别模型的参数,得到满足收敛条件的场景文字识别模型;其中,所述场景文字识别模型包括:卷积神经网络、文字几何形状信息的预测模块、特征融合模块和编码器-解码器,所述卷积神经网络用于对所述样本图像的归一化图像进行特征提取得到原始特征图和至少一个中间特征图,所述文字几何形状信息的预测模块用于对所述至少一个中间特征图进行文字几何形状信息预测,得到文字几何形状信息的预测特征图;所述特征融合模块用于对所述原始特征图与所述预测特征图进行特征融合处理得到特征融合图,其中,所述特征融合处理为将所述原始特征图与前景掩膜的预测特征图加权特征融合,或者将所述原始特征图与字符轮廓的预测特征图加权特征融合,或者将所述原始特征图与前景掩膜的预测特征图以及字符轮廓的预测特征图加权特征融合;所述编码器-解码器用于对所述特征融合图进行编码处理,并对编码得到的结果进行解码处理,得到所述预测文字,其中,所述原始特征图为所述卷积神经网络最终输出的特征图,所述中间特征图是所述卷积神经网络在计算过程中的输出的特征图;所述文字几何形状信息包括前景掩膜以及字符轮廓中的至少一种。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人清华大学,其通讯地址为:100084 北京市海淀区清华园;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。