Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜大连理工大学张立和获国家专利权

恭喜大连理工大学张立和获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜大连理工大学申请的专利一种基于深度学习的场景文本检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115131778B

龙图腾网通过国家知识产权局官网在2025-04-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210671550.0,技术领域涉及:G06V20/62;该发明授权一种基于深度学习的场景文本检测方法是由张立和;高文浩设计研发完成,并于2022-06-15向国家知识产权局提交的专利申请。

一种基于深度学习的场景文本检测方法在说明书摘要公布了:本发明属于人工智能技术领域,提出了一种基于深度学习的场景文本检测方法。本发明首先构建了基础特征提取网络模块,然后构建了双权重引导的流对齐模块,将之与特征金字塔网络模块相结合,处理了文本检测中的多尺度变化问题;然后用双路分对称残差模块进行边缘特征强化,从而得到分割结果;最后由分割图生成文本框。本发明实现了快速轻量级的文本检测模型,不仅能够检测复杂场景下任意形状的文本目标,而且检测结果精准,检测的速度也有一定保障;具有极强的应用价值。

本发明授权一种基于深度学习的场景文本检测方法在权利要求书中公布了:1.一种基于深度学习的场景文本检测方法,其特征在于,包括步骤如下:步骤1、构建特征提取网络;特征提取网络包括基础特征提取网络模块、双权重引导的流对齐模块和特征金字塔网络模块;基础特征提取网络模块以ResNet或MobileNet网络结构作为骨干,图像输入至不同网络层,分别提取图像尺寸的14、18、116、132输出特征,不同网络层对应的通道数依次为64、128、256、512;双权重引导的流对齐模块输入分为Flow和Fhigh两部分,Flow表示当前基础特征提取网络层的输出特征,Fhigh表示上一级双权重引导的流对齐模块的输出特征;首先对Fhigh进行上采样,利用双线性插值,得到与Flow相同尺寸的特征图;将两个特征图进行通道级联,经过一次3×3卷积后,得到语义流场;同时对通道级联后的特征图依次进行3×3卷积、Relu激活函数和1×1卷积得到空间权重图;将得到的语义流场与Fhigh通过光流映射操作,用于解决使用双线性插值进行上采样时的对不齐问题,将对齐后的特征图再与空间权重图相乘,得到富含空间语义信息的高分辨率特征图;同时将Fhigh通过双权重引导的流对齐模块中的通道注意力机制模块后得到的通道权重图与Flow相乘,得到富含通道信息的高分辨率特征图;将富含空间语义信息的高分辨率特征图、富含通道信息的高分辨率特征图以及初始的Flow三者相加得到的特征图作为双权重引导的流对齐模块的输出;将双权重引导的流对齐模块进行三次复用,特征金字塔网络模块用于融合双权重引导的流对齐模块的输出;首先,将基础特征提取网络模块输出的132尺寸特征图C5使用空洞空间卷积池化金字塔网络进行特征扩展得到132尺寸的特征图P5,将基础特征提取网络模块输出的116尺寸特征图C4与132尺寸的特征图P5输入至双权重引导的流对齐模块;然后将双权重引导的流对齐模块的输出特征与基础特征提取网络模块输出的116尺寸特征图C4相加得到116尺寸的特征图P4;重复上述步骤得到尺寸为18的特征图P3和尺寸为14的特征图P2;最后将132尺寸的特征图P5、116尺寸的特征图P4、18的特征图P3上采样至与尺寸为14的特征图P2相同的尺寸,再通过通道级联,最后得到原图尺寸14,通道数为256的特征图F1;步骤2、将特征图F1输入到双路非对称残差模块进行边缘强化,得到特征图F2;双路非对称残差模块包括特征金字塔卷积层、非对称卷积层和逐点卷积层;特征图F1输入至特征金字塔卷积层进行特征提取后,通道数减半输送至两个不同分路;两不同分路分别采用带膨胀率的3×1和1×3的深度卷积、卷积核为1×3和3×1的深度卷积,用于缓解分类和定位的矛盾以及促进信息间的聚合;两分路末端均通过卷积核为1×1的逐点卷积层恢复通道数量;两分路输出的特征图相加之后通过通道混洗以促进信息间的交流,最后与该模块的输入特征图相加以促进信息间的融合,获得特征图F2;步骤3、由特征图F2预测得到概率图P和阈值图T;通过概率图P和阈值图T计算得到近似二值图B,计算公式如下: 其中:Bi,j为生成的近似二值图;Pi,j是概率图,Ti,j是阈值图;k为放大倍数;步骤4、生成文本框首先设定一个固定阈值,将概率图转换为近似二值图;近似二值图由像素值为0和1的点组成,其中像素值为1的点属于文本区域,反之属于非文本区域;然后对近似二值图计算轮廓,遍历每个轮廓,去除小于所设定的文本框最小长度预测;对每个轮廓计算包围矩形,然后计算该矩形的预测分数,对矩形进行反向收缩操作,得到真实矩形大小;最后还原到原图尺寸。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人大连理工大学,其通讯地址为:116024 辽宁省大连市甘井子区凌工路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。