首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种面向场景图像中任意形状邻近文本的检测系统及方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国科学院信息工程研究所

摘要:本发明公开一种面向场景图像中任意形状邻近文本的检测系统及方法,属于图像文本检测领域,通过生成区域建议使得网络更加关注文本特征,同时提出一种一对多的训练策略,为每一个候选框匹配多个目标文本,用以缓解邻近文本时在选取回归目标混淆的问题,最终提升基于回归的两阶段模型检测场景图像中任意形状邻近文本的能力。

主权项:1.一种面向场景图像中任意形状邻近文本的检测系统,其特征在于,包括:特征提取模块,由一个50层的残差网络和一个特征金字塔网络组成,残差网络为卷积神经网络,用于提取一个自底向上的不同尺度的视觉特征;特征金字塔网络由一个横向连接和一个自顶向下连接构成,用于融合不同尺度的视觉特征,得到融合特征;区域建议生成模块,用于在所述融合特征的每个位置上预设多个不同的锚框,经过分类和回归,生成一系列区域建议;检测头模块,用于单独对每个区域建议进行处理,根据区域建议中的坐标将区域建议对应的特征从融合特征中提取出来,得到区域建议特征,然后在该区域建议特征基础上进行分类和回归,得到场景图像的文本检测结果;该检测头模块包括两个卷积层、两个全连接层、两个区域建议特征关注模块PFAM,按照数据流的顺序为两个卷积层、一个全连接层、一个PFAM、另一个全连接层和另一个PFAM;PFAM用于使用一个感知机模块来生成当前区域建议特征对应的注意力权重,该注意力权重和区域建议的对应位置相乘即可得到一个自适应关注文本特征的优化特征,去除背景噪声。

全文数据:

权利要求:

百度查询: 中国科学院信息工程研究所 一种面向场景图像中任意形状邻近文本的检测系统及方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。