首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于轻量级神经网络模型的文字检测方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京思特奇信息技术股份有限公司

摘要:本发明提供一种基于轻量级神经网络模型的文字检测方法及系统,涉及图像处理和神经网络领域,包括:根据空间信息对文本数据进行分类和边框标注,获得训练数据集;构建轻量级神经网络模型,通过训练数据集训练神经网络模型;通过训练后的神经网络模型预测待测文本,获得文字类别、文字边框及边框置信度;针对边框置信度进行置信度筛选,针对文字边框进行非极大值抑制,得到清晰的文本行;对文本行按文字类别进行聚类,得到最终检测结果。本发明实现对图片中的具有空间信息的文字进行分类及检测,进而不需要人工对检测到的文字进行筛选,降低筛选成本。

主权项:1.一种基于轻量级神经网络模型的文字检测方法,其特征在于,包括:根据空间信息对文本数据进行分类和边框标注,获得训练数据集;其中,预设分类标签,包括:名称和内容;采用标注工具按所述分类标签对文本数据进行分类;采用四边形对每一行文字进行边框标注;构建轻量级神经网络模型,通过所述训练数据集训练所述神经网络模型;其中,包括;依次通过神经网络模型的类别分支输出所述训练数据集中各训练数据中文字的预测类别;利用多个宽度固定的矩形框拼接得到文字的边框坐标信息;根据神经网络模型得到的预测类别和训练数据集中的真实类别计算类别损失;根据神经网络模型得到的边框坐标信息和训练数据集中的真实边框坐标信息计算回归任务中的回归损失;根据所述类别损失和所述回归损失更新神经网络模型的参数,得到训练后的所述神经网络模型;通过训练后的所述神经网络模型预测待测文本,获得文字类别、文字边框及边框置信度;针对所述边框置信度进行置信度筛选,针对所述文字边框进行非极大值抑制,得到清晰的文本行;其中,针对所述边框置信度进行置信度筛选,得到置信度最高的边框,输出筛选后的所述待测文本图样;针对所述文字边框进行非极大值抑制,去除重叠度较高的边框,得到不重叠的清晰文本行;对所述文本行按所述文字类别进行聚类,其中,将类别相同且距离相近的边框聚为一行;对同一类别中,文字间隔较大但左右边界固定的边框,再次进行左右边界聚类,得到最终检测结果。

全文数据:

权利要求:

百度查询: 北京思特奇信息技术股份有限公司 一种基于轻量级神经网络模型的文字检测方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。