买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中科微至科技股份有限公司
摘要:本发明公开了一种基于OCR技术的包裹表面信息提取方法及系统,涉及物流技术领域,该方法包括:对待测包裹表面图像进行滑窗切分,将切分后的子图像输入至构建的文本检测模型中,定位每个子图像的文本区域;将各子图像的文本区域位置信息映射到待测包裹表面图像,并按照位置关系合并文本区域;剪裁出合并后每个文本区域框定的图像并旋转至水平方向,要求旋转后的图像宽度大于高度;将旋转后的图像输入至构建的文本方向分类模型中进行文本方向的检测;将校正文本方向后的图像输入至构建的文本识别模型中,得到待测包裹表面图像的文本内容。本发明有效解决了OCR技术在包裹分拣场景中受限于文本角度以及高分辨率图像等问题,极大提高了识别效率。
主权项:1.一种基于OCR技术的包裹表面信息提取方法,其特征在于,所述方法包括:对待测包裹表面图像进行滑窗切分,将切分后的子图像输入至构建的文本检测模型中,定位每个子图像的文本区域;将各子图像的文本区域位置信息映射到所述待测包裹表面图像,并按照位置关系合并所述文本区域;剪裁出合并后的每个文本区域框定的图像并旋转至水平方向,要求旋转后的图像宽度大于高度;将所述旋转后的图像输入至构建的文本方向分类模型中进行文本方向的检测;将校正文本方向后的图像输入至构建的文本识别模型中,得到所述待测包裹表面图像的文本内容;其中,所述按照位置关系合并所述文本区域,包括:所述文本检测模型输出每个子图像对应的文本旋转框集合,文本旋转框框定的区域为所述文本区域;对于每个子图像,获取其映射到所述待测包裹表面图像的文本旋转框集合记作Ri={r1,…,rN},遍历集合Ri,若满足IOHrj1,rj2>α、IOWrj1,rj2>β且|θj1-θj2|%180<γ,则将文本旋转框rj1和rj2合并成一个新文本旋转框,在所述集合Ri中删除所述文本旋转框rj1和rj2并增加所述新文本旋转框,重新遍历集合Ri直至不再发生变化;其中,IOHrj1,rj2表示文本旋转框rj1和rj2重合部分的短边长度与两者中短边长度较大者的比值,IOWrj1,rj2表示文本旋转框rj1和rj2重合部分的长边长度;α、β、γ均为经验值,β取两个标准中等大小字体的像素宽度的平均值。
全文数据:
权利要求:
百度查询: 中科微至科技股份有限公司 一种基于OCR技术的包裹表面信息提取方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。