首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

乌金体藏文古籍文档图像的粘连文本行切分方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:西北民族大学

摘要:本发明公开了一种乌金体藏文古籍文档图像的粘连文本行切分方法及系统。所述方法首先获取乌金体藏文古籍文档版面处理后的二值图像;对二值图像进行局部基线检测,生成局部基线信息集合;根据所述局部基线信息集合对所述二值图像中的粘连区域进行检测、切分,生成粘连区域切分后图像;对所述粘连区域切分后图像进行连通域所属行的分配,生成文本行分配结果;根据所述文本行分配结果对所述粘连区域切分后图像进行文本行的分割,生成行切分后的图像。采用本发明方法能够有效切分藏文古籍粘连文本行,提高藏文古籍文本行的切分效率。

主权项:1.一种乌金体藏文古籍文档图像的粘连文本行切分方法,其特征在于,所述方法包括:获取乌金体藏文古籍文档版面处理后的二值图像;对所述二值图像进行局部基线检测,生成局部基线信息集合;所述对所述二值图像进行局部基线检测,生成局部基线信息集合,具体包括:对所述二值图像进行水平投影,统计各个Y纬度方向上前景色像素点个数之和,生成水平投影集合;采用霍夫直线检测方法查找所述二值图像中的直线段,生成各个Y纬度方向上的直线段长度集合;根据所述水平投影集合、所述水平投影集合的中位数、所述直线段长度集合以及所述直线段长度集合的中位数确定可能存在基线信息的基线位置,生成第一基线信息集合;对所述二值图像进行连通域检测,生成各个Y纬度方向上的连通域集合;根据所述连通域集合统计各个Y纬度方向上连通域最小外接矩形上边界的个数,生成外接矩形个数集合;根据所述连通域集合计算平均文字高度;根据所述外接矩形个数集合和所述平均文字高度过滤所述第一基线信息集合中的基线位置,生成第二基线信息集合;根据所述平均文字高度对所述第二基线信息集合中的基线位置进行分组,确定文本行所在位置信息;根据所述文本行所在位置信息确定各条局部基线,生成局部基线信息集合;根据所述局部基线信息集合对所述二值图像中的粘连区域进行检测、切分,生成粘连区域切分后图像;对所述粘连区域切分后图像进行连通域所属行的分配,生成文本行分配结果;根据所述文本行分配结果对所述粘连区域切分后图像进行文本行的分割,生成行切分后的图像。

全文数据:

权利要求:

百度查询: 西北民族大学 乌金体藏文古籍文档图像的粘连文本行切分方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。