首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于纸质图书阅览电子化后的图像前处理方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京蓝湾博阅科技有限公司

摘要:本发明公开了一种基于纸质图书阅览电子化后的图像前处理方法及系统,首先通过预设的图像校正模板,确定哪些初始图像需要进行校正操作,然后通过待校正图像中的各个像素点的属性信息通过霍夫变换、贝叶斯定理等计算分析得到待校正图像的倾斜角度,通过计算待校正图像的倾斜角度;然后针对该倾斜角度对待校正图像进行校正操作从而得到校正后的图像,最后对校正后的图像进行优化处理得到优化后的图像,对校正后的图像进行进一步优化处理以确保最终得到的图像质量更高;能够高效地识别和校正文档扫描图像中的倾斜角度并进行校正操作,提高了文档扫描处理的效率和准确性。

主权项:1.一种基于纸质图书阅览电子化后的图像前处理方法,其特征在于,包括如下操作步骤:获取多个初始图像;所述初始图像是文本扫描图像;根据预设的图像校正模板确定所有所述初始图像中的待校正图像;根据所述待校正图像内的图像信号中的各像素点的属性信息计算获取所述待校正图像对应的倾斜角度;根据所述倾斜角度对所述待校正图像进行校正操作,得到校正后的图像;对所述校正后的图像进行优化处理,得到优化后的图像;所述像素点的属性信息包括像素点的亮度信息、像素点的坐标信息;所述图像信号包括所述待校正图像中的所有像素点及各像素点的属性信息;所述根据所述待校正图像内的图像信号中的各像素点的属性信息计算获取所述待校正图像对应的倾斜角度,包括如下操作步骤:遍历所有所述待校正图像,对所述待校正图像进行灰度化处理,得到灰度图像;对所述灰度图像进行边缘检测,获取所述灰度图像对应的文本图像;对所述文本图像进行直线检测,获取多条直线;根据各个所述直线对应的字符信息进行筛选得到目标直线;根据所述目标直线对应的斜率计算获取所述待校正图像对应的倾斜角度;所述倾斜角度的计算方式为:倾斜角度=arctan目标直线的斜率;所述字符信息包括字符坐标信息和字符本体信息;所述根据各个所述直线对应的字符信息进行筛选得到目标直线,包括如下操作步骤:将各条所述直线对应的字符本体信息根据各字符本体信息对应的字符坐标信息进行排序,得到当前直线的字符序列集;遍历各个所述字符序列集,获取所述字符序列集对应的字符本体形成的语句信息及多个相邻字符组成的字符组;将所述字符组通过二进制编码得到第一编码;建立语料库;所述语料库包括多个字符、两个或多个字符互相组成的词汇以及各个词汇对应的第二编码;根据所述第一编码与所述第二编码的对比结果筛选获取目标直线;所述根据所述第一编码与所述第二编码的对比结果筛选获取目标直线,包括如下操作步骤:获取各个直线上对应的字符组的个数n以及各直线上对比成功结果的个数m;根据所述字符组的个数n及所述对比成功结果的个数m计算获取各直线上字符组对比成功结果的第一概率E;所述直线上字符组对比成功结果的第一概率E的计算方式为:;根据所述第一概率E获取各个所述直线属于目标直线的第二概率R;根据所述字符组对比成功结果的第一概率E及所述第二概率R计算获取各个所述直线属于目标直线的第三概率T;所述第三概率T的计算方式为:;将所述第三概率T进行排序得到第三概率序列集;选择所述第三概率序列集中排序靠前的i个概率对应的直线并确定为待选目标直线,判断所述待选目标直线处于平行状态的个数是否大于预设的平行判断阈值,若是,则确定所述待选目标直线中处于平行状态的直线为目标直线。

全文数据:

权利要求:

百度查询: 北京蓝湾博阅科技有限公司 一种基于纸质图书阅览电子化后的图像前处理方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。