首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于CNN的扫描文档图像增强方法 

申请/专利权人:广东电网有限责任公司广州供电局

申请日:2021-02-05

公开(公告)日:2024-06-28

公开(公告)号:CN112819724B

主分类号:G06V30/16

分类号:G06V30/16;G06T5/60;G06N3/096;G06N3/0895;G06N3/0464

优先权:

专利状态码:有效-授权

法律状态:2024.06.28#授权;2021.06.04#实质审查的生效;2021.05.18#公开

摘要:一种基于CNN的扫描文档图像增强方法。本发明公开了一种用于通过扫描或拍照等形式重采样的文档图像的增强方法,包括深度学习模型提出、训练样本生成、训练方法设计、数据预处理。本发明适用于解决传统纸质文档数字化过程中产生的图像退化问题,能够提升文档的主观清晰度和字符可辨认度,并提升光学字符识别OCR的准确率。本发明基于卷积神经网络模型,采用组合随机退化模型生成自建小样本数据集对模型进行训练,模型通过特征提取、特征映射和图像重构,实现图像在主观视觉感受上的清晰度改善,以及字符检测率、辨识率的提升。本发明提出的模型兼顾了图像增强能力、模型复杂度、训练难度和泛化能力,可以满足工业实时处理任务,并可通过小规模迁移学习方法扩展模型的适用领域。

主权项:1.一种基于CNN的扫描文档图像增强方法,其特征在于,包括如下步骤:步骤1,对groundtruth进行颜色空间转换和归一化处理,然后结合退化模型获取退化图像;步骤1中结合退化模型获取退化图像的具体实现方式如下;通过组合随机加权的方法随机生成退化模型,利用颜色转换并归一化后的groundtruth和随机退化生成模型,获得用于模型训练的退化图像,退化图像生成过程如下式所示:Zx=αBx+βGθx+γx3其中,Zx为组合随机退化方法生成的退化样本;Bx为bicubic方法退化图像;Gθx为使用核大小为θ的高斯模糊处理获得的字迹模糊退化图像;x为groundtruth,α、β、γ为加权系数,且满足α+β+γ=1;步骤2,构建深度学习模型;所述深度学习模型由特征提取模块、特征非线性映射模块和图像重建模块构成,其中,特征提取模块由多个卷积层构成,卷积核均为3×3,特征非线性映射模块由一个1×1卷积层构成,图像重建模块由两个3×3卷积层构成;步骤3,对退化图像与groundtruth进行子图像划分处理,形成训练图像对;步骤4,利用训练图像对训练深度学习模型;步骤5,将待处理图像输入到训练好的深度学习模型中,得到增强后的扫描文本图像。

全文数据:

权利要求:

百度查询: 广东电网有限责任公司广州供电局 一种基于CNN的扫描文档图像增强方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。