买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:广东五度空间科技有限公司
摘要:本发明公开了一种档案数字化扫描处理方法及系统,方法包括:获取扫描后的待处理档案纸质页面;将待处理档案纸质页面输入到多通道档案处理模型,以使多通道档案处理模型提取待处理档案纸质页面的特征数据,根据所述特征数据输出待处理纸质页面对应的数字化页面;多通道档案处理模型的构建包括:获取纸质页面样本集合,对分类器进行训练,直至收敛时,固定分类器的网络参数;根据各纸质页面样本的特征数据将各纸质页面样本输入到多通道处理器对应的特征通道中,输出各特征通道下的待融合数字化页面;将待融合数字化页面进行特征融合和决策,得到对应的数字化页面;在各纸质页面样本子集的数字化页面满足收敛条件时,生成多通道档案处理模型。
主权项:1.一种档案数字化扫描处理方法,其特征在于,包括:获取扫描后的待处理档案纸质页面;将所述待处理档案纸质页面输入到多通道档案处理模型,以使所述多通道档案处理模型提取待处理档案纸质页面的特征数据,根据所述特征数据输出待处理纸质页面对应的数字化页面;其中,所述特征数据包括:文本倾斜角度、文本光线和文本模糊;其中,所述多通道档案处理模型的构建包括:构建初始多通道档案处理模型;所述初始多通道档案处理模型包括分类器和多通道处理器;获取纸质页面样本集合;其中,所述纸质页面样本集合包括若干纸质页面样本子集;每一纸质页面样本子集中若干纸质页面样本对应同一纸质页面;每一纸质页面样本子集包括:在不同光线下、不同倾斜角度下以及不同模糊程度下的若干纸质页面样本;以纸质页面样本集合对所述分类器进行训练,直至达到第一预设收敛条件时,固定所述分类器的网络参数;在每一纸质页面样本对应的纸质页面样本子集训练过程中,将纸质页面样本子集输入到所述分类器中,以使所述分类器提取纸质页面样本子集中各纸质页面样本的特征数据;根据各纸质页面样本的特征数据将各纸质页面样本输入到多通道处理器对应的特征通道中,使各特征通道提取纸质页面样本的文本特征,输出各特征通道下的待融合数字化页面;将各所述待融合数字化页面进行特征融合,得到若干特征组合下的待决策数字化页面;根据各特征组合下的待决策数字化页面确定纸质页面样本子集所对应的数字化页面;在各纸质页面样本子集的数字化页面满足第二预设收敛条件时,生成多通道档案处理模型。
全文数据:
权利要求:
百度查询: 广东五度空间科技有限公司 一种档案数字化扫描处理方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。