买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:杭州电子科技大学
申请日:2024-08-21
公开(公告)日:2024-09-17
公开(公告)号:CN118658170A
专利技术分类:..使用电子方式识别[2022.01]
专利摘要:本发明涉及汉字识别技术领域,具体公开了一种基于多维表示的汉字识别方法,该方法引入空间信息到字符特征序列中,拓展了字符特征序列的信息丰富度,不仅能够捕获关键笔形的一维顺序关系还能捕获二维空间位置关系,实现使用较少关键特征独立识别汉字。在后续步骤中,其结合多任务网络和自注意力机制提取字符、字根和关键笔形等多层次特征,通过前馈神经网络优化特征的丰富度和准确性,有效提升特征提取能力,解决了复杂场景汉字特征提取困难问题。最后,通过汉字特征相似度算法去除多维特征中的噪声,融合多维特征并提升关键特征的优先级,从而增强了模型在复杂场景下的汉字识别能力。本发明可以有效地提升复杂场景汉字识别效果。
专利权项:1.一种基于多维表示的汉字识别方法,其特征在于:包括如下步骤:步骤1、获取汉字识别文本数据集、输入图像和标签文本S;步骤2、对于输入图像,先对图像进行预处理操作,调整图像的高宽比,并完成图像插值操作,基于ResNet-50模型为提取图像中的字符特征,得到初步共享特征Z;步骤3、引入输入图像对应的标签文本S,同时以词嵌入的形式将标签文本S转换为相应的字符嵌入,得到嵌入特征;步骤4、设计多维特征识别任务,将初步共享特征Z输入到由Transformer编码器组成字符解码器中,将文本输入解码器层和注意力层,得到输出结果R和注意力矩阵,并将得到的结果R解码成相应的字符序列Rc;步骤5、对提取的共享特征Z进一步处理,得到字符级别的细粒度特征,并将嵌入特征通过相应的字典映射成相应的字根嵌入序列和关键笔形嵌入序列;步骤6、将步骤5中的得到的字符级别的细粒度特征解码成相应的字根序列和关键笔形序列;步骤7、通过汉字特征相似度算法去除多维特征中的噪声,所述多维特征包括字符、字根和关键笔形,进而融合多个维度特征,并提升关键特征的优先级;步骤8、对步骤5和步骤6中的多维特征提取网络计算损失,得到相应的损失总数,用于后续的模型训练提升。
百度查询: 杭州电子科技大学 一种基于多维表示的汉字识别方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。