恭喜内蒙古工业大学吉亚图获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜内蒙古工业大学申请的专利一种基于多约束项的蒙汉神经机器翻译方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114818743B 。
龙图腾网通过国家知识产权局官网在2025-05-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210277518.4,技术领域涉及:G06F40/58;该发明授权一种基于多约束项的蒙汉神经机器翻译方法是由吉亚图;李佳根;巴音图;师磊;樊静;苏依拉;仁庆道尔吉设计研发完成,并于2022-03-21向国家知识产权局提交的专利申请。
本一种基于多约束项的蒙汉神经机器翻译方法在说明书摘要公布了:一种基于多约束项的蒙汉神经机器翻译方法,首先针对蒙汉神经机器翻译任务构建基于强化学习的模型训练过程,然后在强化模型基础上针对训练的优化目标进一步改进约束条件,包括:添加语义约束模块以缓解单一的BLEU值评价体系带来的译文流利度差的问题;针对训练过程进行参数约束以提升模型训练的效率;对语料进行词表约束以减少译文中未登录词的数量。本发明通过调节整体约束方式,减轻低资源蒙汉机器翻译任务中模型对序列结构分析能力差和训练效率低的问题,同时对于强化训练带来的方差较大问题,本发明采取均值奖励和剪枝柱搜索的方法有效地缓解以上强化训练带来的负面影响。
本发明授权一种基于多约束项的蒙汉神经机器翻译方法在权利要求书中公布了:1.一种基于多约束项的蒙汉神经机器翻译方法,其特征在于,包括如下步骤:步骤1,在以BLEU值为训练优化目标的基础上,加入约束条件,构建基于强化学习的蒙汉神经机器翻译模型,所述约束条件包括:1语义约束,以缓解单一的BLEU值评价体系带来的译文流利度差的问题;所述语义约束通过标准译文与预测输出进行比较参与每次迭代中的奖励计算,作为共同奖励Reward的一部分,语义约束奖励Rsem通过计算两个句子中元素向量e′和e之间的向量余弦夹角seme′,e得到序列级回报奖励;2参数约束,以提升模型训练的效率;所述参数约束是指在模型训练期间,每一轮迭代的损失计算后利用梯度映射将当前训练迭代映射到问题的执行范围,然后执行当前的梯度下降计算完成误差传递;在蒙汉机器翻译中,使用软函数约束对目标函数及逆行惩罚系数改进,起到向量归一化作用,即:Min:Rx+λcx2其中Rx和cx分别为目标函数和惩罚函数,通过梯度映射方法轮流求解Rx和cx,最终实现损失函数的最小解,λ表示惩罚系数;3对语料的词表约束,以减少译文中未登录词的数量;所述词表约束,是指在将语料做向量表征训练时,将词表中词频低于3的低频词均用原词或固定词替代,同时在解码过程中,对原词进行Beamsearch柱搜索时对构建的候选序列进行裁剪,将含低频词大于设定值和概率最后5次序的序列裁剪;步骤2,对构建的翻译模型进行训练,训练策略包括交叉熵训练、强化训练以及两种训练的动态融入。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人内蒙古工业大学,其通讯地址为:010080 内蒙古自治区呼和浩特市土默特左旗内蒙古工业大学金川校区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。