首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

机器翻译模型的训练方法、机器翻译方法、装置及设备 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京交通大学

摘要:本申请公开了一种机器翻译模型的训练方法、机器翻译方法、装置及设备,属于计算机技术领域,该方法包括:获取训练样本集,训练样本集包括训练样本及该训练样本对应的标准翻译文本;将训练样本及训练样本对应的标准翻译文本输入机器翻译模型中,获取机器翻译模型在反向传播过程中产生的梯度向量;基于梯度向量和多个噪音词为训练样本生成对抗样本;基于训练样本和对抗样本对机器翻译模型进行对抗训练,得到目标机器翻译模型。该训练方法生成的对抗样本对机器翻译模型攻击性较大,并且增加了训练数据的多样性,由此提高了机器翻译模型的鲁棒性,进而提高了机器翻译模型的翻译性能,使得通过机器翻译模型得到的翻译结果更加准确。

主权项:1.一种机器翻译模型的训练方法,其特征在于,所述方法包括:获取训练样本集,所述训练样本集包括训练样本及所述训练样本对应的标准翻译文本;将所述训练样本及所述训练样本对应的标准翻译文本输入机器翻译模型中,获取所述机器翻译模型在反向传播过程中产生的梯度向量;对所述训练样本进行采样,根据采样结果得到目标词向量,所述目标词向量为需要被替换的词向量;从多个噪音词的向量空间中获取所述目标词向量对应的至少一个候选词向量,所述多个噪音词包括多对同音词或似音词;从所述梯度向量中获取所述目标词向量对应的目标梯度向量;沿所述目标梯度向量的方向更新所述目标词向量,得到更新词向量;从所述至少一个候选词向量中,选择与所述更新词向量距离最大的候选词向量作为目标候选词向量;将所述训练样本中的所述目标词向量替换为所述目标候选词向量,得到对抗样本;基于所述训练样本和所述对抗样本对所述机器翻译模型进行对抗训练,得到目标机器翻译模型。

全文数据:

权利要求:

百度查询: 北京交通大学 机器翻译模型的训练方法、机器翻译方法、装置及设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。