买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:苏州大学
摘要:本发明涉及一种非自回归机器翻译系统、方法和电子设备,系统包括:对源序列X依次进行序列化和编码,得到编码序列;以序列化后的源序列X为基准,对所述编码序列进行解码,得到带有噪声的序列Ypot;对所述带有噪声的序列Ypot中的错误信息进行掩码,得到掩码序列;将所述编码序列作为注意力机制,对所述掩码序列中被掩码的错误信息进行预测,得到预测结果;将所述预测结果与所述带有噪声的序列Ypot中未被掩码的信息进行组合,得到翻译结果。本发明能够对待翻译的文本进行有效翻译,且翻译效率较高。
主权项:1.一种非自回归机器翻译系统,其特征在于:包括:编码器模块:用于对源序列X依次进行序列化和编码,得到编码序列;解码模块:用于以序列化后的源序列X为基准,对所述编码序列进行解码,得到带有噪声的序列Ypot;掩码模块:用于对所述带有噪声的序列Ypot中的错误信息进行掩码,得到掩码序列;预测模块:用于将所述编码序列作为注意力机制,对所述掩码序列中被掩码的错误信息进行预测,得到预测结果;组合模块:用于将所述预测结果与所述带有噪声的序列Ypot中未被掩码的信息进行组合,得到翻译结果;所述掩码模块还包括查找模块,所述查找模块用于在推理时对所述带有噪声的序列Ypot中的错误信息进行掩码时,查找错误信息的位置;所述查找模块中的查找错误信息的位置采用的方法包括阈值方法和公式方法;所述阈值方法包括:获取所述带有噪声的序列Ypot中每个标识的置信度;将每个标识的置信度与第一预设阈值α1进行对比,若标识高于第一预设阈值α1,则将标识作为正确信息;若标识低于第一预设阈值α1,则将标识作为错误信息;所述公式方法满足: 其中,meanconfidence表示对当前生成句子中所有标识的置信度取平均,α2为第二预设阈值,当meanconfidence>α2时,scale设置为α2,并将当前生成句子中置信度小于α2的标识作为错误信息;当meanconfidence≤α2时,scale设置为平均置信度值meanconfidence,并将当前生成句子中置信度小于meanconfidence的标识作为错误信息。
全文数据:
权利要求:
百度查询: 苏州大学 一种非自回归机器翻译系统、方法和电子设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。