买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:小语智能信息科技(云南)有限公司
摘要:本发明涉及基于语言特征表示学习的中老泰多语言神经机器翻译方法及装置,属于自然语言处理技术领域。针对现有的多语言神经机器翻译方法应用在中老泰低资源翻译任务时由于训练语料稀缺导致语义编码欠佳的问题,本发明首先进行模型及数据预处理、基于语言特征表示学习的中老泰多语言神经机器翻译模型训练、基于语言特征表示学习的中老泰多语言神经机器翻译三个部分。根据这三个功能模块化制成基于语言特征表示学习的中老泰多语言神经机器翻译装置。本发明能有效提升中老泰多语言神经机器翻译性能。
主权项:1.基于语言特征表示学习的中老泰多语言神经机器翻译方法,其特征在于:所述方法的具体步骤如下:Step1、数据及模型预处理:获取训练语料并使用获取的语料训练一个翻译方向为泰语→中文和老挝语→中文的多语言神经机器翻译模型;同时,获取该基础模型的子词编码表征,利用获取的子词编码表征并结合泰-老发音相似语言特征,构造同义子词聚类;Step2、基于语言特征表示学习的中老泰多语言神经机器翻译模型训练:提出基于同义子词聚类的对比学习约束优化方法和基于语言特征子词的适配器优化方法,首先利用Step1准备的同义子词聚类构造对比学习正样例以进行对比学习约束优化,然后利用Step1准备的同义子词聚类筛选出语言特征子词以进行适配器优化;Step3、进行中老泰多语言神经机器翻译:将训练的基于语言特征表示学习的中老泰多语言神经机器翻译模型部署为多语言机器翻译系统,实现泰语→中文和老挝语→中文的机器翻译。
全文数据:
权利要求:
百度查询: 小语智能信息科技(云南)有限公司 基于语言特征表示学习的中老泰多语言神经机器翻译方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。