买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:网易(杭州)网络有限公司
摘要:本发明提供了一种文本生成模型的训练方法、文本生成方法及装置,涉及自然语言处理技术领域,包括:根据预设语料库构建文本数据集;对所述文本数据集中的每个目标文本数据提取关键词,得到训练关键词集合;根据所述训练关键词集合对基于多头注意力机制的深度模型进行训练,得到文本生成模型。本发明可以有效改善现有技术中词造句功能多样化受限的问题,从而提高用户体验。
主权项:1.一种文本生成模型的训练方法,其特征在于,包括:根据预设语料库构建文本数据集;对所述文本数据集中的每个目标文本数据提取关键词,得到训练关键词集合;根据所述训练关键词集合对基于多头注意力机制的深度模型进行训练,得到文本生成模型;所述基于多头注意力机制的深度模型包括第一GPT-2语言模型,所述根据所述训练关键词集合对基于多头注意力机制的深度模型进行训练,得到文本生成模型的步骤,包括:对于文本数据集中的每个目标文本数据,按照第一预设格式对该目标文本数据和该目标文本数据所包含的关键词进行拼接,得到该目标文本数据对应的第一输入数据;通过第一GPT-2语言模型基于该目标文本数据对应的第一输入数据,生成该目标文本数据对应的预测文本数据;基于该目标文本数据和该目标文本数据对应的预测文本数据修改第一GPT-2语言模型的参数,得到文本生成模型;所述通过第一GPT-2语言模型基于该目标文本数据对应的第一输入数据,生成该目标文本数据对应的预测文本数据的步骤,包括:对所述第一输入数据进行分割处理得到多个词向量,将各个所述词向量依次输入至所述第一GPT-2语言模型,所述第一GPT-2语言模型根据给定的前t个时间步的词向量,预测下一个时间步的词向量的概率,直至生成预测文本数据。
全文数据:
权利要求:
百度查询: 网易(杭州)网络有限公司 文本生成模型的训练方法、文本生成方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。