应用于角色扮演推理类游戏的大语言模型的训练方法

导航：龙图腾网> 最新专利技术> 应用于角色扮演推理类游戏的大语言模型的训练方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：深圳须弥云图空间科技有限公司

摘要：本申请涉及虚拟游戏技术领域，提供了一种应用于角色扮演推理类游戏的大语言模型的训练方法。该方法包括：获取目标游戏的训练数据，并生成进行上下文字级别训练的第一自回归语言任务和进行上下文句级别训练的第二自回归语言任务，其中，目标游戏为角色扮演推理类；依据第一自回归语言任务，利用训练数据对大语言模型进行上下文字级别训练；依据第二自回归语言任务，利用训练数据对上下文字级别训练后的大语言模型进行上下文句级别训练；利用上下文字级别训练后的大语言模型在目标游戏为各个用户提供服务，收集各个用户对大语言模型提供服务的反馈，依据各个用户对大语言模型提供服务的反馈对大语言模型进行强化学习训练。

主权项：1.一种应用于角色扮演推理类游戏的大语言模型的训练方法，其特征在于，包括：获取目标游戏的训练数据，并生成进行上下文字级别训练的第一自回归语言任务和进行上下文句级别训练的第二自回归语言任务，其中，所述目标游戏为角色扮演推理类，所述目标游戏的训练数据包括目标游戏的背景数据、用户之间的交互数据和目标游戏的剧情数据；依据第一自回归语言任务，利用所述训练数据对大语言模型进行上下文字级别训练；依据第二自回归语言任务，利用所述训练数据对上下文字级别训练后的大语言模型进行上下文句级别训练；利用上下文句级别训练后的大语言模型在所述目标游戏为各个用户提供服务，收集各个用户对所述上下文句级别训练后的大语言模型提供服务的反馈，依据各个用户对所述上下文句级别训练后的大语言模型提供服务的反馈对所述上下文句级别训练后的大语言模型进行强化学习训练；依据第一自回归语言任务，利用所述训练数据对大语言模型进行上下文字级别训练，包括：将所述训练数据中的每个字输入所述大语言模型，利用所述大语言模型预测每个字的下一个字的方式对所述大语言模型进行训练；将所述训练数据中的多个连续的字输入所述大语言模型，利用所述大语言模型预测多个连续的字的下一个字的方式对所述大语言模型进行训练；其中，所述上下文字级别训练为有监督学习训练；依据第二自回归语言任务，利用所述训练数据对上下文字级别训练后的大语言模型进行上下文句级别训练，包括：将所述训练数据中的每个句子输入所述上下文字级别训练后的大语言模型，利用所述上下文字级别训练后的大语言模型预测每个句子的下一个句子的方式对所述上下文字级别训练后的大语言模型进行训练；将所述训练数据中的多个连续的句子输入所述上下文字级别训练后的大语言模型，利用所述上下文字级别训练后的大语言模型预测多个连续的句子的下一个句子的方式对所述上下文字级别训练后的大语言模型进行训练；其中，所述上下文句级别训练为有监督学习训练；或者，依据第二自回归语言任务，利用所述训练数据对上下文字级别训练后的大语言模型进行上下文句级别训练，包括：将所述训练数据中的数据按照交互语义的主题进行划分，得到多个交互回合，每个交互回合对应一个主题，其中，每个交互回合包括N条数据，第i条数据和第i+1条数据互为相似句，N为奇数，第N条数据没有其对应的相似句，i为开区间（0，N）内的奇数，i+1小于N；将多个交互回合依次输入所述上下文字级别训练后的大语言模型，利用所述上下文字级别训练后的大语言模型预测每个交互回合中第N条数据对应的相似句的方式对所述上下文字级别训练后的大语言模型进行训练；其中，所述上下文句级别训练为有监督学习训练；所述方法还包括：生成常识问答任务、文案生成任务、翻译任务、自动摘要任务、文本分类任务和对话任务；依据所述第二自回归语言任务，利用所述训练数据对上下文字级别训练后的大语言模型进行上下文句级别训练的过程中，将所述常识问答任务、所述文案生成任务、所述翻译任务、所述自动摘要任务、所述文本分类任务和所述对话任务作为所述第二自回归语言任务的辅助任务对所述上下文字级别训练后的大语言模型进行相应的训练。

全文数据：

权利要求：

百度查询：深圳须弥云图空间科技有限公司应用于角色扮演推理类游戏的大语言模型的训练方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种基于三嗪共价有机框架材料的制备及用途

下一篇：一种高直流叠加特性低损耗复合磁粉心的制备方法

相关技术

一种基于三嗪共价有机框架材料的制备及用途

一种高直流叠加特性低损耗复合磁粉心的制备方法

钢制防火门的焊接装置

一种家具耐用性综合测试平台及其测试方法

一种基于固体废物的晶须增强免烧多孔陶瓷及其制备方法

一种不等厚火山口玻璃后盖周抛方法

一种基于突变适配体的快速检测食品中残留甲硝唑的方法

一种变电站无人机巡视路径规划方法及系统

一种批量热浸镀锌铝镁浸镀前两步式活化助镀处理方法

一种页面构建方法和系统

一种超声波诊断检查防护装置

一种新能源汽车语音功能测试方法、系统及设备

游戏相关技术

实现小游戏加载游戏资源的方法及相关装置_腾讯科技(深圳)有限公司_202410758498.1

气压式速推游戏机_陈伟钿_202420225067.4

多人游戏中的远程对象的改进瞄准_拳头游戏公司_202410702589.3

一种游戏卡纸的生产方法_玖龙纸业(东莞)有限公司_202410890611.1

游戏中的交互方法、装置及电子设备_网易(杭州)网络有限公司_202410636761.X

一种旋钮互动灯的游戏机_中山市聿达景观工程有限公司_202323369250.6

游戏角色的控制方法、装置及电子设备_网易(杭州)网络有限公司_202010963043.5

游戏组队方法、装置、设备及存储介质_腾讯科技(成都)有限公司_202310219198.1

控制虚拟游戏角色的方法及装置_网易(杭州)网络有限公司_202410659048.7

游戏登录方法、装置和电子设备_网易(杭州)网络有限公司_202011219524.1

推理相关技术

机器学习装置、数据处理系统、推理装置以及机器学习方法_金子产业株式会社_202180021503.5

一种基于逻辑偏好融合推理的物品推荐方法_江苏亿友慧云软件股份有限公司_202411090315.X

一种基于并行解码的大语言模型高效推理方法及系统_山东浪潮科学研究院有限公司_202411102651.1

一种推理任务调度方法、装置、电子设备及存储介质_北京升哲科技有限公司_202410809316.9

基于自适应神经模糊推理居家肺癌患者护理方案生成方法_江苏省肿瘤医院_202410712317.1

一种基于生成对抗网络的联邦学习图像推理攻击方法_南京邮电大学_202410707161.8

基于层次化序列结构推理的数据协议解析方法及装置_国网江苏省电力有限公司盐城供电分公司_202410846314.7

一种SysML模型知识图谱语义关系推理方法和装置_浙江工业大学_202411099819.8

一种基于远程过程调用的模型推理方法及芯片_北京芯驰半导体科技股份有限公司_202410748658.4

一种基于推理决策一致性的自动驾驶规划方法_中山大学_202411053899.3

语言相关技术

大语言模型和小语言模型协同的民生诉求事件分拨方法_中电万维信息技术有限责任公司_202410774675.5

一种从SIMSCRIPT语言到C语言的语法映射方法和装置_中国科学院软件研究所_202310980321.1

基于大语言模型改写查询文本的方法_浙江飞猪网络技术有限公司_202411097598.0

一种智能语言控制器构造_山东升泓电力科技有限公司_202323361976.5

Matlab语言的Modelica仿真组件生成方法_三峡大学_202210365973.X

自然语言查询方法及装置_浙江口碑网络技术有限公司_202410746085.1

一种保护R语言源代码的方法和装置_北京青萌数海科技有限公司_202310467101.9

一种基于并行解码的大语言模型高效推理方法及系统_山东浪潮科学研究院有限公司_202411102651.1

一种基于大语言模型token的文本通用程度评分方法_中电万维信息技术有限责任公司_202410774677.4

大语言模型的微调方法、资源推荐方法、装置和设备_百度时代网络技术(北京)有限公司_202410736454.9

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

应用于角色扮演推理类游戏的大语言模型的训练方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务