恭喜腾讯科技(深圳)有限公司王伟轩获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜腾讯科技(深圳)有限公司申请的专利一种神经网络模型的训练方法、装置、设备以及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114272611B 。
龙图腾网通过国家知识产权局官网在2025-05-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111242582.0,技术领域涉及:A63F13/67;该发明授权一种神经网络模型的训练方法、装置、设备以及存储介质是由王伟轩;邱福浩;练振杰;王亮;韩国安设计研发完成,并于2021-10-25向国家知识产权局提交的专利申请。
本一种神经网络模型的训练方法、装置、设备以及存储介质在说明书摘要公布了:本申请公开了一种基于人工智能技术实现的神经网络模型训练方法,包括:获取第一时刻的第一全局信息和第一单元信息;基于第一全局信息和第一单元信息,通过行为预测网络获取每个智能体在第一时刻的动作分布;根据第一动作分布获取第二全局信息和第二单元信息;根据第一全局信息、第一单元信息、第二全局信息和第二单元信息确定奖励信息;基于全局信息和单元信息,通过价值网络获取目标自身价值和目标团队价值;根据动作分布、奖励信息、目标自身价值和目标团队价值对网络做训练。本申请还提供了装置。本申请鼓励同一个阵营下的智能体执行能够使得自身价值和团队价值最大化的动作,从而使得团队的联合动作更优,达到更高的智能体模拟水平。
本发明授权一种神经网络模型的训练方法、装置、设备以及存储介质在权利要求书中公布了:1.一种神经网络模型的训练方法,其特征在于,包括:获取第一时刻所对应的第一全局信息以及第一单元信息,其中,所述第一全局信息用于描述阵营在所述第一时刻的对局情况,所述第一单元信息用于描述交互单元在所述第一时刻的状态,所述交互单元表示在游戏用于中与游戏角色具有交互关系的对象;所述第一全局信息包括所述第一时刻所对应的全局地图信息以及阵营对抗信息中的至少一种;所述第一单元信息包括所述第一时刻所对应的游戏角色信息、非玩家角色NPC信息以及防御塔信息中的至少一种;基于所述第一全局信息以及所述第一单元信息,通过行为预测网络获取K个智能体中每个智能体在所述第一时刻的动作分布,其中,所述K个智能体属于同一阵营,所述智能体为由人工智能控制的游戏角色,所述K为大于1的整数;根据所述每个智能体的所述动作分布,获取第二时刻的第二全局信息以及第二单元信息,其中,所述第二时刻为所述第一时刻的下一时刻,所述第二全局信息用于描述阵营在所述第二时刻的对局情况,所述第二单元信息用于描述交互单元在所述第二时刻的状态;根据所述第一全局信息、所述第一单元信息、所述第二全局信息以及所述第二单元信息,确定所述每个智能体的奖励信息,其中,所述奖励信息为触发动作后所获得的激励;所述奖励信息包括稠密激励因子、稀疏激励因子、生存激励因子、防御塔激励因子和对局激励因子;基于所述第一全局信息、所述第一单元信息、所述第二全局信息以及所述第二单元信息,通过价值网络获取所述每个智能体的目标自身价值以及目标团队价值,其中,所述目标团队价值表示智能体在阵营中的价值;根据所述每个智能体的所述动作分布、所述奖励信息、所述目标自身价值以及所述目标团队价值,对所述行为预测网络以及所述价值网络进行训练。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人腾讯科技(深圳)有限公司,其通讯地址为:518057 广东省深圳市南山区高新区科技中一路腾讯大厦35层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。