恭喜清华大学深圳国际研究生院何友获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜清华大学深圳国际研究生院申请的专利多机器人博弈仿真方法、仿真平台、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119227814B 。
龙图腾网通过国家知识产权局官网在2025-03-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411731916.4,技术领域涉及:G06N5/04;该发明授权多机器人博弈仿真方法、仿真平台、电子设备及存储介质是由何友;刘瑜;柯宇新;李劭辉;李徵;姜智卓;李耀文设计研发完成,并于2024-11-29向国家知识产权局提交的专利申请。
本多机器人博弈仿真方法、仿真平台、电子设备及存储介质在说明书摘要公布了:本发明提供一种多机器人博弈仿真方法、仿真平台、电子设备及存储介质,属于人工智能技术领域,方法包括运行至少一环境实例,各环境实例中设有至少一己方机器人以及至少一对手机器人;在当前训练轮中,确定各环境实例共享的训练策略以及与各对手机器人对应的对手策略,将训练策略对应的第一控制指令发送至己方机器人并将对手策略对应的第二控制指令发送至对手机器人,以便己方机器人和对手机器人在环境实例中执行博弈任务。本发明在各环境实例中为己方机器人配置对手机器人,提高对抗训练经验多样性,实现对环境实例的充分探索,且各环境实例中的对手机器人均根据对手策略与共享策略的己方机器人进行对抗博弈,有助于制定更加稳健和通用的策略。
本发明授权多机器人博弈仿真方法、仿真平台、电子设备及存储介质在权利要求书中公布了:1.一种多机器人博弈仿真方法,其特征在于,使用GPU加速的仿真后端,在GPU上直接执行物理仿真,将观测、奖励和动作所有的训练数据留在GPU中,通过PyTorch张量支持的API,直接在GPU上获取仿真结果,实现端到端的GPU加速训练管道,包括:运行至少一环境实例,各所述环境实例中设有至少一己方机器人以及至少一对手机器人;在当前训练轮中,确定各所述环境实例共享的训练策略以及与各所述对手机器人对应的对手策略,将所述训练策略对应的第一控制指令发送至所述己方机器人并将所述对手策略对应的第二控制指令发送至所述对手机器人,以便所述己方机器人和所述对手机器人在所述环境实例中执行博弈任务;训练策略用于表征控制己方机器人在环境实例内移动并向对手机器人发起攻击的策略,对手策略用于表征控制对手机器人在环境实例内移动并向己方机器人发起攻击的策略;训练时并行运行多个环境实例,训练策略由所有环境实例共享,每个环境实例中对手机器人的对手策略不同。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人清华大学深圳国际研究生院,其通讯地址为:518055 广东省深圳市南山区西丽街道深圳大学城清华校区A栋二楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。