用于兵棋推演的可扩展大规模博弈强化学习方法及装置

导航：龙图腾网> 最新专利技术> 用于兵棋推演的可扩展大规模博弈强化学习方法及装置

申请/专利权人：中国科学院自动化研究所

申请日：2024-04-23

公开（公告）日：2024-07-02

公开（公告）号：CN118278494A

主分类号：G06N3/092

分类号：G06N3/092;G06N3/0455;G06N3/098;G06N5/04

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.07.19#实质审查的生效;2024.07.02#公开

摘要：本发明提供一种用于兵棋推演的可扩展大规模博弈强化学习方法及装置，涉及强化学习技术领域，所述方法包括：构建可扩展的大规模博弈兵棋推演对抗场景；确定强化学习的状态空间、动作空间和奖励构成；基于分组的注意力网络，将联合策略拆分为分组策略，进行博弈对抗中智能体的学习和训练。本发明提供的用于兵棋推演的可扩展大规模博弈强化学习方法及装置，将注意力机制引入多智能体问题中，增强模型在处理长序列观测状态时的学习能力，智能体间的协同关系会通过梯度的优化不断得到强化，最终使得整个协同任务的完成效率达到最大。

主权项：1.一种用于兵棋推演的可扩展大规模博弈强化学习方法，其特征在于，包括：构建可扩展的大规模博弈兵棋推演对抗场景；确定强化学习的状态空间、动作空间和奖励构成；基于分组的注意力网络，将联合策略拆分为分组策略，进行博弈对抗中智能体的学习和训练。

全文数据：

权利要求：

百度查询：中国科学院自动化研究所用于兵棋推演的可扩展大规模博弈强化学习方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：电子连接器及其插头

下一篇：一种植物基复合凝胶及其制备方法

相关技术

电子连接器及其插头

一种植物基复合凝胶及其制备方法

粘合剂组合物和粘合片

一种压电陶瓷材料及其制备方法和应用

富含锂的阴极组成

基于多源信息融合的驾驶员疲劳识别预警方法和系统

设备控制方法、装置、存储介质及电子装置

一种含吡啶季铵盐结构的抗菌聚氨酯发泡材料及其制备与应用

一种裸光纤包层研磨装置及方法

超高耐折二榔皮聚氨酯树脂及其制备方法

一种继电保护器

一种预留洞口精准定位模具及施工方法

博弈相关技术

一种基于模糊威胁判定的高速飞行器博弈变形方法_西北工业大学_202410845944.2

基于非合作博弈理论的离散制造车间生产物流自组织方法_合肥工业大学_202410066793.0

一种基于博弈论的自动驾驶车辆人车交互决策规划方法_重庆大学_202210486625.8

一种基于博弈理论的自组网速率最大化的优化方法及装置_中国人民解放军陆军工程大学_202410491471.0

基于合作博弈的无人机路径规划方法、装置、设备及介质_中国电子信息产业集团有限公司第六研究所_202410865424.8

基于合作博弈论和集成蒸馏的联邦推荐方法、设备及存储介质_浙江工商大学_202410643368.3

基于博弈论的区域防洪与城市排涝标准协同方法和系统_水利部交通运输部国家能源局南京水利科学研究院_202410852605.7

一种基于Markov合作博弈的最优DoS攻击方法_北京京航计算通讯研究所_202410365174.1

基于区块链架构的VPP两阶段博弈交易匹配方法及系统_广西电网有限责任公司电力科学研究院_202410300404.6

基于合作博弈的群系统控制方法、系统及介质_江西科骏实业有限公司_202211448108.8

可扩展相关技术

可扩展方舱及方舱车辆_西安天伟电子系统工程有限公司_202323074661.2

一种便携式可扩展太阳能充电装置_中铁四局集团有限公司_202323131607.7

一种可扩展操作台面的治疗推车_安徽医科大学第一附属医院_202322374637.4

一种空间可扩展的PLC控制柜_中山市沅力智能科技有限公司_202322981847.X

一种外接扩展割草盘_江苏迈步智能装备科技有限公司_202323582906.2

一种支持可扩展类别的文本语义哈希方法、装置、设备及存储介质_山东大学_202410888364.1

一种扩展键盘及其电子装置_东莞美泰电子有限公司_202323189870.1

一种扩展式半导体测试平台_优普士电子(深圳)有限公司_202210680466.5

具有扩展动态范围的图像传感器_半导体元件工业有限责任公司_202410107863.2

基于异物检测的扩展范围定位系统_韦特里西提公司_201980061867.9

强化相关技术

具有强化防尘功能的新能源充电桩_真视通军融科技发展(苏州)有限公司_202420152496.3

一种边管强化的散热器_唐山市金格瑞金属制品有限公司_202323055592.0

一种强化换热型反应釜_无锡吉奥化工机械有限公司_202323303332.0

一种超薄柔性玻璃化学强化生产载具_伯恩创盛技术研发(惠州)有限公司_202323094838.5

基于遗传算法优化的强化学习智能驾驶方法、装置及设备_武汉大学_202410441639.7

一种用于油井生产的井下强化聚合与增压装置_温州大学_202310388587.7

一种极地机场压实雪跑道道面耐磨强化方法_交通运输部公路科学研究所_202410641901.2

基于强化学习的任务调度方法、装置、设备、介质及产品_浪潮通信信息系统有限公司_202410599297.1

一种工业废水的强化生物处理设备_重庆立烨环境工程有限公司_202323184280.X

基于语义强化的无人机视角下人体目标检测方法及系统_齐鲁空天信息研究院_202410873754.1

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

用于兵棋推演的可扩展大规模博弈强化学习方法及装置

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务