首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

协作多无人系统贡献评估与决策方法、产品、介质及设备 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:上海大学

摘要:本发明公开一种协作多无人系统贡献评估与决策方法、产品、介质及设备,涉及协作多智能体强化学习领域,方法包括:基于每个无人系统的状态价值和优势动作价值,计算全局状态价值和优势动作价值,进而计算联合动作价值;利用联合动作价值和每个无人系统的动作价值分布,计算所有无人系统的联合动作价值分布;基于残差映射权重矩阵修正后的所有无人系统的联合动作价值分布以及每个无人系统的动作价值,对无人系统策略网络进行训练和优化;利用优化后的该网络进行决策。本发明能在面对复杂的、非单调的任务时,准确评估不同无人系统在团队奖励中的贡献占比,激励无人系统朝着最优协作策略前进,从而完成团队贡献度的合理分配。

主权项:1.一种协作多无人系统贡献评估与决策方法,其特征在于,包括:基于每个无人系统的局部观测信息和历史动作,计算每个无人系统的动作价值分布和动作价值;基于每个无人系统的所述动作价值,计算每个无人系统的状态价值和优势动作价值;基于每个无人系统的所述状态价值和所述优势动作价值,联合所有无人系统的局部观测信息,计算每个无人系统的全局状态价值和全局优势动作价值;利用每个无人系统的所述全局状态价值和所述全局优势动作价值,计算联合动作价值;利用所述联合动作价值和每个无人系统的所述动作价值分布,计算所有无人系统的联合动作价值分布;基于所有无人系统的联合观测信息和所有无人系统的动作,计算残差映射权重矩阵;所有无人系统的联合观测信息是联合所有无人系统的局部观测信息得到的;基于所述残差映射权重矩阵,对所有无人系统的联合动作价值分布进行修正,得到修正后的所有无人系统的联合动作价值分布;基于每个无人系统的所述动作价值以及修正后的所有无人系统的联合动作价值分布,对无人系统策略网络进行训练和优化,得到优化后的无人系统策略网络;利用所述优化后的无人系统策略网络进行决策。

全文数据:

权利要求:

百度查询: 上海大学 协作多无人系统贡献评估与决策方法、产品、介质及设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术