首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于稀疏协作图和对手建模的大规模多智能体协作方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国科学技术大学

摘要:本发明涉及智能决策技术领域,公开了一种基于稀疏协作图和对手建模的大规模多智能体协作方法,用于大规模多机器人自主协作任务中以提高团队协作性能,包括:步骤A:初始化网络;步骤B:预训练对手建模网络,对视野范围内的其他智能体进行策略建模;步骤C:生成稀疏协作拓扑图,结合随机探索策略提高图的表示能力;步骤D:通过非线性稀疏协作图更新智能体策略;步骤E:判断是否继续训练。本发明通过智能体对视野范围内其他智能体的策略进行策略建模及通信,以快速适应其他智能体的策略变化,提高智能体间交互效率;并通过非线性稀疏协作图更新智能体策略,以减少通信成本,提高策略控制的效率和可靠性。

主权项:1.一种基于稀疏协作图和对手建模的大规模多智能体协作方法,应用于多机器人、多目标位置的到达任务中,使机器人通过自主协作到达各自的目的地;其特征在于,包括以下步骤:步骤一,初始化网络:对于每个机器人,随机初始化策略网络;策略网络包括特征表示网络、对手建模网络、通信图网络和非线性稀疏协作图网络;初始化迭代次数d=1;步骤二,将由机器人的本地观测和动作构成的经验,输入特征表示网络,获取状态动作表示,再通过对手建模网络获得该机器人关于其他机器人的策略表示的后验分布和选择的动作;预训练每个机器人的特征表示网络和对手建模网络,对视野范围内的其他机器人进行策略建模;步骤三,生成稀疏协作拓扑图,结合通信图网络和随机探索策略提高图的表示能力,获取机器人的潜在建模向量;步骤四,通过非线性稀疏协作图网络更新机器人的策略;步骤五,d=d+1;重复步骤三至步骤四,直至所有机器人达到各自的目的或者达到最大迭代次数。

全文数据:

权利要求:

百度查询: 中国科学技术大学 基于稀疏协作图和对手建模的大规模多智能体协作方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。