一种面向对抗博弈的大语言模型多智能体协同决策方法

导航：龙图腾网> 最新专利技术> 一种面向对抗博弈的大语言模型多智能体协同决策方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：南京航空航天大学

摘要：本发明公开了一种面向对抗博弈的大语言模型多智能体协同决策方法，包括：构建对抗博弈环境协同决策大语言模型的微调训练数据集；基于LoRA方法微调对抗博弈环境协同决策大语言模型；构建记忆模块，存储智能体的历史博弈数据与其对博弈的理解；从对抗博弈环境中获取智能体的局部观察数据和共享全局状态信息，组合信息作为模型输入；将组合信息输入经微调的大语言模型，分析对抗博弈局势；根据上述的局势分析和记忆模块提供的信息，生成本回合的行动决策；根据行动决策生成可执行的动作；执行动作，更新记忆模块，进入下一回合。本发明方法可有效提高智能体在对抗博弈环境下进行协同决策的能力，为解决复杂系统中的协作与对抗博弈问题提供了创新的方法。

主权项：1.一种面向对抗博弈的大语言模型多智能体协同决策方法，其特征在于，所述方法包括以下步骤：步骤1，构建对抗博弈环境协同决策大语言模型的微调训练数据集；步骤2，基于所述微调训练数据集，利用LoRA方法微调对抗博弈环境协同决策大语言模型；步骤3，构建记忆模块，并设定其更新机制，存储智能体的历史博弈数据与其对博弈的理解；步骤4，从对抗博弈环境中获取智能体的初始局部观察数据，并从共享消息池中获取后续决策所需的全局状态信息，将多源信息进行组合，作为此后的模型输入数据；步骤5，将步骤2微调后的对抗博弈环境协同决策大语言模型作为对抗博弈环境多智能体协同决策的推理模型，将步骤4获取的组合信息作为所述推理模型的输入，对博弈局势进行分析，生成当前博弈局势总结与分析、智能体策略建议；步骤6，所述对抗博弈环境协同决策大语言模型根据步骤5的结果，严格根据样本示例的格式，生成本回合的文本行动决策；步骤7，根据所述文本行动决策，生成本回合的行动；步骤8，在对抗博弈环境中执行动作，根据行动结果更新步骤3构建的记忆模块；完成记忆模块更新后，进入下一回合的博弈。

全文数据：

权利要求：

百度查询：南京航空航天大学一种面向对抗博弈的大语言模型多智能体协同决策方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种液压动力机械用元件制造设备

下一篇：一种双向进气填充气缸

相关技术

一种液压动力机械用元件制造设备

一种双向进气填充气缸

一种不锈钢管切割机的清废装置

一种太阳能路灯光伏组件安装结构

一体式PICC置管专用车

一种可快速干燥的光伏板鼓风机

一种农艺地表喷灌装置

车牌自动识别分拣线

一种交联电缆紫外光辐照设备

一种可调节高度的阴囊托起垫

一种恒光空间自动调光装置

一种用于高压无气喷涂机的过滤送料装置

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种面向对抗博弈的大语言模型多智能体协同决策方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务