一种用于兵棋推演平台的端云协同训练方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：中国人民解放军国防科技大学

摘要：本申请涉及一种用于兵棋推演平台的端云协同训练方法。所述方法包括：将推演用户端作为协同工作的用户端，推演服务器通过作为云端服务器构建端云协同框架；对端云协同框架进行建模，将用户端建模为智能体，得到端云协同模型；根据Decider算法和预先获取的离线数据集对端云协同模型进行离线预训练，根据离线数据子集对用户端进行在线训练，将训练得到的本地智能体模型上传至云端服务器；在云端服务器进行模型聚合，得到加权平均模型，作为当前轮次更新后的全局智能体模型，并广播至用户端。采用本方法能够提高兵棋推演平台训练准确率和效率。

主权项：1.一种用于兵棋推演平台的端云协同训练方法，其特征在于，所述方法应用于包括推演服务器和多个推演用户端的兵棋推演平台，所述方法包括：将所述推演用户端作为协同工作的用户端，所述推演服务器通过作为云端服务器，所述用户端通过云端服务器的接口与所述云端服务器进行数据共享和协同处理构建端云协同框架；对所述端云协同框架进行建模，将所述用户端建模为智能体，得到端云协同模型；根据Decider算法和预先获取的离线数据集对所述端云协同模型进行离线预训练，将得到的离线智能体对应的状态价值网络的网络参数和目标策略网络的网络参数及离线数据子集广播至推演用户端；根据所述离线数据子集和用户端在线收集的数据对所述用户端进行在线训练，设置用户端上本地智能体模型对应的动作网络的目标函数和评价网络的损失函数，利用所述本地智能体模型对应的动作网络的目标函数和评价网络的损失函数对所述本地智能体模型进行训练，将训练得到的本地智能体模型上传至云端服务器；在所述云端服务器的测试环境中利用所述训练得到的本地智能体模型输出的模型策略进行性能测试，根据不同模型策略对应的累计奖励值进行模型聚合，得到加权平均模型，作为当前轮次更新后的全局智能体模型，并广播至用户端。

全文数据：

权利要求：

百度查询：中国人民解放军国防科技大学一种用于兵棋推演平台的端云协同训练方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：半导体用黏合膜、切割晶粒接合一体型膜及半导体装置的制造方法

下一篇：一种水库运行管理与安全评价系统及安全评价方法

相关技术

半导体用黏合膜、切割晶粒接合一体型膜及半导体装置的制造方法

一种水库运行管理与安全评价系统及安全评价方法

一种电网高影响天气特征与模式识别方法及系统

一种玻璃瓶裂纹检测装置

一种用于多弯曲半径的数控弯曲连接装置及使用方法

情感分类模型训练方法、系统、情感分类方法及系统

一种热网加热器换热管泄漏在线定位系统及方法

一种底水回掺工艺流程

一种塑料导气管成型设备

一种放射性同位素碳-14标记的巴德卡鲁胺及其制备方法和应用

超临界CO₂腐蚀测试系统的样品加载装置

一种石质文物保护用高耐久透明降温自清洁涂层的制备方法

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种用于兵棋推演平台的端云协同训练方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务