一种基于主从博弈的训练损失优化激励方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：桂林理工大学

摘要：本发明涉及大数据和云计算技术领域，具体涉及一种基于主从博弈的训练损失优化激励方法，提出云端数据中心‑本地数据中心‑终端用户的三层模式，基于主从博弈的训练损失优化激励方法，首先，在激励预算分配有限的情况下，分析终端用户和本地数据中心的效益博弈是否达到均衡状态。其次，为进一步降低模型训练的损耗，在终端用户和本地数据中心之间设计一种优化模型损失的激励算法来使得全局模型训练的损失值达到最小。最后通过实验仿真与对比证明本发明能够有效激励终端用户积极参到模型训练，并能有效降低全局模型训练损失值，解决在联邦学习训练过程中终端用户不会主动参与模型训练的技术问题。

主权项：1.一种基于主从博弈的训练损失优化激励方法，其特征在于，包括下列步骤：步骤1：建立基于主从博弈的联邦学习激励机制系统模型；步骤2：在所述联邦学习激励机制系统模型中分别对终端用户、本地数据中心以及云端数据中心三层交互模型进行模型描述；步骤3：将本地数据中心和终端用户获得的效益建模为一个主从博弈的效益模型；步骤4：云端数据中心作为激励报酬预算的分配者，负责为每个本地数据中心分配用于激励的预算；步骤5：每个终端用户根据本地数据中心的激励报价，相应地调整投入参与训练的损耗频率，从而进行最大化用户效益博弈分析；步骤6：本地数据中心根据终端用户报告的损耗频率投入情况，再重新调整给出的激励报酬，从而进行最大化本地数据中心的效益博弈分析；步骤7：两层效益最大化博弈反复进行，直到达到纳什均衡点，得到最优的损耗频率、奖励单价以及激励预算分配；步骤8：在满足本地数据中心和终端用户的效益博弈达到均衡状态下，使得全局模型训练的损失值达到最小。

全文数据：

权利要求：

百度查询：桂林理工大学一种基于主从博弈的训练损失优化激励方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种基于感知线程束类型的GPGPU性能优化方法

下一篇：基于城市地理信息数据与多维属性数据的智能规划审查方法

相关技术

一种基于感知线程束类型的GPGPU性能优化方法

基于城市地理信息数据与多维属性数据的智能规划审查方法

一种可降解咖啡渣复合材料及其制备方法与制品

一种智能围棋教学系统

一种基于多链融合的药品溯源系统和方法

一种可自动充电的分体式移动充电桩及其方法

基于私有传输协议的文件传输方法、装置和存储介质

背光模组及显示装置

一种新型数据线缆及其接口装置

一种考虑可靠性及经济性的配电网承载力精细化评估方法

电动汽车

基于WO₃@AuNPs和聚合物PAMAM双信号放大的DR1检测试剂盒及应用

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于主从博弈的训练损失优化激励方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务