首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于动态契约理论的车联网联邦学习激励方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:东北大学

摘要:本发明公开了一种基于动态契约理论的车联网联邦学习激励方法,涉及联邦学习领域;采用了联邦学习架构,使数据在本地进行训练,保障了数据的隐私和安全。在采用联邦学习架构的基础上,为联邦学习服务器和车联网客户端建立了两期动态契约激励机制,在非对称信息的情况下,最大化联邦学习服务器的效用,使车联网客户端选择和自身私有信息相对应的契约,当车联网客户端选择和自身类型相对应的契约时,车联网客户端获得的效用最高。在长期合作下,考虑了车联网联邦学习的私有信息的动态变化,采用了动态契约激励机制,更适用于联邦学习服务器和车联网边缘设备之间的长期合作,在动态契约激励机制下,联邦学习服务器和车联网边缘设备会获得更高的收益。

主权项:1.一种基于动态契约理论的车联网联邦学习激励方法,其特征在于:包括以下步骤:步骤1:建立车联网客户端和联邦学习服务器的效用模型,通过满足IR、IC、IIR和IIC约束条件,构建两期动态契约模型,得到最优动态契约;步骤1.1:建立车联网客户端的成本模型、效用模型,建立联邦学习服务器的效用模型;设定类型为m的车联网客户端训练的数据大小为Dm,训练截止时间为Tm,其训练数据的CPU频率为fm,每轮CPU周期的消耗成本为其中,k为常数;当类型为m的车联网客户端训练的数据大小为Dm时,需要消耗的CPU周期为pDm,其中,p为常数;类型为m型车辆的CPU频率具体包括以下步骤:步骤1.1.1:建立类型为m的车联网客户端的成本模型,如式1所示: 设定μ=kp3,其中,μ为常数;将定义为类型为m的车联网客户端的私有信息,表示类型为m的车联网客户端基于训练时间的数据训练能力;类型为m的车联网客户端的成本模型,如式2所示:Cm=μθm[Dm]32步骤1.1.2:建立类型为m的车联网客户端的效用模型Uv,如式3所示:Uv=Rm-Cm=Rm-μθm[Dm]33其中,Rm为类型为m的车联网客户端从联邦学习服务器收到的奖励;步骤1.1.3:联邦学习服务器从类型为m的车联网客户端上传的本地模型中获得的收益Gm,如式4所示:Gm=σlog1+αDm4其中,σ和α基于数据大小确定模型精度对联邦学习服务器收益的影响;建立联邦学习服务器的效用模型Us,如式5所示: 其中,N代表有N个车联网客户端参与联邦学习训练,qm代表类型为m的车联网客户端的先验概率分布,Rm为联邦学习服务器为类型为m的车联网客户端发放的奖励;步骤1.2:建立动态契约第二阶段和第一阶段的车联网客户端的效用模型、两阶段的最优契约模型;具体分为以下步骤:步骤1.2.1:建立第二阶段的类型为n的车联网客户端的效用模型,如式6所示: 其中,代表第一阶段类型为m第二阶段类型为n的车联网客户端的私有信息;第二阶段类型为n的车联网客户端在选择契约时获得非负效用,满足IRIndividualRationality约束条件,如式7所示: 其中,X为常数,表示第二阶段类型为n的车联网客户端最小可接受效用;第二阶段类型为n的车联网客户端在选择和自身类型相同的契约时获得最大效用,满足ICIncentiveCompatibility约束条件,如式8所示: 其中,和为选取最适合自身契约情况下的第二阶段的奖励和训练数据大小;和为选取其他契约情况下第二阶段的奖励和训练数据大小;步骤1.2.2:建立第一阶段的类型为m的车联网客户端的跨期效用模型,如式9所示: 其中,为类型为m的车联网客户端在第一阶段的私有信息;δ为折扣因子;表示第二阶段先验概率分布;第一阶段类型为m的车联网客户端应满足IIRIntertemporalIndividuallyRational约束条件,如式10所示: 同时满足IICIntertemporalIncentiveCompatibility约束条件,如式11所示: 两阶段满足IR,IC,IIR和IIC约束条件时,两期动态合同的优化问题,如式12-式16所示: 其中,为联邦学习服务器在第一阶段的效用,为联邦学习服务器在第二阶段的效用;步骤1.3:放松IR、IC、IIR、IIC约束条件,得到联邦学习服务器和车联网客户端的最优动态合约;对步骤1.2中的IR约束进行放松约束,如式17所示: 对步骤1.2中的IC约束进行放松约束,如式18所示: 对步骤1.2中的IIR约束进行放松约束,如式19所示: 对步骤1.2中中的IIC约束进行放松约束,如式20所示: 通过放松步骤1.2中的约束条件,两期动态合同的优化问题,如式21-式25所示: 在放松后约束条件下,式21-式25,通过拉格朗日函数可以得到最终的最优动态契约;步骤2:使用步骤1得到的最优动态契约与车联网客户端进行签约;步骤3:在动态契约的第一阶段,签约的车联网客户端从联邦学习服务器下载全局模型,对全局模型进行本地训练得到本地模型,将训练完成的本地模型上传到联邦学习服务器;步骤4:联邦学习服务器判断车联网客户端上传的本地模型的精度是否满足设定精度阈值,若满足设定精度阈值,联邦学习服务器接收车联网客户端上传的本地模型并按照第一阶段最优动态契约发放相应的奖励,反之则不接收车联网客户端上传的本地模型并不发放奖励;步骤5:在动态契约的第二阶段,签约的车联网客户端从联邦学习服务器下载全局模型,对全局模型进行本地训练得到本地模型,将训练完成的本地模型上传到联邦学习服务器;步骤6:联邦学习服务器判断车联网客户端上传的本地模型的精度是否满足设定精度阈值,若满足设定精度阈值,联邦学习服务器接收车联网客户端上传的本地模型并按照第二阶段最优动态契约发放相应的奖励,反之则不接收车联网客户端上传的本地模型并不发放奖励。

全文数据:

权利要求:

百度查询: 东北大学 一种基于动态契约理论的车联网联邦学习激励方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。