首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

差分隐私保护下基于联邦学习和多臂赌博机的商品推荐方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:安徽大学

摘要:本发明公开了一种差分隐私保护下基于联邦学习和多臂赌博机的商品推荐方法,其步骤包括:1、中央服务器及各个终端初始化参数;2、对所有候选商品进行推荐并获得对应用户评分奖励反馈;3、以上一步奖励结果为初始参数,选择用户评分最高的商品局部最优进行推荐并获得对应用户评分;4、将之前所获得的奖励反馈进行聚合;5、对聚合结果加入噪声进行扰动,并将扰动后的参数上传至中央服务器;6、中央服务器根据上传的数据确定淘汰集;7、删除淘汰集内的候选商品后进行迭代,直至得到最终的推荐商品。本发明能够在分布式环境下有效解决商品推荐系统中的冷启动问题,同时保护用户隐私信息。

主权项:1.一种差分隐私保护下基于联邦学习和多臂赌博机的商品推荐方法,其特征是应用于由一个中央服务器、M个客户端、一个候选商品集A={a1,a2,…,ak,…,aK}所构成的网络环境中,其中,ak表示第k个候选商品,K表示候选商品的总数,M为客户端的数量,所述商品推荐方法是按如下步骤进行:步骤1、所述中央服务器及各个客户端初始化商品推荐的参数:定义当前训练轮次为t,并初始化t=1;定义总训练轮次为T,训练步长为fp,且fp=10logT,定义活跃候选商品集为A',并初始化A'=A;步骤2、第t次迭代下各个客户端对A'中所有候选商品进行推荐并获得对应的奖励反馈向量:步骤2.1、定义候选商品重复推荐的总次数为N,且N=minT-t,fp;定义当前推荐次数为n,并初始化n=1;定义第t次迭代下第k个候选商品ak第n次推荐给第m个客户端所获得的累计奖励反馈为rtm,n,k,并初始化rtm,n,k=0;定义第t次迭代下第k个候选商品ak第n次推荐给第m个客户端的推荐次数为ptm,n,k,并初始化ptm,n,k=0;定义并初始化参考奖励向量为R0m;初始化参考推荐次数向量为P0m;步骤2.2、初始化k=1;步骤2.3、第t次迭代下将第k个候选商品ak第n次推荐给第m个客户端,并得到在第n次推荐下第m个客户端对第k个候选商品ak的评分Δtm,n,k,将rtm,n,k+Δtm,n,k赋值给rtm,n,k;将ptm,n,k+1赋值给ptm,n,k;步骤2.4、k+1赋值给k后,返回步骤2.3顺序执行,直到kK为止,从而得到第t次迭代下的第n次推荐时第m个客户端对A'中所有候选商品的累计评分向量Rtm,n={rtm,n,k|k=1,2,…,K}以及A'中所有候选商品推荐给第m个客户的推荐次数向量Ptm,n={ptm,n,k|k=1,2,…,K};步骤3、第t次迭代下各个客户端从A'中选择局部最优的商品进行推荐并获得对应的奖励反馈:步骤3.1、定义并初始化第t次迭代下第k个候选商品ak第n次推荐给第m个客户端时参考奖励的期望Φtm,n,k=rtm,n,kptm,n,k,从而得到第t次迭代下所有候选商品第n次推荐给第m个客户端时参考奖励的期望向量Φtm,n={Φtm,n,k|k=1,2,…,K};根据式1计算第t次迭代下第k个候选商品ak第n次推荐给第m个客户端的置信半径δtm,n,k: 步骤3.2、定义第t次迭代下第k个候选商品ak第n次推荐给第m个客户端所获得的累计奖励反馈为r'tm,n,k,并初始化r'tm,n,k=0;定义第t次迭代下第k个候选商品ak第n次推荐给第m个客户端的推荐次数为sm,n,k,并初始化sm,n,k=0;步骤3.3、计算第t次迭代下第k个候选商品ak在第n次推荐给第m个客户端时的置信上界Ltm,n,k=Φtm,n,k+δtm,n,k;从而得到第t次迭代下所有候选商品在第n次推荐给第m个客户端时的置信上界Ltm,n={Ltm,n,k|k=1,2,…,K};步骤3.4、从Ltm,n中选择最大值所对应的候选商品并作为局部最优的商品am,max推荐给第m个客户端,并得到第t次迭代下第m个客户端对第n次推荐的最优商品am,max的评分Δ'tm,n,max,将r'tm,n,max+Δ'tm,n,max赋值给r'tm,n,max;并将sm,n,max+1赋值给sm,n,max;其中,r'tm,n,max表示第t次迭代下最优商品am,max第n次推荐给第m个客户端所获得的累计奖励反馈,sm,n,max表示第t次迭代下最优商品am,max第n次推荐给第m个客户端的推荐次数;max∈[1,K];步骤3.5、根据r'tm,n,max得到第t次迭代下第m个客户端在第n次推荐时对所有候选商品的累计评分向量Itm,n;根据sm,n,max得到第t次迭代下第m个客户端在第n次推荐时对所有候选商品的推荐次数向量Stm,n;步骤3.6、将R0m+Itm,nP0m+Stm,n赋值给Φtm,n;当n=1时,令R0m=Rtm,n,P0m=Ptm,n;步骤3.7、将n+1赋值给n后,判断nN是否成立,若成立,则表示得到第t次迭代下第N次推荐时第m个客户端的累计评分向量Rtm,N并赋值给最终累计评分向量Rtm,得到第t次迭代下第m个客户端在第N次推荐时对所有候选商品的累计评分向量Itm,N并赋值给最终累计评分向量Itm、得到第t次迭代下的第N次推荐时A'中所有候选商品推荐给第m个客户的推荐次数向量Ptm,N并赋值给最终推荐次数向量Ptm、得到第t次迭代下第m个客户端在第N次推荐时对所有候选商品的推荐次数向量Stm,N并赋值给最终推次数向量Stm,否则,返回步骤2.2顺序执行,步骤4、利用式2计算第t次迭代下第m个客户端的推荐参数向量gtm={gtm,k|k=1,2,…,K}: 式2中,β为权重参数;步骤5、计算扰动后的推荐参数向量g'tm={g'tm,k|k=1,2,…,K}、最终推荐次数向量P'tm、S'tm并上传至中央服务器,其中,g'tm,k表示第t次迭代下第m个客户端对第k个商品ak的推荐参数;步骤6、中央服务器对扰动后的参数向量进行处理:步骤6.1、根据式5计算第t次迭代下所有客户端对所有候选商品的全局期望向量htglobal={htglobal,k|k=1,2,…,K},其中,htglobal,k表示第t次迭代下第k个商品ak的全局期望: 步骤6.2、根据式6计算第t次迭代下中央服务器对所有候选商品的全局期望向量其中,表示第t次迭代下第k个商品ak的全局置信半径: 式6中,σc为置信度参数;步骤6.3、遍历每个候选商品的全局期望,当第k个候选商品ak的全局期望htglobal,k不满足式7时,将第k个候选商品ak加入第t次迭代下的淘汰集Et,从而得到第t次迭代下最终的淘汰集Et; 步骤6.4、从活跃候选商品集A'中删除最终的淘汰商品集Et中所包含的商品,从而得到更新后的活跃候选商品集A';步骤7、判断活跃候选商品集A'中剩余的商品数量大于1是否成立,若成立,则将t+1赋值给t后,返回步骤2顺序执行,否则,直接选择活跃候选商品集A'中最终剩余的商品进行推荐。

全文数据:

权利要求:

百度查询: 安徽大学 差分隐私保护下基于联邦学习和多臂赌博机的商品推荐方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。