差分隐私保护下基于联邦学习和多臂赌博机的商品推荐方法

导航：龙图腾网> 最新专利技术> 差分隐私保护下基于联邦学习和多臂赌博机的商品推荐方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：安徽大学

摘要：本发明公开了一种差分隐私保护下基于联邦学习和多臂赌博机的商品推荐方法，其步骤包括：1、中央服务器及各个终端初始化参数；2、对所有候选商品进行推荐并获得对应用户评分奖励反馈；3、以上一步奖励结果为初始参数，选择用户评分最高的商品局部最优进行推荐并获得对应用户评分；4、将之前所获得的奖励反馈进行聚合；5、对聚合结果加入噪声进行扰动，并将扰动后的参数上传至中央服务器；6、中央服务器根据上传的数据确定淘汰集；7、删除淘汰集内的候选商品后进行迭代，直至得到最终的推荐商品。本发明能够在分布式环境下有效解决商品推荐系统中的冷启动问题，同时保护用户隐私信息。

主权项：1.一种差分隐私保护下基于联邦学习和多臂赌博机的商品推荐方法，其特征是应用于由一个中央服务器、M个客户端、一个候选商品集A＝{a1,a2,…,ak,…,aK}所构成的网络环境中，其中，ak表示第k个候选商品，K表示候选商品的总数，M为客户端的数量，所述商品推荐方法是按如下步骤进行：步骤1、所述中央服务器及各个客户端初始化商品推荐的参数：定义当前训练轮次为t，并初始化t＝1；定义总训练轮次为T，训练步长为fp，且fp＝10logT，定义活跃候选商品集为A'，并初始化A'＝A；步骤2、第t次迭代下各个客户端对A'中所有候选商品进行推荐并获得对应的奖励反馈向量：步骤2.1、定义候选商品重复推荐的总次数为N，且N＝minT-t,fp；定义当前推荐次数为n，并初始化n＝1；定义第t次迭代下第k个候选商品ak第n次推荐给第m个客户端所获得的累计奖励反馈为rtm,n,k，并初始化rtm,n,k＝0；定义第t次迭代下第k个候选商品ak第n次推荐给第m个客户端的推荐次数为ptm,n,k，并初始化ptm,n,k＝0；定义并初始化参考奖励向量为R0m；初始化参考推荐次数向量为P0m；步骤2.2、初始化k＝1；步骤2.3、第t次迭代下将第k个候选商品ak第n次推荐给第m个客户端，并得到在第n次推荐下第m个客户端对第k个候选商品ak的评分Δtm,n,k，将rtm,n,k+Δtm,n,k赋值给rtm,n,k；将ptm,n,k+1赋值给ptm,n,k；步骤2.4、k+1赋值给k后，返回步骤2.3顺序执行，直到kK为止，从而得到第t次迭代下的第n次推荐时第m个客户端对A'中所有候选商品的累计评分向量Rtm,n＝{rtm,n,k|k＝1,2,…,K}以及A'中所有候选商品推荐给第m个客户的推荐次数向量Ptm,n＝{ptm,n,k|k＝1,2,…,K}；步骤3、第t次迭代下各个客户端从A'中选择局部最优的商品进行推荐并获得对应的奖励反馈：步骤3.1、定义并初始化第t次迭代下第k个候选商品ak第n次推荐给第m个客户端时参考奖励的期望Φtm,n,k＝rtm,n,kptm,n,k，从而得到第t次迭代下所有候选商品第n次推荐给第m个客户端时参考奖励的期望向量Φtm,n＝{Φtm,n,k|k＝1,2,…,K}；根据式1计算第t次迭代下第k个候选商品ak第n次推荐给第m个客户端的置信半径δtm,n,k：步骤3.2、定义第t次迭代下第k个候选商品ak第n次推荐给第m个客户端所获得的累计奖励反馈为r'tm,n,k，并初始化r'tm,n,k＝0；定义第t次迭代下第k个候选商品ak第n次推荐给第m个客户端的推荐次数为sm,n,k，并初始化sm,n,k＝0；步骤3.3、计算第t次迭代下第k个候选商品ak在第n次推荐给第m个客户端时的置信上界Ltm,n,k＝Φtm,n,k+δtm,n,k；从而得到第t次迭代下所有候选商品在第n次推荐给第m个客户端时的置信上界Ltm,n＝{Ltm,n,k|k＝1,2,…,K}；步骤3.4、从Ltm,n中选择最大值所对应的候选商品并作为局部最优的商品am,max推荐给第m个客户端，并得到第t次迭代下第m个客户端对第n次推荐的最优商品am,max的评分Δ'tm,n,max，将r'tm,n,max+Δ'tm,n,max赋值给r'tm,n,max；并将sm,n,max+1赋值给sm,n,max；其中，r'tm,n,max表示第t次迭代下最优商品am,max第n次推荐给第m个客户端所获得的累计奖励反馈，sm,n,max表示第t次迭代下最优商品am,max第n次推荐给第m个客户端的推荐次数；max∈[1,K]；步骤3.5、根据r'tm,n,max得到第t次迭代下第m个客户端在第n次推荐时对所有候选商品的累计评分向量Itm,n；根据sm,n,max得到第t次迭代下第m个客户端在第n次推荐时对所有候选商品的推荐次数向量Stm,n；步骤3.6、将R0m+Itm,nP0m+Stm,n赋值给Φtm,n；当n＝1时，令R0m＝Rtm,n，P0m＝Ptm,n；步骤3.7、将n+1赋值给n后，判断nN是否成立，若成立，则表示得到第t次迭代下第N次推荐时第m个客户端的累计评分向量Rtm,N并赋值给最终累计评分向量Rtm，得到第t次迭代下第m个客户端在第N次推荐时对所有候选商品的累计评分向量Itm,N并赋值给最终累计评分向量Itm、得到第t次迭代下的第N次推荐时A'中所有候选商品推荐给第m个客户的推荐次数向量Ptm,N并赋值给最终推荐次数向量Ptm、得到第t次迭代下第m个客户端在第N次推荐时对所有候选商品的推荐次数向量Stm,N并赋值给最终推次数向量Stm，否则，返回步骤2.2顺序执行，步骤4、利用式2计算第t次迭代下第m个客户端的推荐参数向量gtm＝{gtm,k|k＝1,2,…,K}：式2中，β为权重参数；步骤5、计算扰动后的推荐参数向量g'tm＝{g'tm,k|k＝1,2,…,K}、最终推荐次数向量P'tm、S'tm并上传至中央服务器，其中，g'tm,k表示第t次迭代下第m个客户端对第k个商品ak的推荐参数；步骤6、中央服务器对扰动后的参数向量进行处理：步骤6.1、根据式5计算第t次迭代下所有客户端对所有候选商品的全局期望向量htglobal＝{htglobal,k|k＝1,2,…,K}，其中，htglobal,k表示第t次迭代下第k个商品ak的全局期望：步骤6.2、根据式6计算第t次迭代下中央服务器对所有候选商品的全局期望向量其中，表示第t次迭代下第k个商品ak的全局置信半径：式6中，σc为置信度参数；步骤6.3、遍历每个候选商品的全局期望，当第k个候选商品ak的全局期望htglobal,k不满足式7时，将第k个候选商品ak加入第t次迭代下的淘汰集Et，从而得到第t次迭代下最终的淘汰集Et；步骤6.4、从活跃候选商品集A'中删除最终的淘汰商品集Et中所包含的商品，从而得到更新后的活跃候选商品集A'；步骤7、判断活跃候选商品集A'中剩余的商品数量大于1是否成立，若成立，则将t+1赋值给t后，返回步骤2顺序执行，否则，直接选择活跃候选商品集A'中最终剩余的商品进行推荐。

全文数据：

权利要求：

百度查询：安徽大学差分隐私保护下基于联邦学习和多臂赌博机的商品推荐方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：用于装置气溶胶生成系统的传感器

下一篇：一种焊接加热装置

相关技术

用于装置气溶胶生成系统的传感器

一种焊接加热装置

一种金属制品加工用数控刀头

一种市政道路铺砖装置

一种热管理系统及车辆

一种船舶激振装置及船体振动试验分析方法

一种电子设备、下载模式触发方法以及可读存储介质

一种坐浴盆

一种大数据支持的交通碳排放监测方法及监测系统

回环检测方法、装置、电子设备和存储介质

一种高矫顽力的R-T-B永磁体及其制备方法和应用

一种用于支持北斗定位和陆基导航定位的手持天线设备

学习相关技术

基于深度学习的学习笔个性化辅导系统_深圳市博升电子发展有限公司_202410672308.4

机器学习装置、数据处理系统、推理装置以及机器学习方法_金子产业株式会社_202180021503.5

一种改进学习书桌_广东顺德聪聪网络科技有限公司_202420245783.9

一种英语学习专用板_山东理工职业学院_202323663439.6

联邦学习隐私保护方法及系统_中电科大数据研究院有限公司_202410837475.X

用于基于机器学习模型的内部状态来防止对机器学习模型的攻击的系统和方法_爱迪德技术有限公司_202410266231.0

图像处理方法、深度学习模型的训练方法_北京百度网讯科技有限公司_202410907645.7

基于深度学习的征迁范围识别方法_浙江省自然资源征收中心_202311156732.5

使用机器学习模型确定对象与人之间的关联_辉达公司_201980088877.1

深度学习多任务特征编码方法及其系统_中国电信股份有限公司_202110339644.3

臂相关技术

袖套臂包_泉州市翔闻旅游用品有限公司_202420187826.2

助力机械臂_华晨宝马汽车有限公司_202310227323.3

多功能速臂器_永康市缘凌工贸有限公司_202420146254.3

机械臂末端夹持装置_重庆凯宝动力机械有限公司_202322673511.7

带电作业机械臂_国网山东省电力公司淄博供电公司_202410612680.6

斜臂机械手_宁波福来德智能装备有限公司_202420062677.7

一种机械臂末端执行器及机械臂_中科非凡机器人(深圳)有限公司_202323644601.X

一种摆臂车用摆臂油缸防护装置_海沃机械(中国)有限公司_202420330173.9

一种绝缘斗臂车的绝缘臂耐压试验辅助装置_国网青海省电力公司西宁供电公司_202410795594.3

一种手动刹车调整臂_驰达(浙江)智能科技有限公司_202420286212.X

联邦相关技术

材料数据模型联邦学习方法和装置_北京钢研新材科技有限公司_202410433970.4

联邦学习方法、装置、设备、存储介质及程序产品_讯飞华中(武汉)有限公司_202410724238.2

基于特征对抗的无数据联邦双向知识蒸馏方法及系统_江南大学_202411093669.X

一种基于联邦学习的咳嗽声识别方法_郑州大学_202410657637.1

基于联邦学习框架的多时间尺度综合能源优化调度方法_华北电力大学_202410761570.6

应用于物联网的联邦学习资源跳跃多址方法_北京交通大学_202410769000.1

一种基于条件隐私集合求交的联邦学习模型训练方法_北京数牍科技有限公司_202210012540.6

一种采用联邦学习的隐私保护船名识别模型训练方法_广东优算科技有限公司_202111680336.3

纵向联邦学习训练加速方法、电子设备、存储介质及产品_武汉大学_202410764433.8

一种基于联邦学习模型的帕金森疾病智能评估方法与系统_南昌大学_202410764544.9

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

差分隐私保护下基于联邦学习和多臂赌博机的商品推荐方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务