买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:贵州优特云科技有限公司
摘要:本发明提出了一种个性化消费数据预测智能推荐方法、装置及存储介质,包括:构建稀疏深度学习模型,对用户的历史消费和浏览数据进行特征抽取;基于抽取得到的特征,利用深度变分贝叶斯模型对用户喜好进行建模;构建多智能体系统,基于建模后得到的用户喜好概率,利用所述多智能体系统动态调整个性化推荐策略;基于所述个性化推荐策略,对所述用户进行个性化推荐。
主权项:1.一种个性化消费数据预测智能推荐方法,其特征在于,包括:构建稀疏深度学习模型,对用户的历史消费和浏览数据进行特征抽取,所述稀疏深度学习模型为稀疏编码网络;基于抽取得到的特征,利用深度变分贝叶斯模型对用户喜好进行建模;构建多智能体系统,基于建模后得到的用户喜好概率,利用所述多智能体系统动态调整个性化推荐策略;基于所述个性化推荐策略,对所述用户进行个性化推荐;其中,构建多智能体系统,包括:设计多个智能体,每个智能体负责学习和优化推荐策略的各一个方面,所述多个智能体包括商品智能体、品类智能体和优惠智能体,所述商品智能体用于针对单个商品优化推荐策略、所述品类智能体用于负责优化各个商品品类的推荐比例、所述优惠智能体用于负责推荐用户可能感兴趣的优惠活动和促销商品;设置不同智能体之间的通信协议;设置不同智能体之间的协同和竞争策略;其中,利用所述多智能体系统动态调整个性化推荐策略,包括:设置每个智能体的奖励函数,其中,所述商品智能体的奖励函数设计为:用户点击商品+1,加入购物车+2,购买商品+5,推荐商品被忽略-1;所述品类智能体的奖励函数设计为:用户购买某品类商品+3,推荐品类被连续忽略-1,推荐品类饱和度过高-2;所述优惠智能体的奖励函数设计为:用户点击优惠商品+2,购买优惠商品+5,推荐优惠被忽略-1,用户购买力饱和时仍推荐优惠-3;使用强化学习算法优化每个智能体推荐策略,其中,所述商品智能体采用DQN算法,将用户特征和商品特征作为状态空间,推荐不同商品作为动作空间,通过Q值网络学习最优的商品推荐策略;所述品类智能体采用TRPO算法,将不同品类的历史推荐比例和转化率作为状态空间,调整品类推荐比例作为动作空间,学习最优的品类分配策略;所述优惠智能体采用DDPG算法,将用户购买力特征作为状态空间,生成优惠推荐排序的策略网络,同时学习估计未来优惠推荐收益的价值网络;每个智能体与用户的互动产生实时反馈,基于反馈奖励不断优化自身的推荐策略网络;引入多智能体协同学习机制,以使不同智能体之间进行相互学习,包括:采用多智能体Actor-Critic算法,让不同智能体在优化自身策略的同时,也学习彼此协同的联合策略;搭建不同智能体间的共享记忆机制,使其可以访问彼此的部分状态信息和策略网络参数;每个智能体将自身与其他智能体的联合观察作为输入,学习基于联合策略的价值函数;任一智能体在更新自身策略时,以一定概率选择执行其他智能体的策略,通过策略同步实现分布式探索;定期在离线数据集上评估不同智能体学到的推荐策略,筛选出最有的策略组合,包括:构建推荐系统的离线仿真环境,利用历史用户行为日志对不同智能体的推荐策略进行评估;采用交叉验证的方式,比较不同策略组合下的推荐效果,评估指标包括:总体点击率、购买转化率、推荐多样性、用户覆盖率;记录并保存评估效果最优的多智能体联合策略,同时分析各个智能体策略的权重分布和收敛情况;对最优联合策略中的各个智能体策略进行组合优化,剔除冗余策略,得到最终的推荐策略集成;将筛选出的最优策略更新到线上的推荐系统中,以服务实际的用户请求。
全文数据:
权利要求:
百度查询: 贵州优特云科技有限公司 一种个性化消费数据预测智能推荐方法、装置及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。