买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:哈尔滨工程大学
摘要:本发明提出了一种基于会话内异构行为的点击率预测方法,获得用户信息数据集、项目信息数据集和用户行为序列数据集,分别对三种数据集进行预处理,并分为训练集和测试集;构建基于会话内异构行为的点击率预测模型;训练构建的基于会话内异构行为的点击率预测模型;将待推荐用户的个人信息、待推荐项目信息和待推荐用户行为序列输入到训练后的基于会话内异构行为的点击率预测模型,计算用户对目标项目的点击率,根据点击率将项目进行排序,并将排序后的项目列表推荐给用户;本发明同时考虑了用户与项目之间的多种异构行为对用户兴趣的影响,利用注意力机制计算不同类型的行为对兴趣的影响权重,更加精准地提取用户的兴趣。
主权项:1.一种基于会话内异构行为的点击率预测方法,其特征在于:所述方法具体包括以下步骤:步骤1:获得用户信息数据集、项目信息数据集和用户行为序列数据集,分别对三种数据集进行预处理,并分为训练集和测试集;步骤2:构建基于会话内异构行为的点击率预测模型;步骤2.1:获得用户信息嵌入向量、项目信息嵌入向量和用户行为序列的嵌入向量;其中用户信息嵌入向量表示为XU,项目信息嵌入向量表示为XI,用户行为序列嵌入向量表示为S;步骤2.2:将步骤2.1中获取的用户行为序列的嵌入向量S输入到行为序列分割处理层,将行为序列分割成会话序列-1,对会话序列按照行为类型及交互项目类型进一步分割为会话序列-2,利用注意力机制计算每个行为类型的影响权重并形成加权会话序列;步骤2.3:将步骤2.2中形成的加权会话序列输入到transformer编码层中进行兴趣提取,捕获会话内部的依赖关系,输出基于会话内依赖的兴趣序列;首先为每个会话添加一个位置编码BE:BEk,t,c代表了第k个会话中第t个物品的嵌入向量的第c个位置的偏置项,为第k个会话的偏置项,为第t个物品的偏置项,为第c个位置的偏置项,将偏置项加入到会话表示中进行更新,更新后的会话为:Q′=Q′+BE;利用多头自注意机制对这种关系进行建模,令Q′k=[Q′k1;…;Q′kh;…;Q′kH],其中Q′kh是Q′k的第h个头部,H是头的数量,第h个头的输出为:headh=AttentionQ′khWQ,Q′khWK,Q′khWV,其中WQ,WK,WV都是线性矩阵,将所有的头部输出联结起来,输入到一个前馈神经网络中,其输出为:其中FFN是前馈神经网络,WO是线性矩阵;最后经过一个平均池化操作,得到兴趣序列Ik:将其输入到一个激活单元中计算带权重的兴趣表征,计算方式如下: 其中WI是符合维度的线性矩阵;步骤2.4:将步骤2.3中输出的基于会话内依赖的兴趣序列输入到一个Bi-LSTM层中进一步提取用户兴趣,捕获会话间的依赖关系,输出基于会话内和会话间依赖的兴趣序列;在步骤2.4中,首先计算Bi-LSTM的每个隐藏状态并形成混合了上下文信息的兴趣表征:其中和分别是LSTM前向传播和反向传播对应时刻的隐藏状态;然后将所述计算Bi-LSTM的每个隐藏状态并形成混合了上下文信息的兴趣表征输入到一个激活单元中计算带权重且混合了上下文信息的兴趣表征,计算方式如下: 其中WH是符合维度的线性矩阵;步骤3:训练步骤2构建的基于会话内异构行为的点击率预测模型;步骤4:将待推荐用户的个人信息、待推荐项目信息和待推荐用户行为序列输入到步骤3训练后的基于会话内异构行为的点击率预测模型,计算用户对目标项目的点击率,根据点击率将项目进行排序,并将排序后的项目列表推荐给用户。
全文数据:
权利要求:
百度查询: 哈尔滨工程大学 一种基于会话内异构行为的点击率预测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。