买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:重庆大学
摘要:本发明公开了一种社交网络中用户未来交互行为预测方法,该该方法为:通过社区感知的时序有偏游走获得t‑ttl至t时段的用户历史邻域序列nodeSeq,并对用户初始的特征向量进行编码表示;然后将t‑ttl至t时段的用户特征向量与历史邻域序列nodeSeq输入本文的神经网络模型DyCDUP中,在邻域层和时序层的联合表示学习中进行训练,得到用户的最终特征向量;将两个用户节点特征向量进行hadmard编码作为两个用户间交互特征,用t‑ttl至t时段所有的已存在的交互特征输入逻辑回归分类器中进行训练;最后通过将两个用户的交互特征输入训练好的逻辑回归分类器中,预测t+1时段两者产生交互的概率。本发明能够提供更准确的用户未来的交互预测效果,对未来的交互行为进行有效预测。
主权项:1.一种社交网络中用户未来交互行为预测方法,其特征在于,该方法包括:S1、通过社区感知的时序有偏游走获取第t-ttl时段至第t时段节点的初始编码向量和邻域序列;节点指社区内的用户;S2、采用第t-ttl时段至第t时段节点的初始编码向量和邻域序列在DyCDUP模型联合表示学习中进行训练,直到满足预设的训练条件,DyCDUP模型训练结束,输出节点的最终特征向量;所述DyCDUP模型依次包括邻域注意力层和时序注意力层;邻域注意力层用于聚合同一社区结构内节点的交互情况,时序注意力层用于沿时段捕捉节点之间交互的演化情况;S3、利用S2中输出节点的最终特征向量,选择两个样本节点的最终特征向量进行hadmard编码得到两个样本节点的交互特征向量,联合两个样本节点的真实交互情况做正负采样,正采样指已发生的所有交互信息,负采样指已存在的交互中未发生的交互,采样的结果用来训练逻辑回归分类器;S4、从节点的最终特征向量集合中,挑选两个目标节点的特征向量组成交互特征向量输入训练好的逻辑回归分类器,预测出两个目标节点的未来交互概率;S1中通过社区感知的时序有偏游走获取第t-ttl个时段至第t个时段节点的初始编码向量,包括:以第t时段中最后交互发生的时间为初始时间,,节点按照时间逆向游走,每次根据随机游走概率在邻域邻居中选择出下一个节点,重复选择下一个节点多次,直到游走序列达到l次,且每个节点作为起始节点游走ω次,从而获得节点由社区感知的游走序列,根据所述游走序列通过word2vec算法得到第t时段节点的初始编码向量;所述的邻域邻居包括时序邻居和社区邻居;具体地,节点在k时刻的游走选择下一个节点是通过以下规则进行:基于设定的社区感知的随机游走参数,每次选择下一个节点时,生成一个随机数,依据随机游走概率选择下一个节点,当时,下一个节点从k时刻的时序邻居中选择作为下一个的节点,否则,选择相同社区中的社区邻居的一个节点作为下一个节点;所述随机游走概率的函数为:;其中,表示随机游走参数,表示随机数,表示k时刻的相同社区内时序邻居被选择的概率;表示k时刻的相同社区内社区邻居被选择的概率;S1中所述邻域序列的获取包括:根据所述获得节点由社区感知的游走序列,得到节点的邻域序列,,即节点序列按照时间戳降序排列,依次遍历每一条时间逆向游走后的邻域序列,取邻域序列中节点前后固定个数节点加入该节点的邻域集合;S2中所述DyCDUP模型中邻域注意力层训练时的计算方法包括:将第t-ttl时段至第t个时段的节点的初始编码向量定义为D维向量,通过对邻域注意力层的权重公式计算,将D维向量转化为具有维的节点向量;权重系数的计算公式为: ;其中, 表示节点u相对节点v的权重系数;邻域集合是从第i个时段中节点v的邻域序列NodeSeq中获取的,V表示网络中的节点集合,T'表示交互事件发生的时间戳集合,Et表示t时刻网络中所有节点的交互集合,节点v前后预设数个节点作为邻域集合,是邻域集合中的一个节点,是一个转移矩阵;是邻域注意力层的模型函数的权重向量参数;表示串联运算,是非线性激活函数,表示当前动态网络时刻中边的权重,表示i时刻节点v的初始编码向量;根据相对于节点v的权重系数,计算第i个时段v节点的邻域嵌入;计算公式为:;其中表示激活函数LeakyRELU,表示第i时段节点v的初始编码向量,表示邻域注意力层的转移矩阵,表示第i时段节点u相对节点v的权重系数;对所述邻域嵌入的向量采用个多头机制的拆分,得到子向量,在子向量之间进行自注意力计算,对于节点所得的嵌入向量,多头机制的具体计算公式为: ; , , ;其中表示邻域注意力层在i时段最终输出的节点v的嵌入表示,将第i时段的各节点最终输出的嵌入向量最终表示为,;表示t时段网络中所有节点的特征向量集合,F表示向量维度;qu表示邻域注意力层的query,ke表示邻域注意力层的key,va表示邻域注意力层的value;、、均表示转移矩阵;各时段经过邻域注意力层的训练后,最终输出 ;S2中所述时序注意力层的计算方法包括:将邻域注意力的输出作为时序注意力层输入,其中,是时段的总个数,;计算时序注意力层的注意力权重系数,计算公式如下: ; ;其中是v节点的注意力权重矩阵,是中第i时段到第j时段的注意力权重系数,表示v节点i时段发生的交互信息对第j时段的影响,表示矩阵的中间维度;时序注意力机制中的分别为,,,Qt表示邻域注意力层的query,Kt表示邻域注意力层的key,Vt表示邻域注意力层的value,并且,,,,表示转移矩阵;根据相对于v节点的注意力权重系数,计算第i时段v节点的时序嵌入;计算公式为:;其中是中第t'时段到第i时段的注意力权重系数,Wt是时序注意力层的转移矩阵;与邻域注意力层同理,对所述时序嵌入的向量采用个多头机制的拆分,得到子向量,在子向量之间进行自注意力计算,得到,表示i时段的用户节点数量。
全文数据:
权利要求:
百度查询: 重庆大学 一种社交网络中用户未来交互行为预测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。