买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:哈尔滨理工大学
摘要:本发明公开了一种基于图结构整体和部分的社交网络意见领袖挖掘方法,属于社交网络分析技术领域,包括:爬取社交网络中用户语义信息并进行预处理;利用LDA模型将处理后的语义信息抽象为主题,提取关键字,将主题和关键字作为特征属性;将LDA模型生成的K个主题作为向量空间,堆叠成数据矩阵建立用户社交网络;利用基于密度的社区发现方法对用户社交网络进行社区划分,得到社区结构;基于图的整体结构计算社区结构中所有用户节点整体、局部影响力;融合所有用户节点整体、局部影响力进行影响力评估,得到所有用户节点影响力评分,将排在预设阈值前的用户节点作为意见领袖。该方法考虑因素的多样性保证了网络意见领袖挖掘的准确性和有效性。
主权项:1.一种基于图结构整体和部分的社交网络意见领袖挖掘方法,其特征在于,包括以下步骤:步骤S1,爬取社交网络中用户个体的语义信息,并进行预处理得到初始语义信息;步骤S2,利用LDA模型将所述初始语义信息抽象为主题,在所述主题中提取关键字,并将所述主题和所述关键字作为所述初始语义信息的特征属性;步骤S3,将LDA模型生成的K个主题作为基于K维的向量空间,每个用户节点均以K维向量表示,堆叠成数据矩阵,以建立用户社交网络;步骤S4,利用基于密度的社区发现方法对所述用户社交网络进行社区划分,得到社区结构;步骤S5,基于图的整体结构计算所述社区结构中所有用户节点整体影响力;步骤S6,基于图的局部结构计算所述社区结构中所有用户节点局部影响力;以及步骤S7,融合所述所有用户节点整体影响力和所述所有用户节点局部影响力进行影响力评估,得到并降序排列所有用户节点影响力评分,将排在预设阈值前的用户节点作为社交网络的意见领袖;所述步骤S5中通过计算两个用户节点之间的公共节点个数反映节点的信息交互能力,所述信息交互能力的计算公式为: 其中,Totalvi为所有用户节点整体影响力,和为用户节点vi和vj的邻居节点,为与用户节点vi存在公共邻居节点的所有节点集合,为用户节点vi和用户节点vj的所有最近邻居节点的公共节点个数,powX,Y为X的Y次幂,ωvi为用户节点vi的所有边权值之和,A为常数;所述步骤S6中通过计算用户节点的所有邻居节点的度中心性,需考虑用户节点与用户节点之间的连接数量在社区结构中的总参与程度,并且通过计算用户节点的所有邻居节点的贡献概率,作为用户节点的局部影响力,其中,所述度中心性的计算公式为: 式中,DCvi为用户节点的所有邻居节点的度中心性,n为用户节点的总数,dvi为用户节点vi的度数;所述总参与程度的计算公式为: 式中,为用户节点与用户节点之间的连接数量在社区结构中的总参与程度,dvi为用户节点vi的度数,ωvi为用户节点vi的所有边权值之和,τ为正调优参数;所述贡献概率的计算公式为: 式中,pvi为用户节点的所有邻居节点的贡献概率,为用户节点vi所有邻居节点的平均度;所述用户节点的局部影响力的计算公式为: 其中,Localvi为用户节点的局部影响力,vj为用户节点,为用户节点vi的邻居节点,为用户节点与用户节点之间的连接数量在社区结构中的总参与程度,pvj为用户节点的所有邻居节点的贡献概率。
全文数据:
权利要求:
百度查询: 哈尔滨理工大学 基于图结构整体和部分的社交网络意见领袖挖掘方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。