买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国科学院计算技术研究所
摘要:本发明提供一种基于异质学术网络进行学者画像的方法,包括:获取待画像的中心学者信息以及进行画像的属性设置,所述属性设置包括学者的属性信息和或为学者具备该属性信息的概率所设定的相应阈值;利用预先训练好的属性概率分布模型计算所述中心学者具备所述属性信息的概率,其中,所述属性概率分布模型是以异质学术网络中的学者信息为输入,以所述学者具备所述属性信息的概率为输出,通过训练获得;以及依据满足所述属性设置的属性信息对所述中心学者进行画像。本发明的学者画像方法充分利用了异质学术网络的多语义信息对学者的属性信息进行刻画,提高了画像的准确性。
主权项:1.一种基于异质学术网络进行学者画像的方法,包括:获取待画像的中心学者信息以及进行画像的属性设置,所述属性设置包括学者的属性信息和或为学者具备该属性信息的概率所设定的相应阈值;利用预先训练好的属性概率分布模型计算所述中心学者具备所述属性信息的概率,包括:依据所述中心学者查找所述异质学术网络中包含所述中心学者的异质学术子网络;约简所述异质学术子网络,并将其转换为包含异质语义的同质学术子网络;根据所述同质学术子网络中所述中心学者的邻域特征更新所述中心学者的特征;以及基于更新后所述中心学者的特征计算所述中心学者具备所述属性信息的概率,其中,所述属性概率分布模型是以异质学术网络中的学者信息为输入,以所述学者具备所述属性信息的概率为输出,通过训练获得;其中,根据所述同质学术子网络中所述中心学者的邻域特征更新所述中心学者的特征包括通过加权邻域聚合的方式提取所述同质学术子网络中所述中心学者的邻域特征,包括:获取所述同质学术子网络中其他节点相对于所述中心学者的权重,公式如下:αj=σWc@[xi–xj,ei,j]+bc其中,αj表示同质学术子网络中其他节点相对于所述中心学者的权重,σ表示sigmoid函数,Wc和bc表示线性的参数,xi表示中心学者的特征向量,xj表示其他节点的特征向量,ei,j表示中心学者与其他节点之间的异质语义向量;以及依据所述权重计算所述中心学者的邻域特征,公式如下: 其中,hi表示中心学者的邻域特征向量,|Ni|表示同质学术子网络中节点的数量,Φ表示非线性转换函数,Wm、bm表示线性层参数,xj表示其他节点特征向量,ei,j表示中心学者与其他节点之间的异质语义向量;以及依据满足所述属性设置的属性信息对所述中心学者进行画像。
全文数据:
权利要求:
百度查询: 中国科学院计算技术研究所 一种基于异质学术网络进行学者画像的方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。