首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种融合了图结构与文本特征的好友推荐方法 

申请/专利权人:东方财富信息股份有限公司

申请日:2021-10-11

公开(公告)日:2024-05-28

公开(公告)号:CN113901333B

主分类号:G06F16/9536

分类号:G06F16/9536;G06F16/901;G06Q50/00;G06N3/0464;G06N3/042;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2024.05.28#授权;2022.01.25#实质审查的生效;2022.01.07#公开

摘要:本发明涉及一种融合了图结构与文本特征的好友推荐方法,用于从推荐集中取推荐用户向被推荐用户进行推荐。本发明获取用户访问网络社区中不同网络板块的轨迹,以网络板块为基准对用户进行图信息编码,在构建关系图时不需要其他用户的信息,不需要对所有用户进行全量计算,因此计算量更小,且构建得到的关系图不受新用户加入影响。采用本发明的技术方案,在新用户加入后,不需要更新已经构建的关系图。已构建的关系图只受网络社区中网络板块变动的影响,但网络社区一旦建立后,网络社区中的各个网络板块相对固定,不易发生变动。

主权项:1.一种融合了图结构与文本特征的好友推荐方法,用于从推荐集中取推荐用户向被推荐用户进行推荐,其特征在于,包括以下步骤:步骤1、取网络社区中发布信息活跃度高的用户,将这些用户定义为推荐用户,所有推荐用户组成推荐集;步骤2、若被推荐用户为完全没有任何信息的新用户,则从推荐集中取任意一个推荐用户向被推荐用户推荐;若被推荐用户有信息,则依据被推荐用户的信息,获得被推荐用户的图结构特征或者文本特征,并依据推荐用户的信息计算得到推荐集中每个推荐用户的图结构特征或文本特征;其中,将推荐用户及被推荐用户统一定义为用户,则获得用户的图结构特征包括以下步骤:第一步、建立用户的关系图;目标网络社区中有不同的网络板块且某些网络板块具有至少一个属性标签,将每个网络板块定义为要构建的关系图中的一个网络板块节点,将每个属性标签定义为属性节点,则采用以下步骤构建用户的关系图:步骤101、基于当前用户访问目标网络社区中不同网络板块的轨迹,获得其所访问的所有I个网络板块以及I个网络板块具有的所有J个属性标签;步骤102、获得与I个网络板块存在关联关系的另外所有K1个网络板块,并获得与所有J个属性标签存在关联关系的除I个网络板块及K1个网络板块外的所有K2个网络板块;步骤103、建立用户节点、I+K1+K2个网络板块节点以及J个属性节点,用户节点为第0个节点;步骤104、用边将用户节点与I网络板块节点相连,并且依据网络板块之间的关联关系以及网络板块与属性标签之间的关联关系,将存在关联关系的网络板块节点之间以及网络板块节点与属性节点之间用边连接;步骤105、计算各条边的权重;步骤106、建立得到当前用户的关系图,设I+K1+K2=B,则该关系图的邻接矩阵为维度B+J+1×B+J+1的矩阵A;第二步、对第一步得到的关系图采用图卷积神经网络为结构信息编码,关系图中各个节点的初始特征为单位矩阵,经过图卷积神经网络编码后,获得关系图中用户节点的特征,将该特征作为用户的图结构特征:对于l+1层GCN,其第l+1层的输出表示为Hl+1,记为:Hl+1=GCNA,Hl;采用两层图卷积神经网络为关系图结构信息编码,则有:H1=GCNA,H0H2=GCNA,H1用户节点是第0个节点,取H2[0]作为用户的图结构特征,则将推荐用户的图结构特征记为Hp2[0],被推荐用户的图结构特征记为Hr2[0];将推荐用户及被推荐用户统一定义为用户,则获得用户的文本特征包括以下步骤:步骤A、取推荐用户发帖的文本数据或者取被推荐用户浏览贴子的文本数据;步骤B、将文本数据分词去停用词后,对获得的分词取关键词;步骤C、将关键词转换为词向量后,将所有词向量拼接成词向量矩阵;步骤D、词向量矩阵经过最大池化max-pooling获得文本特征V,将推荐用户的文本特征进一步记为Vp,表示用户发布内容的文本特征,将被推荐用户的文本特征进一步记为Vr,表示用户阅读内容的文本特征;步骤3、基于步骤2获得的被推荐用户的图结构特征或者文本特征以及推荐用户的图结构特征或者文本特征,得到以下四个二维关系矩阵中的至少一个:推荐用户的图结构特征Hp2[0]与被推荐用户的图结构特征Hr2[0]、推荐用户的图结构特征Hp2[0]与被推荐用户的文本特征Vr、推荐用户的文本特征Vp与被推荐用户的图结构特征Hr2[0]、推荐用户的文本特征Vp与被推荐用户的文本特征Vr之间分别做二维关系矩阵计算,得到四个二维关系矩阵分别表示为R0、R1、R2、R3;R0=Wr0*Hp2[0]T×Hr2[0]+br0R1=Wr1*Hp2[0]T×Vr+br1R2=Wr2*VpT×Hr2[0]+br2R3=Wr3*VpT×Vr+br3式中,Wr0、Wr1、Wr2及Wr3分别表示关系计算权重参数,br0、br1、br2及br3分别表示关系计算偏置项;步骤4、建立多层全连接神经网络Fully,多层全连接神经网络对步骤3得到的二维关系矩阵R0、R1、R2和或R3降维成固定的维度2,用softmax层输出推荐用户与被推荐用户能成为好友的概率,其中:四个二维关系矩阵Ro、R1、R2、R3的组合,可以计算以下7组概率值P0、P1、P2、P3、P4、P5、P6中的一组概率值,将计算得到的概率值最为最终输出的概率: 式中,记n层全连接神经网络的计算为Fullyn,则表示2层全连接神经网络对二维关系矩阵R0的计算,表示2层全连接神经网络对二维关系矩阵R1的计算,表示2层全连接神经网络对二维关系矩阵R2的计算,表示2层全连接神经网络对二维关系矩阵R3得到的输出,且多层全连接神经网络在计算P4、P5及P6时共享及若通过步骤3仅得到二维关系矩阵R0,则多层全连接神经网络输出概率值P0为最终输出的概率;若通过步骤3仅得到二维关系矩阵R1,则多层全连接神经网络输出概率值P1为最终输出的概率;若通过步骤3仅得到二维关系矩阵R2,则多层全连接神经网络输出概率值P2为最终输出的概率;若通过步骤3仅得到二维关系矩阵R3,则多层全连接神经网络输出概率值P3为最终输出的概率;若通过步骤3得到二维关系矩阵R0、R2,则多层全连接神经网络输出概率值P4为最终输出的概率;若通过步骤3得到二维关系矩阵R1、R3,则多层全连接神经网络输出概率值P5为最终输出的概率;若通过步骤3得到二维关系矩阵Ro、R1、R2、R3,则多层全连接神经网络输出概率值P6为最终输出的概率。

全文数据:

权利要求:

百度查询: 东方财富信息股份有限公司 一种融合了图结构与文本特征的好友推荐方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。