首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种科研合作伙伴推荐方法、系统及存储介质 

申请/专利权人:安徽大学

申请日:2024-04-10

公开(公告)日:2024-07-05

公开(公告)号:CN118296477A

主分类号:G06F18/2411

分类号:G06F18/2411;G06F18/2415;G06F18/213;G06F40/284

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.07.23#实质审查的生效;2024.07.05#公开

摘要:一种科研合作伙伴推荐方法、系统及存储介质,属于计算机信息技术领域,解决现有技术的合作伙伴推荐算法是在表示两个实体之间的二元关系的传统图的基础上设计的,忽视了论文数据集本身具有的高阶网络结构,导致难以识别网络中的复杂结构的问题;本发明利用超图对论文合作关系进行建模,考虑到同一个社区的研究者往往联系紧密,设计适用于超图的局部社区检测算法,从而找到具有相似研究方向和兴趣的合作者;本发明考虑到论文数据集本身具有的高阶网络结构;使用局部社区检测技术,而不需要遍历整个论文合作网络,提高了推荐效率;同时考虑到论文合作者共同研究方向、兴趣和论文合作者之间的网络结构特点,提高了推荐准确性。

主权项:1.一种科研合作伙伴推荐方法,其特征在于,包括以下步骤:S1:利用论文数据构建超图GV,E,其中,V表示节点集合,每个节点代表一个作者;E表示超边集合,每个超边表示该超边相连的节点对应的作者合作发表一篇论文,该论文的正文及摘要内容作为此超边的属性;S2:利用超图GV,E构建线图GlinkVlink,Elink,其中,Vlink表示线图的节点集合,每个节点代表超图GV,E中的一条超边,Elink表示线图的边集合;S3:提取线图中节点的特征向量,提取每个节点的属性的关键词,并将其转换为特征向量;具体步骤如下:S31:分词,对于每个节点的文本属性,利用分词工具将其分为短语;S32:获取关键词,计算短语的词频TF和逆文档频率IDF,词频TF和逆文档频率IDF分别由公式1和2计算得到;在此基础上,将词频TF和逆文档频率IDF相乘,获得TF-IDF值;选择前k个关键词,获得关键词集合K={k1,k2,...,kn}; S33:提取特征向量;将节点vlink的关键词集合K={k1,k2,...,kn}输入到Bert模型,得到关键词对应的向量其中,为节点vlink的特征向量,分别为向量的n个元素;S4:在线图GlinkVlink,Elink上进行社区检测,获得社区ClinkV′link,E′link;并将线图上的社区Clink转为超图上的社区C;具体步骤如下:S41:初始化;社区C仅包含线图中与给定节点u对应的超边节点;S42:使用贪婪策略在线图上检测给定节点所在的社区,从社区的邻居节点中选择使得局部模块度Mhyper增加且增加最多的节点加入到局部社区;S43:重复步骤S42,直到不存在社区邻居节点的被加入社区后使得社区的局部模块度Mhyper增加,则算法结束,Clink转为超图上的社区C;S44:将线图上的社区Clink转为超图上的社区C;对于Clink中的每个节点,若节点的邻居都在社区内,则为社区内部节点,将节点对应的超边中所有节点全部加入社区C中;对于Clink中有邻居在社区外的每个节点,对于节点对应的超边中的每个节点,若该节点的一半以上邻居都在社区C,那么就将其分配到社区C中;S5:为用户u推荐出潜在合作伙伴Pu;具体步骤如下:S51:从社区C中将节点u在GV,E中的邻居删除;S52:将社区中的节点按照权重w1降序排序,生成推荐列表,选取TOP-K节点,即Pu,推荐给用户u。

全文数据:

权利要求:

百度查询: 安徽大学 一种科研合作伙伴推荐方法、系统及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。