首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于多类型学术成果画像及混合推荐策略的个性化推荐方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:同方知网(北京)技术有限公司

摘要:本发明公开了一种基于多类型学术成果画像及混合推荐策略的个性化推荐方法,包括:为用户和学术成果画像,以及对每种学术成果采用合适的推荐策略;所述为用户和学术成果画像包括用户画像、论文画像、期刊画像、学者画像、学科画像与基金画像;对每种学术成果采用合适的推荐策略包括基于项目协同过滤推荐及基于内容推荐。

主权项:1.基于多类型学术成果画像及混合推荐策略的个性化推荐方法,其特征在于,所述方法包括:为用户和学术成果画像,以及对每种学术成果采用合适的推荐策略;所述为用户和学术成果画像包括用户画像、论文画像、期刊画像、学者画像、学科画像与基金画像;所述用户画像,根据用户行为属性信息抽象出的一个标签化的用户模型;具体包括:获取目标用户的最近下载记录和检索记录,然后根据一些规则提取用户关键词,基于词向量模型获取用户关键词的相关词作为用户动态兴趣标签;所述论文画像,获取论文的向量表示后,对论文进行聚合,取类中心文件名,中心文件名的关键词作为该类论文的标签,即为论文进行画像;所述期刊画像是指对作者发文量、作者跨刊发文量、作者论文被引频次、期刊论文被引频次指标分别进行期刊画像;学者画像,是提取学者各维度的属性信息进行信息挖掘和分析应用;对每种学术成果采用合适的推荐策略包括基于项目协同过滤推荐及基于内容推荐;所述论文画像包括论文分类、论文新颖度计算;所述论文分类的划分步骤包括:1从大样本里随机选取几个小样本,采用KMeans、DBSCAN聚类算法对小样本进行聚类;2基于聚合出来的类别对剩下的论文样本进行分类;3对于未分类出来的样本继续执行第1和第2,直到将所有的样本划分好类别;所述论文新颖度的计算包括:1提取目标论文的中心句,中心句由标题和包含前三个关键词的摘要句子组成;2基于BERT模型,获得论文每个中心句的向量表示然后叠加;3获取与目标论文同领域的历史论文的向量表示;4利用simase-lstm网络计算两个向量之间的相似;5计算文本信息量,计算公式为: 其中,论文T,包含λ个词条,n表示不同词条个数,pi表示论文T中第i个词条出现的概率,其中i=1...n;6计算目标论文新颖度值,计算公式为:Nonv=1N+1*ETp1,p2,...,pn;其中,N为历史论文数,所述期刊画像包括:数据层、期刊画像建模层和期刊画像层;所述期刊画像建模层包含基本属性、期刊类别、期刊等级和期刊学术标签;所述基本属性包括:中文名称、拼音刊名、主管单位、主办单位、国际刊号、国内刊号、邮发代号、语种、刊出日期;所述期刊类别通过机器学习中的分类算法或者聚类算法对期刊进行分类;所述期刊等级分为核心期刊和非核心期刊;期刊等级的计算公式为:JLev=w1·Nov+w2·Lev+w3·Aul其中,Nov表示该刊最新一期包含文献的平均新颖度值,Lev表示该刊最新一期包含文献的平均等级,Aul表示该刊最新一期包含作者的平均影响度;所述学者画像包括:数据采集、行为建模和画像构建;所述数据采集包括:采集作者发表的学术成果,并将结果存储在数据库中;行为建模基于机器学习、深度学习、数据挖掘方法对作者学术成果内容进行分析和挖掘;画像构建通过作者的基本属性和挖掘的兴趣标签对作者进行刻画;所述学科画像包括数据层、内容建模层和学科画像层;基金画像包括基金数据采集、基金建模和基金画像;所述基于项目协同过滤推荐包括:1按用户分组,计算所有物品出现的组合列表,得到用户对物品的评分矩阵;2对物品组合列表进行计数,建立物品的同现矩阵;3对评分矩阵转型,论文文件名作为key值,用户id:score作为value值;4合并同现矩阵与评分矩阵,并计算推荐结果列表;5结合用户兴趣获取用户未操作过且预测分值高的论文作为推荐结果存入到MongoDB表中;所述基于内容推荐具体包括:1取用户最近一条下载记录和一条浏览记录;2根据下载记录即论文文件名去数据库进行查询,获取论文的作者、篇名、来源和摘要字段;3根据浏览记录去数据库进行查询,获取论文的作者、篇名、来源和关键词字段,取top3关键词并进行两两搭配,设置不同的权重;4根据1和2的查询条件去日更新表里进行匹配,获取一批候选集,根据发表时间排序取topN作为结果返回。

全文数据:

权利要求:

百度查询: 同方知网(北京)技术有限公司 基于多类型学术成果画像及混合推荐策略的个性化推荐方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。