一种推荐架构下的基于对比学习调优的论文作者消歧方法

导航：龙图腾网> 最新专利技术> 一种推荐架构下的基于对比学习调优的论文作者消歧方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：浙江大学

摘要：本发明公开了一种推荐架构下的基于对比学习调优的论文作者消歧方法。本发明将论文作者消歧任务抽象为单塔推荐架构下的推荐排序问题。提出基于WideDeep推荐架构的排序算法解决基于表示的深度学习模型的语义漂移问题，实现基于多字段多实例注意力机制的深度模型与基于特征工程的线性模型相结合，使模型同时具备较强的泛化能力与记忆能力。此外，注意到真实匹配对之间应存在一定潜在模式的数据特点，针对性提出一种对比学习调优算法，引入对比学习损失，构建对比学习的正负样本，促使模型学习区分真实匹配对的高层次特征。

主权项：1.一种推荐架构下的基于对比学习调优的论文作者消歧方法，其特征在于，包括以下步骤：步骤1：获取已有的专家档案库G＝E，P，EP，F，其中E是专家集合，ei表示第i个专家，P是已消歧论文集合，EP是专家与已消歧论文的著作权从属关系集合，定义为{epi,j∈EP|专家ei的j篇论文}，F是属性字段集合；步骤2：对于待消歧论文作者对＜p，a∈PA，其中PA是待消歧论文作者对集合，p，a分别是论文和作者姓名，首先根据作者姓名a在专家档案库G中找到相关的候选专家实体集合CN，最终的候选集合C＝CN∪NIL，其中CN为专家档案库中匹配到的专家实体集合，NIL为不可链接指称项，代指不存在于已有专家档案库中的专家实体；将真实匹配专家记为c*，则c*∈C；步骤3：对于每个候选专家c∈C，将其发表的论文信息与待消歧论文作者对信息分别通过Wide模型和Deep模型得到浅层特征与深层特征的相似度向量表示，并拼接获得最终的相似度向量表示Simc；所述的步骤3具体为：步骤3-1：对于Wide模型，首先利用其内的浅层特征构建模块构建简单的线性特征Xp，a，c＝[X1＜p，a，c，...，Xn＜p，a，c]，其中，n为Wide模型使用的浅层特征数；然后通过两层线性层MLP生成浅层相似度向量表示χp，a，c：χp，a，c＝MLPXp，a，c步骤3-2：Deep模型基于不同属性字段与不同论文对消歧结果的影响，分别建模全局相似度编码模块与局部相似度编码模块，分别获得全局相似度向量表示和局部相似度向量表示，并融合获得深层相似度向量表示所述的步骤3-2具体包括如下步骤：步骤3-2-1：全局相似度编码模块利用候选专家c的所有论文，根据属性字段f∈F分组进行相似度计算，并使用注意力机制体现不同字段对相似度向量表示的影响，计算全局相似度向量表示φ＜p，a，c；步骤3-2-2：局部相似度编码模块基于专家发表的论文有多个主题的假设，认为待消歧论文只与部分候选专家论文强相关，而剩余论文弱相关甚至不相关，因此单独对待消歧论文与候选专家每一篇论文进行相似度编码；最终同样使用注意力机制体现不同论文的影响，计算局部相似度向量表示ψ＜p，a，c；步骤3-2-3：获得全局相似度向量表示与局部相似度向量表示后，拼接并通过3层线性层获得深层相似度向量表示其中表示拼接操作：步骤3-3：获得浅层相似度向量表示χp，a，c与深层相似度向量表示后，拼接获得相似度向量表示Simc：步骤4：应用打分模块对每一个候选实体c与待消歧论文作者对之间的相似度进行打分，获得分数Sc：Sc＝FCSimc步骤5：分数Sc最高的候选实体c被认为是匹配实体；所述的方法在实际应用前还包括训练阶段，训练阶段通过训练集进行训练，训练完成后再应用于论文作者消歧；其中，在训练阶段，计算损失函数包括：排序损失与对比学习损失；计算对比学习损失：对每个batch构建对比学习使用的正负样本；以batch中某一query的真实匹配对的相似度向量为锚点，与另一query的构成正例对，而与同一query内所有的非真实匹配对的相似度向量构成负例对；使用L2距离公式计算对比学习损失计算排序损失：计算最终损失其中α是排序损失权重，||Θ||2是模型的L2正则化惩罚项，λ是对应的权重系数。

全文数据：

权利要求：

百度查询：浙江大学一种推荐架构下的基于对比学习调优的论文作者消歧方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：为牵引电池充电的充电电路和方法、电动车辆

下一篇：一种热网加热器换热管泄漏在线定位系统及方法

相关技术

为牵引电池充电的充电电路和方法、电动车辆

一种热网加热器换热管泄漏在线定位系统及方法

高端计算机处理器用散热器及其制造方法

一种低硬度彩色天然橡胶材料及其制备方法

用于工业环境中对象的质量评估的方法和系统

一种高功率密度增速齿轮箱的模态测试方法

一种多光子显微镜中光亮强度的自动调节装置

内走线鱼竿的摇柄隐藏结构

化合物、有机电致发光元件用材料、有机电致发光元件和电子设备

一种矿山采空区顶板离层测量装置及其测量方法

塔式光热发电背板冲压平直度仿真模拟评价方法

一种竹浆纸制备用破碎分削切片装置

论文相关技术

基于多智能体的材料论文信息处理方法及系统_金旸(厦门)新材料科技有限公司_202411059132.1

一种基于图对比学习的学术网络论文分类方法_南昌航空大学_202411442287.3

基于大语言模型的论文选题辅助方法、系统、介质和设备_福建师范大学协和学院_202410826596.4

一种学术论文审稿人的推荐方法_电子科技大学长三角研究院(湖州)_202210204792.9

基于大语言模型的学术论文质量过程性评价系统_国高信息技术产业研究院(山东)集团有限公司_202411365598.4

基于正则化集成学习的多模态细粒度论文分类方法和系统_北京邮电大学_202310834148.4

一种中文议论文智能批改方法及系统_北京华图宏阳网络科技有限公司_202011631779.9

一种基于多任务学习的个性化评论文本推荐方法_中山大学_202011396078.1

一种推荐架构下的基于对比学习调优的论文作者消歧方法_浙江大学_202210060374.7

用于科研论文辅导的数据处理系统和方法、服务器及设备_广州科奥信息技术股份有限公司_202411214669.0

优相关技术

一种音响测试与自动调优方法及系统_成都易瞳科技有限公司_202411049280.5

一种基于物料输送路径寻优的方法、装置及电子设备_中冶南方工程技术有限公司_202111133051.8

电镀场地土壤优控污染源识别方法及系统_生态环境部华南环境科学研究所(生态环境部生态环境应急研究所)_202411438216.6

一种基于自适应寻优模型的血糖变化趋势预测系统_浙江远图技术股份有限公司_201910623149.8

一种基于人工智能的超声传感器阵列扫查波束快速寻优方法_江苏大学_202411014366.4

一种高优值微机电碟形陀螺及其圆片级真空封装方法_北京时代民芯科技有限公司_202411038054.7

一种基于表型与经济性状聚类分析的长柱红山茶优树筛选方法_贵州省生物研究所_202411022056.7

一种三维场景下的实物保护系统启发式动态路径寻优方法_华南理工大学_202410908145.5

一种基于优视摄影测量的高陡边坡灾害监测方法及系统_中铁十九局集团矿业投资有限公司_202411037750.6

一种适用于深厚软土的桩位自动调优的方法和系统_中交第四航务工程勘察设计院有限公司_202411426867.3

作者相关技术

训练神经网络系统来预测交互的动作者的行为_罗伯特·博世有限公司_202410574565.4

作者识别模型的训练方法、装置、设备及存储介质_腾讯科技(深圳)有限公司_202310495352.8

车辆操作者困倦警报_通用汽车环球科技运作有限责任公司_202311390157.5

一种基于操作者隐私保护的塔吊运行预警系统_中铁北京工程局集团北京有限公司_202410724310.1

一种推荐架构下的基于对比学习调优的论文作者消歧方法_浙江大学_202210060374.7

一种论文作者姓名消歧的方法、设备及储存介质_浙江理工大学_202210446111.X

在线文档作者的画像更新方法及装置_北京明略软件系统有限公司_202110880729.2

一种作者流动数据驱动的科研表现测量方法_南京大学_202410700367.8

一种基于多特征融合的恶意代码作者识别与代码侵权检测方法_四川大学_202410452888.6

与加工设备的操作者交互的方法以及系统_罗伯特·博世有限公司_202080090505.5

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种推荐架构下的基于对比学习调优的论文作者消歧方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务