Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜昆明理工大学黄于欣获国家专利权

恭喜昆明理工大学黄于欣获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜昆明理工大学申请的专利融入事件知识的汉越跨语言事件检索方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117009458B

龙图腾网通过国家知识产权局官网在2025-05-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310849936.0,技术领域涉及:G06F16/334;该发明授权融入事件知识的汉越跨语言事件检索方法是由黄于欣;邓同杰;余正涛;线岩团设计研发完成,并于2023-07-12向国家知识产权局提交的专利申请。

融入事件知识的汉越跨语言事件检索方法在说明书摘要公布了:本发明涉及融入事件知识的汉越跨语言事件检索方法,属于自然语言处理技术领域。本发明包括:构建汉越跨语言事件预训练模块进行持续预训练来改善模型在汉越低资源语言上的表征效果,并通过对事件知识的掩盖预测值与真实值基于对比学习进行差异判别,促使模型更好地理解和捕捉事件知识特征。本发明提出的融入事件知识的汉越跨语言事件检索方法,相比信息检索,跨语言事件检索增强了对查询中事件要素的关注,以确保目标检索事件与查询之间的一致性,在舆情事件的精准监控等任务中发挥着重要的作用。

本发明授权融入事件知识的汉越跨语言事件检索方法在权利要求书中公布了:1.融入事件知识的汉越跨语言事件检索方法,其特征在于:所述方法的具体步骤如下:Step1、在汉越维基百科和越南新闻网采集相应对齐数据,对数据集进行预处理,构建实验数据集;Step2、构建汉越跨语言事件预训练模块进行持续预训练来改善模型在汉越低资源语言上的表征效果,并通过对事件知识的掩盖预测值与真实值基于对比学习进行差异判别,促使模型更好地理解和捕捉事件知识特征;Step3、在Step2的基础上,将模型在汉越检索数据集上进行微调,进一步提升模型在汉越跨语言检索上的性能,检测出与查询提及事件一致的越南语文档;所述Step2包括:Step2.1、构建汉越跨语言事件预训练模块包括在基础的mbert模型新增两个新的预训练任务模块;两个新的预训练任务模块包括触发词掩盖预测模块TMP和检索建模排序模块RS,模型对于不同的预训练模块采用不同的输入语言对;通过触发词掩盖预测模块TMP将语言对中标注好的触发词进行掩盖,并将预测结果映射到全词表上不断纠正模型的预测准确性;通过检索建模排序模块RS对查询召回文档这一过程进行建模,构建正例和负例语言对,不断优化模型对于正负例的判别,改进模型在检索下游任务上的排序准确性;Step2.2、在Step2.1的基础上,构建基于对比学习的生成鉴别器模块GDC,将预测结果映射到触发词表上,对事件知识的掩盖预测值与真实值基于对比学习进行差异判别,促使模型更好地理解和捕捉事件知识特征;所述Step2.1中,通过触发词掩盖预测模块TMP将语言对中标注好的触发词进行掩盖,并将预测结果映射到全词表上不断纠正模型的预测准确性的具体步骤如下:Step2.1.1、针对触发词掩盖预测的输入序列x,使用了Bert模型的MLM预训练任务中的Bert模型预测头线型层组件,对被掩盖的触发词进行预测并将结果映射在全词表标签空间上,并通过softmax层获得最终全词表的标签预测概率分布: 其中,pxt|x是全词表的标签预测概率分布,xt是输入序列x中t位置索引语言对被屏蔽的触发词,hJx是Bert模型预测头的输出,fδ是线型层模块,其将被掩盖的词向量映射到全词表标签空间δ;Step2.1.2、使用交叉熵损失来计算每个触发词掩码预测的目标;训练过程中按照6:2:2的随机概率从匹配到的触发词列表中随机采样一个、两个或三个触发词,并将其掩盖在查询文本中;在匹配掩盖的过程中,仍有部分概率将掩盖触发词的数量设置为2或3; 其中ltmp是TMP模块的损失,是触发词在全词表标签空间的真实标签,是被掩盖的触发词在全词表标签空间的对应真实概率标签分布。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人昆明理工大学,其通讯地址为:650500 云南省昆明市呈贡区景明南路727号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。