买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京深言科技有限责任公司
摘要:本发明实施例公开了一种基于语义显著性的句子语义检索方法及系统,对句子进行编码,得到句子对应的整体向量和句子中每个词对应的语境化编码;其中,句子包括第一句子和第二句子;基于句子中每个词与句子的语义关系,计算每个词的语义显著性,得到语义显著性知识;基于所述第一句子和所述第二句子中每个词对应的语境化编码和语义显著性,计算所述第一句子和所述第二句子的语义相似度,得到语义相似度信息;采用对比学习方法学习所述语义相似度信息,并将所述语义显著性知识蒸馏至预训练语言模型中,使所述预训练语言模型学习到好的语义信息编码能力。该基于语义显著性的句子语义检索方法解决现有技术中无法准确辨识句子语义重点的问题。
主权项:1.一种基于语义显著性的句子语义检索方法,其特征在于,所述方法具体包括:对句子进行编码,得到句子对应的整体向量和句子中每个词对应的语境化编码;其中,句子包括第一句子和第二句子;基于句子中每个词与句子的语义关系,计算每个词的语义显著性,得到语义显著性知识,包括:通过公式1计算第i个词的原始语义显著性; 式中,为第i个词的原始语义显著性,S为句子,为特殊词的语境化编码,为句子第i个词的语境化编码;对句子中每个词的原始语义显著性进行中心化,将句子中每个词的原始语义显著性减去总体的均值;通过ReLU函数对负值部分进行裁剪,得到每个词的语义显著性;基于所述第一句子和所述第二句子中每个词对应的语境化编码和语义显著性,计算所述第一句子和所述第二句子的语义相似度,得到语义相似度信息,包括:通过公式2计算第一句子和第二句子的语义相似度; 式中,fbis1,s2为第一句子和第二句子的语义相似度,funis1,s2为第一句子到第二句子的单向语义相似度,funis2,s1为第二句子到第一句子的单向语义相似度;采用对比学习方法学习所述语义相似度信息,并将所述语义显著性知识蒸馏至预训练语言模型中,使所述预训练语言模型学习到好的语义信息编码能力,包括:通过公式3计算预训练语言模型训练的损失函数: 式中,τ为一个可调的温度超参数,fbi为对称的语义相似度计算函数,si为原句子,为正例句子。
全文数据:
权利要求:
百度查询: 北京深言科技有限责任公司 基于语义显著性的句子语义检索方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。