买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:天津大学;起硕(天津)智能科技有限公司
摘要:本发明公开了基于增强方式融合语法信息的深度学习文本匹配方法,所述文本匹配方法建立在编码层、匹配融合层和池化预测层;所述编码层用于在句对编码表示时,对句子做依存句法分析,构造依存句法树,利用深度神经网络提取出句子的依存句法信息和语义信息,将两者相加融合;所述匹配融合层用于在相似度计算时,计算句对之间编码特征的欧式距离,将内积交互矩阵与欧式距离矩阵两者对应位置相减,利用欧式距离增强内积交互过程;所述池化预测层用于加权的池化方式与最大池化方式相拼接组合的池化模块进行信息的池化特征提取,本发明在SNLI和Quora数据集上都验证了对句对精确匹配的能力。
主权项:1.基于增强方式融合语法信息的深度学习文本匹配方法,所述文本匹配方法建立在编码层、匹配融合层和池化预测层;其特征在于:所述编码层将对句对的编码表示进行语法信息的增强过程:对预训练词向量嵌入;应用BiLSTM抽取句子的上下文语义表示信息,如下式所示: 所述编码层用于在句对编码表示时,对句子做依存句法分析,构造依存句法树,利用深度神经网络提取出句子的依存句法信息和语义信息,将两者相加融合获得编码特征;所述编码特征为: 其中:和分别是piqj左子树和右子树的隐藏层单元的输出,之后句子的表示将会被转换和为所述匹配融合层用于在相似度计算时,计算句对之间编码特征的欧式距离,将内积交互矩阵与欧式距离矩阵两者对应位置相减,利用欧式距离增强内积交互过程获得匹配特征;所述匹配特征为: 其中:是可学习的参数;是偏置值,初始化为0,[·;·;·;·;·;·]是拼接操作,⊙是哈达玛积,对于句子Q,应用相同的操作,通过BiLSTM的聚合,最终获得P和Q的融合特征和所述池化预测层对匹配特征采用加权的池化方式与最大池化方式相拼接组合获得语法信息的池化特征输出,其中:通过下式对匹配特征权重归一化处理获得池化特征; 通过下式对池化特征信息进行拼接获得最大池化特征; 对所有的最大池化特征进行拼接获得语法信息的池化特征V输出;
全文数据:
权利要求:
百度查询: 天津大学 起硕(天津)智能科技有限公司 基于增强方式融合语法信息的深度学习文本匹配方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。