首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于网页正文内容的问题式查询推荐方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京理工大学

摘要:本发明提出了一种基于网页正文内容的问题式查询推荐方法,属于计算机网络信息检索查询推荐技术领域。所述基于网页正文内容的问题式查询推荐方法依托的查询推荐系统包括问题式查询生成模块和问题式查询推荐模块,包括以下步骤:S1,生成问题式查询,具体为:以网页正文文本段和关键字作为输入,使用神经网络模型生成一个基于网页正文文本段与关键字相关的问题式查询,重复该过程,得到N个问题式查询。S2,以问题式查询之间的相似度作为衡量标准筛选由S1得到的N个问题式查询,作为查询推荐的最终结果。所述方法在摆脱了对用户检索日志的依赖的同时,能更好的帮助用户表达信息需求。

主权项:1.一种基于网页正文内容的问题式查询推荐方法,其特征在于:依托的查询推荐系统包括问题式查询生成模块和问题式查询推荐模块;其中,问题式查询生成模块是一个神经网络模型,该模型根据输入的网页正文和关键字,生成一个基于网页正文内容与关键字相关的问题式查询;其中,编码器包括双向LSTM层、注意力层1及特征融合门,且三者依次相连,即:双向LSTM层与注意力层1相连,注意力层1与特征融合门相连;其中,双向LSTM层的输入为编码器的输入,特征融合门的输出即为编码器的输出;双向LSTM层将网页正文和关键字进行编码输出<文本,关键字>向量表示;注意力层1将隐藏状态通过自注意力机制计算自匹配的向量表示;特征融合门通过可训练的门控向量,融合<文本,关键字>向量表示和自匹配的向量表示,选择有价值的信息组成中间向量表示;解码器包括单向LSTM层、注意力层2、拷贝层以及输出层,且四者依次连接,即:单向LSTM层与注意力层2相连,注意力层2与拷贝层相连,拷贝层与输出层相连;其中,单向LSTM层的输入为解码器的输入,输出层的输出即为解码器的输出;单向LSTM层结合编码器生成的中间向量表示和在当前生成词之前所有经过解码器的输出词向量表示得到单向LSTM层的隐藏状态;注意力层2计算当前解码器隐藏状态与编码器最终输出的所有隐藏状态的注意力值;拷贝层计算拷贝分数和生成分数;输出层通过拷贝分数和生成分数计算概率分布,根据概率分布的结果选择概率最大的单词输出;问题式查询推荐模块以问题式查询之间的相似度作为衡量标准,计算生成的问题式查询两两之间的句子相似度得到相似度矩阵;将每个查询与当前查询的相似度从高到低的排名作为权重,选择前A名查询输出;所述基于网页正文内容的问题式查询推荐方法,包括以下步骤:步骤1:生成问题式查询,具体为:以网页正文文本段和关键字作为输入,使用问题式查询生成模块生成一个基于网页正文文本段与关键字相关的问题式查询,重复该过程,得到N个问题式查询;其中,生成每个基于网页正文文本段与关键字相关的问题式查询,具体包括如下子步骤:步骤1.1:将网页正文文本段和关键字输入双向LSTM层进行编码,并将前向传播和后向传播两个方向上的所有隐藏状态拼接起来,用H表示;步骤1.2:在注意力层1将经双向LSTM层编码的<文本,关键字>向量表示ht作为输入;通过自注意力机制与H计算自匹配向量表示st;步骤1.3:利用特征融合门获得中间向量表示步骤1.4:解码,将编码器生成的中间向量表示和解码器在前t-1时刻输出的所有单词的向量表示y1,y2,...,yt-1均作为第t时刻解码器的输入,将编码器最后一个神经元的隐藏状态作为d0输入到解码器中;步骤1.5:在注意力层2,计算注意力值和输出隐藏状态;步骤1.6:在拷贝层计算拷贝分数和生成分数,并将拷贝分数和生成分数拼接起来,通过softmax函数计算t时刻在所有词语上的概率分布,根据概率分布的结果选择概率最大的单词输出;步骤1.7:重复步骤1.4至步骤1.6,直到模型输出终止符,标志着当前问题生成已结束,模型输出的句子为一个问题式查询;步骤2:进行问题式查询推荐,具体为:筛选步骤1得到的N个问题式查询,选择其中最具有代表性的问题式查询,作为查询推荐的最终结果,包括以下子步骤:步骤2.1:利用BERT得到问题式查询的句向量表示,计算N个问题式查询两两之间的余弦相似度,得到相似度矩阵;步骤2.2:将每个问题式查询与当前问题式查询对应的相似度矩阵中的相似度值从高到低的排名作为权重,根据需要,选择前A名查询输出。

全文数据:

权利要求:

百度查询: 北京理工大学 一种基于网页正文内容的问题式查询推荐方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。