首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

词权重的生成方法、装置、电子设备及存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京小米移动软件有限公司;北京小米松果电子有限公司

摘要:本公开涉及一种词权重的生成方法、装置、电子设备及存储介质,该方法通过对查询语句进行分词处理,以得到分词后的目标语句本文;按照一个或者多个预设片段划分方式,对目标语句文本进行切分,得到多个文本片段;根据多个文本片段,从预设语料库中获取至少一个目标文本片段,以及至少一个目标文本片段中每个词对应的中间词权重;根据目标文本片段中每个词对应的中间词权重确定目标语句文本中每个词对应的目标词权重。这样,由于无需进行人工标注,因此能够避免出现人工成本较高的问题,由于无需进行多次迭代计算,因此能够有效减少生成词权重过程中需要的计算量,有利于提升词权重的生成效率,并且能够有效保证生成的词权重的准确率。

主权项:1.一种词权重的生成方法,其特征在于,包括:获取用户输入的查询语句,并对所述查询语句进行分词处理,以得到分词后的目标语句文本;按照一个或者多个预设片段划分方式,对所述目标语句文本进行切分,得到多个文本片段;根据多个所述文本片段,从预设语料库中获取至少一个目标文本片段,以及至少一个所述目标文本片段中每个词对应的中间词权重,其中,所述至少一个目标文本片段为所述预设语料库中用于以最少的文本片段数量组成所述目标语句文本的文本片段;根据所述目标文本片段中每个词对应的中间词权重确定所述目标语句文本中每个词对应的目标词权重;所述预设语料库通过以下方式生成:从用户搜索记录数据库中获取预设历史时间段内每组搜索文本对的出现的目标次数,所述搜索文本对包括搜索词和目标搜索语句文本;将所述目标次数大于或者等于预设次数阈值的搜索文本对作为待存文本对,以得到多个所述待存文本对;根据所述搜索词确定多个所述待存文本对中不同的两个所述目标搜索语句文本之间的目标相关度;根据所述目标相关度确定每个所述目标搜索语句文本中每个搜索词的词权重;根据每个所述目标搜索语句文本中每个搜索词的词权重确定预设长度的搜索文本片段中每个搜索词的所述中间词权重;将所述搜索文本片段以及所述搜索文本片段中每个搜索词的中间词权重存储在预设数据库中,以生成所述预设语料库。

全文数据:

权利要求:

百度查询: 北京小米移动软件有限公司 北京小米松果电子有限公司 词权重的生成方法、装置、电子设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。