首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种文本语义分析方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京一笔两划科技有限公司

摘要:本发明公开了一种文本语义分析方法,属于语义分析技术领域,包括以下步骤:S1、获取用户浏览的所有文章文本,生成文章文本集合;S2、将文章文本集合拆分为重点浏览文本子集合和次重点浏览文本子集合;S3、根据重点浏览文本子集合和次重点浏览文本子集合,生成用户的感兴趣词语集合。该方法可以有针对性地确定用户感兴趣的浏览主题,获取用户的浏览反馈,便于后续为用户推荐更准确的文章,提升了文章的可读性,减少了大量用户不喜欢的文章。

主权项:1.一种文本语义分析方法,其特征在于,包括以下步骤:S1、获取用户浏览的所有文章文本,生成文章文本集合;S2、将文章文本集合拆分为重点浏览文本子集合和次重点浏览文本子集合;S3、根据重点浏览文本子集合和次重点浏览文本子集合,生成用户的感兴趣词语集合;所述S3包括以下子步骤:S31、设置浏览影响力模型;S32、将重点浏览文本子集合输入至浏览影响力模型中,得到重点浏览影响力阈值;S33、将重点浏览文本子集合中各个文章文本中词频大于重点浏览影响力阈值的单词作为第一部分感兴趣词语集合;S34、根据第一部分感兴趣词语集合,确定次重点浏览影响力阈值;S35、将次重点浏览文本子集合中各个文章文本中词频大于次重点浏览影响力阈值的单词作为第二部分感兴趣词语集合;S36、根据第一部分感兴趣词语集合和第二部分感兴趣词语集合,确定用户的感兴趣词语集合;所述S31中,浏览影响力模型G的表达式为: 式中,N表示重点浏览文本子集合的文章文本个数,M表示重点浏览文本子集合中文章文本的单词个数,K表示重点浏览文本子集合中文章文本的非停用词个数,Fn_m表示重点浏览文本子集合的第n个文章文本中第m个单词的词频,Fn_k表示重点浏览文本子集合的第n个文章文本中第k个非停用词的词频,ln·表示对数函数;所述S34中,次重点浏览影响力阈值θ的计算公式为:式中,R表示第一部分感兴趣词语集合的单词个数,Xr表示第一部分感兴趣词语集合中第r个单词的词向量;所述S36中,确定用户的感兴趣词语集合的具体方法为:将第一部分感兴趣词语集合和第二部分感兴趣词语集合的并集作为用户的感兴趣词语集合。

全文数据:

权利要求:

百度查询: 北京一笔两划科技有限公司 一种文本语义分析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。