买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明提供一种文本评论主题情感分析方法、装置及设备,该方法包括:将获得的关于博物馆的评论数据进行预处理得到词汇集合;对词汇集合中的词汇基于TF‑IDF算法进行重要性排序;基于排序结果筛选得到第一情感种子词和第二情感种子词;基于SO‑PPMI算法在词汇集合中选取与情感种子词具有满足要求的相似度的目标词汇;基于目标词汇与通用情感词典形成情感词典;基于每个词汇与情感词典中记录的每个情感种子词的相似度确定词汇的权重;基于权重及LDA模型构建WLDA模型,并基于该模型确定出对应各主题的主题词;基于主题、主题词及情感词典确定每个主题的情感倾向。本发明的方法能够对博物馆评论进行快速准确地的情感分析。
主权项:1.一种文本评论主题情感分析方法,其特征在于,包括:将获得的关于博物馆的评论数据进行预处理,得到词汇集合;对所述词汇集合中的词汇基于TF-IDF算法进行重要性排序;基于排序结果筛选得到能够明确表达正向情感倾向和负向情感倾向的第一情感种子词和第二情感种子词;基于SO-PPMI算法在所述词汇集合中选取与所述第一情感种子词具有第一相似度,或与第二情感种子词具有第二相似度的目标词汇,所述第一相似度为第一阈值范围内的任意一值,所述第二相似度为第二阈值范围内的任意一值,不同的目标词汇对应的第一相似度或第二相似度不同;将所述目标词汇与通用情感词典融合,形成对应博物馆评论的情感词典;基于所述词汇集合中每个词汇与所述情感词典中记录的每个情感种子词的相似度确定所述词汇的权重;基于所述权重及LDA模型构建WLDA模型,并基于所述WLDA模型学习各个单词所属的主题,以及所述单词对所属主题的影响力,进而确定出对应各所述主题的主题词,所述主题与博物馆的评论方向相关;基于所述主题、主题词及情感词典确定每个所述主题的情感倾向。
全文数据:
权利要求:
百度查询: 中国人民解放军国防科技大学 一种文本评论主题情感分析方法、装置及设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。