首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种面向票房预测的影评情感可视化方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:四川大学

摘要:本发明公开了一种面向票房预测的影评情感可视化方法,采集电影信息及电影影评数据,对采集到的数据进行预处理;针对影评数据,使用分词向量法提取影评情感类型与强度特征;设计影评情感视觉编码表示情感类型与强度;设计影评情感时空分布;实现影评情感可视化布局和票房预测可视化布局。本发明弥补了现状中存在的缺乏对数据属性关联分析,缺乏对影评情感类型与强度综合分析的不足之处,使用直观的可视化元素与灵活的交互,对影评情感的类型与强度进行编码映射。

主权项:1.一种面向票房预测的影评情感可视化方法,其特征在于,包括以下步骤:步骤1:进行页面获取与解析、数据结果设计以及数据存储,采集电影信息及电影影评数据;步骤2:采用Jieba分词算法对影评文本进行分词;分词之后,遍历停用词表,过滤停用词;经过影评文本预处理后,每条影评文本会被处理成若干条有效的词条;步骤3:分析影评情感类型与强度1基于情感本体分类方法,整合情感词典库,同时加入网络词汇,消除网络词汇与传统词汇之间存在的歧义性,由此作为情感词汇的来源;2结合否定词词典和程度副词词典构成评价词典;3影评情感本体模型由一个三元组来描述,即MEO=W,E,I;其中,W表示经过分词处理的词条和在情感词典中的词性以及词条所在上下文中的评价词;E表示词条的情感类型与匹配度,在计算匹配度时需要将提取到的具有情感含义的词条与各种情感类型比较,将匹配度最大的作为该词条的情感类型,具体计算方式如下所示: 其中,W1和W2表示两个评价词,S1i和S2j分别是W1和W2的n个与m个义项,即概念,则W1和W2的相似度就是各个概念的相似度的最大值;I表示情感单词的强度;若情感强度级别设分为T={t1,t2,...tn},则情感词条的情感强度值Iwj的计算公式如下所示: 其中,Piwj为情感词条wj的评价词出现在情感强度级别ti中的概率,再通过加权平均计算方式得出一部电影影评数据集的情感类型分布;步骤4:票房预测引入情感因素,使用过去某段时间内计算得到的票房预测值预测当前票房预测值,得到情感感知自回归预测公式: 其中,Nt-i,j表示情感类型j在t-i时刻的平均数量,It-i,j表示情感类别j在t-i时刻的平均强度值,参数p表示前期票房考虑的天数,q表示提前几天考虑情感因素,k表示情感种类,фi和ρi,j是估计值,εt则假设平均数为0;步骤5:设计可视化映射方案针对预处理过的影评情感数据,提取出设定情感类型,定义各个情感类型的可视化映射方案;其中,包含设计影评情感地图视觉映射表示影评情感极性在地理区域特征上的分布;设计情感舵盘视图视觉映射表示影评情感类型与强度在时间特征上的分布;设计情感主题气泡视图视觉映射表示影评情感主题的变化趋势;设计票房预测视图视觉映射表示影评情感类型与票房预测之间的影响关系;步骤6:布局影评情感可视化影评情感地图:计算影评用户的位置坐标点的情感值,基于Kriging空间插值法,推算出地理区域的情感极性分布;影评情感舵盘视图:根据影评产生的时间及其情感类型,计算电影在某段时间内的情感类型及其强度的分布;情感主题气泡视图:计算影评中属于某种情感类型的高频主题词,并根据主题词的词频计算情感主题气泡的大小;票房预测视图:计算影评中各类情感类型在票房预测中的影响占比,以堆叠方式分布在柱状图上。

全文数据:

权利要求:

百度查询: 四川大学 一种面向票房预测的影评情感可视化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。