买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:东南大学
摘要:本发明公开了一种基于SAS软件数据统计过程的电影票房预测方法。首先通过豆瓣、IMDB等电影评分网站收集电影的豆瓣评分、豆瓣评分人数、短评数量、影评数量、IMDB评分、IMDB评分人数和电影实际票房等数据,并基于此建立训练集和测试集。随后针对训练集数据基于SAS中的数据统计过程利用数据分析方法对数据进行分析,进一步,针对聚类分析且因子降维后的电影数据建立不同类别电影中票房与降维因子之间的回归方程模型。最后,对于不包含实际票房数据的测试集基于聚类分析结果进行Bayes判别,依据判别结果和所在类别的回归方程即可预测电影票房。本发明对于电影投资价值预估和电影院排片预测具有一定参考价值。
主权项:1.一种基于SAS数据统计过程的电影票房预测方法,其特征在于,该预测方法包括以下步骤:步骤1:通过电影网站采集电影样本数据并构造电影训练集和测试集,其中训练集的电影样本包括电影名、豆瓣评分、豆瓣评分人数、短评数量、影评数量、IMDB评分、IMDB评分人数和实际票房8个数据变量;测试集的电影样本包括电影名、豆瓣评分、豆瓣评分人数、短评数量、影评数量、IMDB评分和IMDB评分人数7个数据变量;步骤2:基于实际票房这一数据变量对训练集的电影样本使用谱系聚类法进行聚类;步骤3:利用参数估计方法为主成分法的因子分析,对训练集中电影样本的豆瓣评分、豆瓣评分人数、短评数量、影评数量、IMDB评分和IMDB评分人数这6项数据变量进行降维,得到公共因子;步骤4:在步骤3得到的公共因子的基础上进行回归分析,得到步骤2聚类的不同类别下电影实际票房和公共因子之间的线性回归模型;步骤5:利用先验概率按比例分配的Bayes判别基于电影样本的豆瓣评分、豆瓣评分人数、短评数量、影评数量、IMDB评分和IMDB评分人数对测试集电影进行分类,分类到步骤2所得不同电影类别内;步骤6:在步骤5的基础上,已知任意测试集电影样本所属的类别,代入步骤4得到的相应类别下的线性回归模型,即可对电影票房进行预测。
全文数据:
权利要求:
百度查询: 东南大学 基于SAS数据统计过程的电影票房预测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。