首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于短时序领域划分的社交媒体内容热度预测方法 

申请/专利权人:天津大学

申请日:2024-04-03

公开(公告)日:2024-07-05

公开(公告)号:CN118297420A

主分类号:G06Q10/0637

分类号:G06Q10/0637;G06Q50/00;G06F18/25;G06N3/0442;G06N3/048;G06N3/084

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.07.23#实质审查的生效;2024.07.05#公开

摘要:本发明公开了一种基于短小时间序列领域自适应的社交媒体内容热度预测方法,包括:将离散的短小时间序列划分为不同的领域,使每个领域能够充分表征其分布信息;获取短小时间序列的时序模式、短时记忆、关键特征以及长期依赖关系,将每个领域输入GRU进行预训练;量化时序分布的差异,运用分布距离函数计算不同领域之间通过GRU输入的最终隐藏状态的分布距离,从而提供一种正则化手段,强调领域间时序分布特征的差异性;对隐藏状态之间的分布差异的动态变化进行加权评估,在正则化项中加入评估参数。本发明通过有效利用社交媒体内容时间序列的短小特性和分布特性,解决了现有社交媒体内容热度预测技术中存在的时序分布漂移问题,与现有技术相比有更好的预测效果,能获得全局性更优、泛化性能更好的建模结果。

主权项:1.一种基于短时序领域划分的社交媒体内容热度预测方法,其特征在于,包括以下步骤:步骤1、短小时间序列领域划分:针对每个社交媒体内容,在指定的观测时间内,以每12分钟为一个时间窗口进行分割,并统计每个时间窗口内的转发增量作为热度增长值,从而获得多个社交媒体内容的短小时间序列数据,计算每个短小时间序列的方差,将所有短小时间序列的方差进行排序,将排序后的时间序列划分为K个领域,使得同一领域内的短小时间序列具有相似的分布,而不同领域之间的分布差异尽可能大;步骤2、预训练GRU时序特征提取:选择GRU作为基本特征提取器,利用GRU从短小时间序列数据中提取时序特征,获得隐藏状态表示;步骤3、分布特征对齐:在步骤2得到的预训练GRU时序特征提取的基础上构建模型,将短小时间序列数据输入GRU,度量每两个领域的GRU的隐藏状态的分布距离作为正则化项,并使用重要性评估参数加权,以减少不同领域之间的分布差异,对齐不同领域的分布特征,将GRU的输出通过全连接层得到预测值,计算均方对数误差损失函数反向传播方式优化各层级权值,并将反馈结果输出至模型的输入端,得到训练完毕的模型;步骤301、分布距离度量:使用最大均值差异度量隐藏状态的分布差异,分别计算每两个领域之间的分布差异作为正则化项;步骤302、重要性评估加权:引入了一个重要性评估参数,学习隐藏状态的重要性,计算隐藏状态的分布距离变化,根据分布距离在每个时期的变化,更新重要性评估参数,以适应不同领域的分布特征的动态变化;步骤4、热度增长值的预测:将待预测的短小时间序列进行领域划分后输入步骤3得到的已训练完毕的模型中,该模型的输出就是未来一段时间内社交媒体内容热度增长预测值,从而实现社交媒体内容热度预测。

全文数据:

权利要求:

百度查询: 天津大学 基于短时序领域划分的社交媒体内容热度预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。