首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

实时社交聆听数据挖掘方法、装置及电子设备 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:一网互通(北京)科技有限公司

摘要:本发明实施例中提供了一种实时社交聆听数据挖掘方法、装置及电子设备,属于数据处理技术领域,该方法包括:设置用于数据挖掘的数据采集层、实时传输层和内存数据库处理层,在内存数据库处理层设置有缓存数据项总量为C的第一缓存空间以及与所述原始数据对应的哈希表;在内存数据库处理层中设置数据预处理函数;通过在深度学习模型中设置自定义交叉过滤函数,对向量化数据D2中的数据段进行分类进行处理;通过目标函数f对用户的行为数据进行预测,得到预测数据D4;基于预测数据D4和预测参数产生预测输出,将预测输出通过可视化形式进行展示。本发明能够提供高效、准确的社交聆听服务。

主权项:1.一种实时社交聆听数据挖掘方法,其特征在于,包括:设置用于数据挖掘的数据采集层、实时传输层和内存数据库处理层,所述数据采集层针对不同的社交媒体平台定制数据抓取策略,得到原始数据D1,所述实时传输层通过构建消息队列,将原始数据转换成实时队列格式;在内存数据库处理层设置有缓存数据项总量为C的第一缓存空间以及与所述原始数据对应的哈希表,缓存空间中每个缓存项的大小为S,当前缓存中项的数量为N,对于任意时刻t,每个缓存项i有一个最后访问时间戳Tit,对于查询请求q,如果q在哈希表中存在,则更新Tqt=t,并将该项移到链表头部,当N=C且需要插入新项x时,找到链表尾部项y,移除y,然后插入x至链表头部,同时更新N的值和相应的哈希表;在内存数据库处理层中设置数据预处理函数,所述数据预处理函数对存储在第一缓存空间中的原始数据执行完文本清洗之后,对清洗后的数据执行文本向量化操作,得到向量化数据D2,所述向量化数据存储在内存数据库处理层中的第二缓存空间中;通过在深度学习模型中设置自定义交叉过滤函数,对向量化数据D2中的数据段进行分类进行处理,得到向量化数据D2的分类特征数据D3,c为类别数,yc为不同类别的编码值,pc为模型预测不同类别的概率值;在原始数据中提取与分类特征数据D3对应的时间序列特征K1、社交网络结构特征K2、用户偏移值特征K3以及交互评价特征K4,构建基于时间序列特征K1、社交网络结构特征K2、用户偏移值特征K3以及交互评价特征K4的目标函数fK1,K2,K3,K4,γ,通过目标函数f对用户的行为数据进行预测,得到预测数据D4,γ为目标函数的优化参数;构建预测函数,基于预测数据D4和预测参数产生预测输出,,g为激活函数,hj为第j个特征映射函数,M为预测参数的数量,将预测输出通过可视化形式进行展示。

全文数据:

权利要求:

百度查询: 一网互通(北京)科技有限公司 实时社交聆听数据挖掘方法、装置及电子设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术