买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南京信息工程大学
摘要:本发明公开了计算机与信息安全技术领域中的一种分布式舆情信息监测方法与系统,系统由工作节点和任务调度中心组成,特点是每个部分都使用分布式架构;其中,任务调度中心与各工作节点间存在树状网络结构,以便向各个工作节点传递信息和发送控制命令;工作节点间存在P2P网络结构,进行相关交流和协作;每个工作节点都能在任务调度中心的统筹和彼此的交流和协作中,独立地完成信息的监测过程。本发明解决信息采集效率低下和信息存储缺乏安全性、难以追责与溯源的问题。
主权项:1.一种分布式舆情信息监测方法,其特征在于,所述方法由工作节点执行,包括:接收任务调度中心发送的URL,解析URL并采集URL对应网页中的舆情信息;利用深度学习模型对舆情信息进行分析计算,得到舆情信息的负面系数,根据负面系数和设定的负面系数阈值认定负面信息;统计设定时间段内满足设定条件的负面信息的数量,根据设定时间段内满足设定条件的负面信息的数量计算负面信息传播系数,根据负面信息传播系数和设定的传播系数阈值认定超出预定传播力的负面信息;分别计算负面信息的真实热度和预期热度,根据真实热度与预期热度的差值及设定的差值阈值认定超出预定热度的负面信息;根据超出预定传播力的负面信息和超出预定热度的负面信息认定超出预定影响力的负面信息;将超出预定影响力的负面信息打包成区块,将区块广播并连接至区块链中;统计设定时间段内满足设定条件的负面信息的数量,根据设定时间段内满足设定条件的负面信息的数量计算负面信息传播系数,根据负面信息传播系数和设定的传播系数阈值认定超出预定传播力的负面信息,包括:各工作节点在设定的监听时长内通过其维护的两个计数器统计和,统计完毕的工作节点将广播出去,收到广播的其他工作节点将其统计的更新为+,持续统计与计数器更新,得到一个共同的;计算负面信息传播系数;根据负面信息传播系数和设定的传播系数阈值,将满足>的负面信息认定为超出预定传播力的负面信息;其中,为各工作节点收到的负面信息中相同或相似的数量,为所有负面信息中相同或相似的数量;负面信息的真实热度的计算公式为: ;式中,为时刻负面信息的真实热度,、和分别为、和时刻负面信息的信息热度,、和通过计算得到,表示时刻负面信息的信息热度,、、和分别表示时刻负面信息的浏览数、点赞数、评论数和转发数,表示时间段,表示时间间隔,小于,和由调度中心分配给工作节点;负面信息的预期热度的计算公式为: ;式中,为在时刻负面信息的预期热度,为时的值,;负面信息的真实热度与预期热度的差值,将满足的负面信息认定为超出预定热度的负面信息并记录该负面信息的真实热度作为热度系数;其中,为调度中心分配给工作节点的差值阈值;根据超出预定传播力的负面信息和超出预定热度的负面信息认定超出预定影响力的负面信息,包括:将超出预定传播力的负面信息的标签设置为=1,将超出预定热度的负面信息的标签设置为=1;调用智能合约计算和的与运算结果,将验证通过=1的负面信息认定为超出预定影响力的负面信息;将超出预定影响力的负面信息打包成区块,将区块广播并连接至区块链中,包括:将所有通过智能合约验证的的负面信息均上传至区块链并维护区块链账本;其中,维护区块链账本包括:某一工作节点接收任务调度中心发送的令牌Token而获得区块链的记账权,其他工作节点将通过智能合约验证超出预定影响力的负面信息发送给拥有记账权的工作节点,拥有记账权的工作节点根据超出预定影响力的负面信息的Hash值对接收到的所有信息进行去冗余操作;所述任务调度中心被配置为:以轮为单位,每轮开始对新的URL进行头部去除、域名大小写改换、去除参数信息、格式化及使用SHA-256算法处理,将处理结果输入布隆过滤器中设置的多个哈希函数,得到布隆过滤器中的若干位置索引,检查各个位置是否都为1,若不是,则将该URL加入待处理队列的头部并将若干位置索引对应位置中存储的值设置为1;接收工作节点的发送负载参数,根据工作节点编号和负载参数维护一个优先队列,根据优先队列给工作节点分配对应的URL获取数量;在超过预定数量的工作节点完成信息采集时开始下一轮信息采集;在一轮信息采集完成后,广播指令通知工作节点进行信息分析;设定负面系数阈值广播给工作节点;设定监听时长、传播系数阈值发送给工作节点;设定时间段、时间间隔和差值阈值发送给工作节点。
全文数据:
权利要求:
百度查询: 南京信息工程大学 一种分布式舆情信息监测方法与系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。