Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜福州大学陈羽中获国家专利权

恭喜福州大学陈羽中获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜福州大学申请的专利基于动态多跳图注意力网络的谣言检测方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114706977B

龙图腾网通过国家知识产权局官网在2025-03-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210182172.X,技术领域涉及:G06F16/35;该发明授权基于动态多跳图注意力网络的谣言检测方法及系统是由陈羽中;李伟豪设计研发完成,并于2022-02-25向国家知识产权局提交的专利申请。

基于动态多跳图注意力网络的谣言检测方法及系统在说明书摘要公布了:本发明涉及一种基于动态多跳图注意力网络的谣言检测方法及系统,该方法包括以下步骤:步骤A:提取已知事件下的帖子的用户信息、回复信息及帖子间的转发或评论关系,并标注每个事件是否为谣言,构建训练集S;步骤B:使用训练集S训练基于动态多跳图注意力网络的深度学习网络模型G,用于分析每个事件是否为谣言;基于动态多跳图注意力网络的谣言检测模型步骤C:将提取的用户信息、回复信息和帖子间关系与帖子的文本信息一起输入到训练后的深度学习网络模型G中,得到对每个事件是否为谣言的预测。该方法及系统有利于提高谣言检测的准确性。

本发明授权基于动态多跳图注意力网络的谣言检测方法及系统在权利要求书中公布了:1.一种基于动态多跳图注意力网络的谣言检测方法,其特征在于,包括以下步骤:步骤A:提取已知事件下的帖子的用户信息、回复信息及帖子间的转发或评论关系,并标注每个事件是否为谣言,构建训练集S;步骤B:使用训练集S训练基于动态多跳图注意力网络的深度学习网络模型G,用于分析每个事件是否为谣言;步骤C:将提取的用户信息、回复信息和帖子间关系与帖子的文本信息一起输入到训练后的深度学习网络模型G中,得到对每个事件是否为谣言的预测;所述步骤B具体包括以下步骤:步骤B1:对训练集S中的每个帖子进行编码,得到事件下每个帖子的文本编码s、帖子间的关系矩阵R;步骤B2:对训练集S中的用户信息进行编码,用矩阵X表示用户的基本信息特征,用邻接矩阵A表示用户的行为特征,输入到图卷积网络中,学习并提取用户间深层次关系,得到用户编码的图卷积表征向量u;步骤B3:对训练集S中的回复信息进行编码,将每条回复表征向量xij输入到注意力网络中,使用两个额外的参数学习回复的结构信息;从帖子回复信息中学习评论树信息,得到评论树表征向量c;步骤B4:对每个帖子的文本编码s及对应的用户编码u和评论树编码c进行融合拼接,得到该帖子的表征向量h;同时通过固定帖子数量的方式对帖子进行分组处理;步骤B5:将每一组的帖子向量Ti输入到多跳图注意力网络中,先利用帖子间的关系计算单跳注意力得分,再利用图扩散的方式计算多跳注意力得分,更新帖子表征向量;提取每一组的源帖子的表征向量e;步骤B6:利用dot-productattention计算每组向量之间的相关度,引入掩码M,确保对组次i的预测仅依赖于组次i之前的输出,而不依赖于组次i之后的输出;使用Softmax函数对输出向量进行归一化;根据目标损失函数loss,利用反向传播方法计算深度学习网络模型G中各参数的梯度,并利用随机梯度下降方法更新参数;步骤B7:当深度学习网络模型G产生的损失值迭代变化小于设定阈值或者达到最大迭代次数,终止深度学习网络模型G的训练;所述步骤B1具体包括以下步骤:步骤B11:遍历训练集S,S中训练样本表示为S=P,y,其中P表示帖子集,y表示谣言检测的极性,谣言检测的极性包括{非谣言、谣言、真实传闻以及未经验证的传闻};对帖子集P中每个帖子p使用预先训练好的分布式表示的词向量;词语索引xi通过词表找到对应的独热编码vi,再通过预训练的词向量转化为wi,表示为:wi=Wvi其中,vi为词语索引xi在词表中的独热编码,W是d维的词向量矩阵;步骤B12:将转换后的词向量作为Text-CNN的输入;利用具有不同窗口的过滤器,捕捉不同粒度的特征以提取文本特征;对于帖子文本内容中的第i个词,相应的k维的词嵌入表征为因此具有n个单词的句子表征为: 其中,是连接运算符,窗口大小为h卷积滤波器将句子中h个单词的连续序列作为输入并输出一个特征,对于从第i个单词开始的h个单词的连续序列,滤波器操作表示为:si=ReLUWcSi:i+h-1其中,Wc表示过滤器参数;然后获得该句子的特征表示:s=[s1,s2,...,sn]所述步骤B2具体包括以下步骤:步骤B21:遍历训练集S,提取训练集中每个帖子对应的用户,构造用户特征矩阵U表示所有用户节点的特征,特征包括用户的个人信息和社交信息;其中n表示为用户的个数,m表示用户特征矩阵的维度,矩阵的每一行都表示为一个用户的特征向量;使用邻接矩阵A及其度矩阵D表示用户的边;当用户a与用户b有转发、评论关系或讨论同一帖子时Aab=1,如果用户a与用户b没有任何交集时Aab=0;度矩阵D由特征向量组成,有Dij=∑jAij;步骤B22:利用用户特征矩阵U和邻接矩阵A进行图卷积操作;对于单次卷积,特征矩阵有:L1=δAUW0其中L0=X,A是邻接矩阵,W0是权重矩阵;δ是一个激活函数,对于多次卷积,节点矩阵的更新方式如下:Lj+1=δALjWj其中j表示卷积层的数量;所述步骤B3具体包括以下步骤:步骤B31:遍历训练集S,提取每个帖子下对应的回复,回复之间构成评论树,采用Transformer模型学习回复之间的依赖关系;Transformer的每一层都包含一个self-attention子层和一个前馈子层,其中se1f-attention层架构推导如下: 其中序列中i和j元素的注意力权重通过i的query与j的key来计算得到;步骤B32:将每个位置的value聚合起来得到位置i的输出,有: 步骤B33:每个评论回复使用该评论文本的词嵌入向量表示,首先对每个评论回复xi进行max-pooling来获得其句子表示x′i;接着将评论句子表示序列X′=x′1,x′2,...,x′m通过s个MHA层来建模推文之间的交互;通过这些MHA层以后得到输出U=u1,u2,...,um,最后通过注意力机制聚合这些输出并使用全连接层进行连接;αk=softmaxγTuk 其中,k是类的个数,v是X的表示向量;步骤B34:添加和两个额外的学习参数,用于表示回复之间的关系,有: 所述步骤B4具体包括以下步骤:步骤B41:将步骤2、步骤3、步骤4提取到的文本特征s、用户特征u和评论树特征c拼接在一起作为融合特征并称之为帖子特征;考虑到文本、用户、评论特征三者的贡献程度不同,对文本特征、用户特征及评论特征进行注意力权重的训练,用于增强某一特征的表示;α=σ2σ1s,u,c;θ1;θ2此外,使用注意力增加1的方式保证特征不丢失;训练和融合表示的计算如下:H=αT+1[s,u,c]步骤B42:按照等数量帖子的方式,对谣言事件的时间序列数据进行划分;每个事件Ei,包含源帖子hr与该事件相关的其他帖子hij;由于不同的事件具有不同的帖子数量和时间跨度,因此不同事件中每个阶段帖子的数量的大小也各不相同;首先统计该事件中的帖子数量和事件相关帖子起止时间,采用归一化对时间进行处理,计算分成τ个时间间隔后每个时间间隔所需帖子数量;然后将根据每个帖子时间,将帖子分到对应的时间间隔中;另外,将源帖子与每个时间间隔新增帖子路径上的帖子也纳入其中,每个时间间隔看作事件的一个阶段,每个事件的阶段表示为:Ti={hi1,hi2,...,hik,hr,H′}所述步骤B5具体包括以下步骤:步骤B51:将步骤4得到的向量集Ti输入到多跳图注意力网络中,引入注意力扩散算子,其表示为一个三元组Vi,eij,vj,计算直接相连的边的注意力得分再利用注意力扩散计算没有直接相连的结点对之间的注意力得分值; 其中,l表示为层数,Wh、Wt、We为可训练的权重矩阵,hi、hj为输入结点的向量表示;步骤B52:将注意力扩散算子应用到图中的每一条边后,得到其注意力得分,其中无直接相连的边的注意力得分为负无穷; 步骤B53:将步骤B52得到的结果进行归一化得到:Al=softmaxSl其中,Al表示结点j向结点i聚集信息时,在第l层的注意力得分;步骤B54:使用图扩散计算多跳邻居关系的注意力得分,有: 其中,θi=α1-αi,α∈0,1],α为偏执扩散参数;特征聚合的图注意力扩散定义如下:AttDiffusionG,Hl,θ=AHlZ0=HlZk+1=1-αAZk+αZ0其中,通过定义一个数列Zk简化计算,当k→∞时,该数列收敛到AHl的值,达到图扩散的目的;步骤B55:将步骤B54得到的结果输入到两个完全连接的前馈子层,再在两个子层中添加层规范化和残差连接: 所述步骤B6具体包括以下步骤:步骤B61:将每组经过注意力扩散得到的源帖子向量表示取出H′={h1,h2,...,hτ},其中τ为分组的数量;利用dot-productattention计算向量之间的相关度,此外引入掩码M,确保对组次i的预测仅依赖于组次i之前的输出,而不依赖于组次i之后的输出; 步骤B62:使用交叉熵作为损失函数计算损失值,通过Adam优化算法进行学习率的更新,利用反向传播迭代更新模型参数,以最小化损失函数来训练模型,交叉熵损失函数如下: 其中,|C|是谣言检测极性类别的数量,yi是由one-hot向量表示的谣言检测极性,yi是通过分类层计算获得的谣言检测极性概率分布,λ是L2正则化项的系数,θ是可训练参数,模型采用dropout策略以避免过拟合。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人福州大学,其通讯地址为:350108 福建省福州市闽侯县福州大学城乌龙江北大道2号福州大学;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。