一种基于证据增强的假新闻检测方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：西北工业大学;西北工业大学深圳研究院

摘要：本发明公开了一种基于证据增强的假新闻检测方法，首先从语义和情感的角度促进评论与新闻的互动融合，从而学习新闻中潜在的可疑片段。然后，构建实体级和关系级检索，以从外部来源筛选足够的候选证据。最后，通过多视角推理来衡量可疑片段和候选证据之间的一致性，并进一步推断出发现新闻虚假部分的可解释证据。本发明以证据增强为突破，为社交媒体的谣言治理提供了新思路，有效解决虚假新闻检测问题。

主权项：1.一种基于证据增强的假新闻检测方法，其特征在于，包括如下步骤：步骤1：构建多模态假新闻检测系统，包括输入编码层、层次冲突发现层、外部证据增强层和多视角一致性推理层；步骤2：输入编码层；输入包括三种类型：新闻标题、新闻内容和新闻评论；将任意带有n个词的序列表示为X＝{x1,x2,…,xt,…,xn}，其中，xt是一个通过预训练BERT模型获得的d维向量；第i个序列的编码为Xi，采用自注意力网络学习序列内部词与词之间的上下文依赖关系，自注意力网络输出Ei；新闻标题、新闻内容和新闻评论的编码特征分别由ET、EC和ER表示；步骤3：层次冲突发现层；步骤3-1：关键语义学习块；构建交叉注意力网络促进新闻标题与新闻内容的交互从而捕获新闻中的关键语义片段，公式化为：其中Q、K和V分别为查询、键和值矩阵，Q＝ET，K＝V＝EC，dk是新闻评论矩阵的输出矩阵的列尺度；步骤3-2：使用多头注意力来线性映射查询、键和值信息： HF＝MultiHeadQ,K,V＝Concathead1,head2,…,headmWo3其中和Wo均为可训练参数；HF为捕获的新闻关键片段；步骤3-3：基于语义的聚类机制来挖掘所有评论中的主流立场观点；采用单层聚类形式，不需要设定任何聚类值，通过一个相似度阈值决定是否将新评论划分为一个新类型；以这样的方式，获得带有不同主流立场观点的多个聚类簇S＝{S1,S2,...,Sk}，k为主流立场个数；步骤3-4：设计层次交互融合块，从语义和情感层面建立新闻和评论之间的分层互动；使用交叉注意力加强新闻和评论主流观点的关键片段之间的互动：H′F＝AttentionHF,HF,HR4H′R＝AttentionHR,HR,HF5HFR＝[H′F；H′R]6其中，HFR为语义级质疑片段；HR表示带有不同立场观点的多个聚类簇；步骤3-5：设计情感图增强交互块，首先构建情感图网络来建模关键片段与评论的主流观点中情感词之间的关系，然后采用情感注意力挖掘情感级矛盾点；步骤3-5-1：情感图构建；给定新闻或评论序列X＝{x1,x2,…,xn}，利用情感词典评估任意两个单词之间的情感得分，并获得邻接矩阵其中E’中的每个元素ei,j为：其中uxi和uxj分别表示第i和j个词的情感得分；|·|是绝对值；步骤3-5-2：利用句法依赖树解析整个序列，学习情绪词之间的结构特征；相依邻接矩阵D中的每个元素为：其中，vi,j＝1表示句法依赖树中的第i个词xi和第xj个词之间有一条边；vi,j＝0表示这两个词之间没有任何关联；步骤3-5-3：采用协调机制控制两个图之间的总体比例，从而形成情感增强图；El＝αE′l+1-αDl9其中α是超参数，El为情感增强图的第l轮迭代后的结果，E′l表示邻接矩阵的第l轮迭代结果，Dl表示依赖邻接矩阵的第l轮迭代结果；步骤3-6：设计两种汇聚融合模式；步骤3-6-1：注意力汇聚融合；利用语义层面的冲突信息关注情感图的聚合，得到公共的上下文质疑特征Oa：其中，Wo和W′o均为可训练参数，表示情感增强图第l轮迭代结果中第i个元素，oi表示第i个融合情感编码，ok表示第k个融合情感编码，表示情感增强图第l轮迭代结果中第k个元素，βi表示第i个情感增强图的权重，N是情感图的节点数量；步骤3-6-2：采用动态权重平衡语义和情感层面特征之间的比例，然后最大化挖掘情感质疑特征Om：μm＝σHFRWμ1+ElWμ2+Wμ13 其中，所有带下标的W和b均为可训练的参数，σ表示激活函数；步骤3-6-3：整合两种融合模式，以最大化新闻和评论之间的可疑信息：O＝[Oa；Om]15步骤4：外部证据增强层；步骤4-1：双视角关键词检索块，包括实体级关键词检索和关系级关键词检索；步骤4-1-1：实体级关键词检索；步骤4-1-1-1：关键字匹配；1标题引导匹配：使用新闻标题作为关键字种子从维基百科中检索；2共现词提取：将标题和内容作为一个整体，提取它们的共现词并按数量排序，然后选择前K个词作为种子进行检索；步骤4-1-1-2：关键词种子优化；通过删除停止词和按顺序过滤重要性低的关键词进行关键词种子优化；步骤4-1-2：关系级关键词检索；步骤4-1-2-1：使用语义角色标记SRL解析新闻标题和新闻内容，在自变量之间建立连接构建图，然后利用基于图的推理方法来获得新闻中的关键词种子；将从两个层次检索到的文章进行整合，形成相关的文章集A；步骤4-1-2-2：从文章集中抽取证据句子Ec；其中，∪为并集，是Ec的第i个句子，Si表示检索到的文章句子集S中的第i个句子；步骤4-2：利用预先训练BART模型提高句子选择的准确性；将新闻X和检索到的相关文章的句子Si输入到模型中：[CLS]X[SEP]Si[EOS]；对模型的输出使用BIO形式进行分类，将不相关的标记分类记为O，证据句子中的第一个标记被设置为B证据，证据句子的其余标记被设置作为I证据；对所有相关文章进行上述操作，最终获得p个句子的最有可能的证据集E＝{e1,e2,…ep}；步骤5：多视角一致性推理层；包括多个一致性建模块和合成推理块；步骤5-1：一致性建模块包括因果一致块、共同一致块和精炼一致块；这三个一致性块均为扩展自注意机制，调整非线性变换层f·以适应不同的一致性策略；其中，表示注意力权重，hi表示第i个被关注的句子，atti表示第i个注意力权重，r表示被注意力优化后获得的特征；步骤5-1-1：因果一致块；将新闻和外部潜在证据的冲突信息映射到同一维度空间，进行互动比较；α′O＝WαO+bα19βE＝WβE+bβ20γE＝WγE+bγ21 c＝fcO,E＝σβE⊙α′O+γE22其中，所有带下标的W和b均为可训练参数，⊙为元素间点乘，E表示最有可能的证据集；；步骤5-1-2：共同一致块；共同一致块将从全局视角发现冲突信息和潜在证据之间的不一致性特征映射并转换在一起： m＝fmO,E＝tanhWm[O||E]+bm23步骤5-1-3：精炼一致块；首先浓缩新闻中的质疑信息，然后进一步与外部证据相互作用，以精炼出其中的不一致特征： r＝frO,E＝σWrE+br⊙O24其中Wr和br为可训练参数；步骤5-1-4：将因果一致块、共同一致块和精炼一致块整合为冲突信息和外部证据之间的多视图一致语义G：＝c+m+r25步骤5-2：合成推理块；步骤5-2-1：构建交叉注意力网络得到新闻的虚假部分Hgo和相关证据Hge之间的互动关联；Hgo＝Attention,,O26Hge＝Attention,,E27步骤5-2-2：启发式融合；Hgoge＝[Hgo；|Hgo-Hge|；Hgo⊙Hge；Hge]28步骤5-2-3：将前馈网络应用于融合的结果，添加非线性特征和尺度不变特征；Igo＝FFNHgo,Hgoge＝max0,[Hgo；Hgoge]W1+b1W2+b229Ige＝FFNHge,Hgoge＝max0,[Hge；Hgoge]W3+b3W4+b430Igoe＝[Igo；Ige]31步骤6：采用softmax函数用于训练的概率分布，其中损失驱动模型最小化具有标准标签y的训练实例的交叉熵误差：Loss＝-∑ylogp32p＝softmaxWpIgoe+bp33。

全文数据：

权利要求：

百度查询：西北工业大学西北工业大学深圳研究院一种基于证据增强的假新闻检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：激光线光源检测方法、系统及计算机可读存储装置

下一篇：一种油茶粕提取物及其提取方法与在制备抗结肠癌药物中的应用

相关技术

激光线光源检测方法、系统及计算机可读存储装置

一种油茶粕提取物及其提取方法与在制备抗结肠癌药物中的应用

一种燃气管道用支吊架结构

有机化合物及包含其的有机发光器件

电镀污泥脱铬渣浸出设备

月报数据导出方法、装置、设备及计算机存储介质

助力自行车中置驱动装置的安装结构和助力自行车

一种电路板安装机构

一种地质矿产资源勘查用金属检测装置及检测方法

靶向蛋白造影剂、其制备方法及用途

应用于高应力软岩大变形施工的支护结构

一种多功能电源变换装置的控制方法

检测相关技术

晶片检测设备和晶片检测方法_台湾积体电路制造股份有限公司_202010729277.3

流量检测装置和流量检测方法_北京七星华创流量计有限公司_202310220061.8

芯片检测装置及芯片检测方法_友达光电股份有限公司_202410644860.2

泄漏检测装置及检测方法_杭州深度视觉科技有限公司_202210931136.9

继电器检测系统和检测装置_苏州清陶新能源科技有限公司_202323407929.X

检测系统_群创光电股份有限公司_202311520558.8

检测系统_河北光兴半导体技术有限公司_202323209957.0

核酸分子的检测方法、检测套组及检测卡匣_体学生物科技股份有限公司_202410237794.7

H桥电流检测电路以及电流检测装置_武汉市聚芯微电子有限责任公司_202310197274.3

数字隔离单元故障检测方法及检测系统_苏州纳芯微电子股份有限公司_202111286497.4

增强相关技术

增强型反射LCD_斯沃奇集团研究和开发有限公司_202110784544.1

对干扰消除的增强_高通股份有限公司_202380018266.6

增强的截面特征测量方法_应用材料公司_202410707856.6

基于波束预测的增强波束管理_高通股份有限公司_202280088750.1

增强切换后的连接质量_诺基亚技术有限公司_202380018588.0

颗粒化用户同意及其增强_高通股份有限公司_202380018338.7

增强SPV信号的装置及方法_西安奕斯伟材料科技股份有限公司_202410696953.X

熔铸炸药界面增强材料预选方法_重庆大学_202410729767.1

上行控制信道的传输分集增强_高通股份有限公司_202080014917.0

接入点（AP）节能增强_苹果公司_202410241881.X

假相关技术

用于心脏瓣膜的假体及将该假体布置在植入装置中的方法_创新心有限公司_202380018631.3

一种假两件运动内衣_柯林(福建)服饰有限公司_202323496575.0

一种假体隆胸手术辅助装置_苏州美莱美容医院有限公司_202322430113.2

一种单髁假体自动规划方法、装置及相关设备_杭州键嘉医疗科技股份有限公司_202410079634.4

一种具有应力导航和曲度维持功能的颈椎前路手术假体_四川大学华西医院_202411070054.5

假捻变形机的纱线张力值的获取方法以及装置_欧瑞康(中国)科技有限公司_202410734474.2

门极沉降假晶高电子迁移率晶体管_稳懋半导体股份有限公司_202010496437.4

具有用于提高流动效率的阀的可膨胀阴茎假体_波士顿科学医学有限公司_202410709735.5

隆鼻术假体尺寸估算装置及其工作方法_同济大学_202111568607.6

一种保温杯圆周假壶口焊接机_博科视(苏州)技术有限公司_202420128873.X

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于证据增强的假新闻检测方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务