首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于情感分布的细粒度虚假新闻检测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:江西师范大学

摘要:本发明公开了基于情感分布的细粒度虚假新闻检测方法,包括如下步骤:构建新闻数据集,构建虚假新闻检测模型;将新闻数据集输入至虚假新闻检测模型中进行预测,输出新闻样本的真假预测标签;虚假新闻检测模型由特征提取层和融合预测层组成,其中,特征提取层内的情感特征提取层由预训练好的情感轮模型和情感词典模型构成;本发明通过引入情感轮模型,能够更全面地理解文本中情感的复杂性,从而更准确地捕获和表达情感特征,情感轮模型考虑了情感之间的对立性和相似性,使得可以更精细地区分和分类不同情感状态。

主权项:1.基于情感分布的细粒度虚假新闻检测方法,其特征在于,包括如下步骤:步骤S1:构建新闻数据集,新闻数据集包括中文数据集和英文数据集,中文数据集和英文数据集内每条数据为一个新闻样本;步骤S2:对新闻数据集内的新闻样本进行数据预处理后得到新闻内容、新闻内容对应的评论和新闻内容的真实标签;步骤S3:构建虚假新闻检测模型,虚假新闻检测模型由特征提取层和融合预测层组成;所述特征提取层由文本词嵌入提取模块、文本特征提取模块和情感特征提取模块组成,融合预测层由融合模块和预测模块组成;所述文本词嵌入提取模块由预训练好的BERT模型构成,文本特征提取模块由预训练好的Bi-GRU模型与预训练好的CNN模型构成,情感特征提取模块由预训练好的情感轮模型和预训练好的情感词典模型构成;融合模块由Concat函数和自注意力机制构成,预测模块由多层感知机和分类函数Sigmoid组成;步骤S4:将新闻内容输入到预训练好的BERT模型中获得新闻内容的词向量表示,根据新闻内容的词向量表示获得新闻词嵌入;步骤S5:将获得的新闻词嵌入分别输入到预训练好的Bi-GRU模型和预训练好的CNN模型中,提取新闻内容的全局文本特征Bt以及局部文本特征Ct;步骤S6:将新闻内容和新闻内容对应的评论输入到情感特征提取模块中,并基于预训练好的情感轮模型和预训练好的情感词典模型,提取新闻内容和新闻内容对应的评论的情感特征,将提取的新闻内容和新闻内容对应的评论的情感特征进行融合,得到完整情感特征;步骤S7:分别将提取的全局文本特征Bt和局部文本特征Ct与完整情感特征进行拼接,得到全局文本情感特征和局部文本情感特征;步骤S8:将全局文本情感特征和局部文本情感特征经过自注意力机制加权得到加权后的新特征,将加权后的新特征经过多层感知机后得到最终特征向量,将最终特征向量输入到分类函数Sigmoid中,输出新闻样本的真假预测标签;步骤S6的具体过程为:将新闻内容和新闻内容对应的评论分别输入至情感特征提取模块中,在提取时,针对提取到的情感之间的关联性和对立性,采用预训练好的情感轮模型和预训练好的情感词典模型去提取发布者和评论者的情感,通过预训练好的情感词典模型找到句子里面的情感词,每个情感词会有相关联的情绪标签;具体的,设定新闻内容对应的评论为v=[t1,t2,...,ti],通过每条评论ti的真实情绪标签yi生成离散高斯分布,为每个情感词的情绪标签生成离散高斯分布,在此基础上将和叠加,得到综合情感分布; ; ;式中,表示基于原本的情绪标签即句子的真实情绪标签和情感词的情绪标签生成高斯分布;表示归一化因子使得;表示情绪a与真实情绪α之间的情感轮距离;表示最终利用预训练好的情感轮模型和预训练好的情感词典模型得到的情感分布;表示句子ti的情感词数量;表示ti的第k个情感词wi,k的情绪标签数量;t表示数量;和表示预设的参数;将得到的综合情感分布用于提取评论者的情感和发布者的情感,将评论者的情感和发布者的情感进行融合得到完整情感特征; 。

全文数据:

权利要求:

百度查询: 江西师范大学 基于情感分布的细粒度虚假新闻检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。