针对虚假信息的人机内容判别方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：国家计算机网路与信息安全管理中心

摘要：本发明提出了针对虚假信息的人机内容判别方法，属于人工智能与信息检测技术领域。本方法，首先进行虚假信息识别与编码，然后进行特征提取与表示，构建虚假信息识别模型。之后进行损失函数与优化。训练模型后，根据训练好的模型，验证集评估模型的准确率和召回率，根据结果调整模型参数。利用模型，输出概率最大的类别。本方法能够自动判别由大型语言模型生成的内容，为生成式模型提供可信保障，可应用于垃圾信息过滤、虚假新闻检测等多个领域，有助于提高信息的质量和安全性。

主权项：1.针对虚假信息的人机内容判别方法，其特征在于，包括以下步骤：步骤1：虚假信息识别与编码；步骤2：特征提取与表示；步骤2.1：使用预训练语言模型；对于每个文本数据x，通过模型提取特征向量以此来获得矢量表示；这一步涉及将文本数据输入BERT模型，并获取最后一层的输出，即v＝BERTx；步骤2.2：向量化表示；文本数据x经过BERT模型后，输出一个固定大小的特征向量v，该向量是文本的密集表示，捕捉了文本的语义信息；步骤3：构建虚假信息识别模型；步骤3.1：模型架构；输入层：接收从BERT模型得到的特征向量v；使用子注意力机制和位置编码生成这些特征向量；隐藏层：包含多个全连接层，每层之后使用ReLU激活函数，进一步处理BERT模型输出的特征向量；hl＝ReLUWlhl-1+bl其中，l表示层的序号；hl表示第l层的隐藏状态，是前一层经过全连接层和ReLU激活函数计算得到；Wl表示第l层的权重矩阵；bl表示第l层的偏差向量；输出层：包括一个神经元，使用Sigmoid激活函数来预测文本是否包含虚假信息，P虚假|x＝SigmoidW0hL+b0，其中L是最后一个隐藏层；P表示最终的预测输出，是虚假信息的概率；采用对比学习的方法，对于任意文本数据x，对比学习方法目的是学习一个encoderf：scorefx,fx+＞＞scorefx,fx-其中，fx是一个编码器，它将数据x映射到一个嵌入空间；x+是和x相似的样本，被当作正样本；x-是和x不相似的样本，被当作负样本；score得分是两个样本之间相似度的度量；构造一个softmax分类器，正确分类正样本和负样本；鼓励score函数对正样本赋值大于对负样本赋值：其中，τN为超参数，用于控制负样本的数量；EX表示对x的期望值；fxj表示将输入数据xj映射到嵌入空间；分母项由一个正样本和N-1个负样本组成，使用点乘作为得分函数：scorefx,fx+＝fxT,fx+其中，T表示转置；步骤4：损失函数与优化；步骤4.1：设计损失函数；设计一种余弦相似度损失函数：其中，分别是模型输出的向量和目标向量；通过从1中减去余弦相似度，是为确保当两个向量非常相似，即余弦相似度接近1时，损失接近0，当它们不相似，即余弦相似度远离1时，损失增大；使用二元交叉熵损失函数Losscrossen：其中，N是训练样本的数量；pi是模型对第i个样本预测为虚假的概率；yi是真实标签；最终损失函数Losstotal如下：Losstotal＝μLosscosine+1-μLosscrossen其中，μ是位于0到1之间的权重系数；步骤4.2：使用Adam优化器进行训练；步骤5：训练模型；步骤5.1：平衡采样；采用一个平衡采样器，从除去正样本的L-1个位置中随机选出r个作为负样本；训练过程中，模型每次给出预测值后，都随机采样负样本，并更新采样器的随机种子，确保每次采样的数值都不相等；步骤5.2：计算损失函数loss；在随机挑选出r个负样本后，已经达到了正负样本的相对平衡；使用步骤4自定义的损失函数进行迭代优化；步骤5.3：反向传播；在平衡采样并计算出损失函数loss之后，进行loss的反向传播；重复该过程，直到模型的表现达到要求；步骤6：根据训练好的模型，验证集评估模型的准确率和召回率，根据结果调整模型参数；在该分类问题中，样本一共有两种类别：Positive人工和Negativ机器，分类结果分为以下几种：TruePositive，TP：把正样本成功预测为正；TrueNegative，TN：把负样本成功预测为负；FalsePositive，FP：把负样本错误地预测为正；FalseNegative，FN：把正样本错误的预测为负；在模型中，评价指标Accuracy、Precision、Recall和F1score的定义如下：首先，根据步骤1和步骤2，得到虚假信息的数字化表示；然后，将得到的数据输入模型，模型进行步骤3和步骤4；最后，输出概率最大的类别。

全文数据：

权利要求：

百度查询：国家计算机网路与信息安全管理中心针对虚假信息的人机内容判别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种新型船舶外表面修复喷涂机

下一篇：数据的安全识别方法及存储介质

相关技术

一种新型船舶外表面修复喷涂机

数据的安全识别方法及存储介质

一株具有减肥、降血糖作用的乳酸片球菌及其后生元和应用

一种复合管连接器

用于锂电池的极耳夹持装置

具有铰接臂及储层表征和绘图能力的激光钻孔工具

超声测量项属性修改方法、装置、设备及可读存储介质

基于通用成像模型的平行光管出射光束建模和像机内参数标定方法

动效模板生成方法、图片动态展示方法、装置及电子设备

一种圆管激光焊接装置

小动物在线无创肺功能监测仪

一种脉冲调制装置

信息相关技术

信息处理装置、信息处理方法以及信息处理程序_株式会社ZOZO_202380024829.2

信息处理装置、信息处理方法、及信息处理程序_电子技巧股份有限公司_201980050377.9

信息处理装置、信息处理方法、以及程序_日本烟草产业株式会社_202280092541.4

信息处理设备、信息处理方法和程序_索尼集团公司_202380025864.6

信息处理设备、信息处理方法和程序_索尼集团公司_201980078842.X

模糊与个人可识别信息(PII)有关的信息_微软技术许可有限责任公司_201980038463.8

信息输入方法、装置_维沃移动通信有限公司_202111119724.4

信息处理装置_松下知识产权经营株式会社_202080042102.3

信息处理方法_丰田自动车株式会社_202410451799.X

信息处理装置_京瓷株式会社_202380023425.1

判别相关技术

针对虚假信息的人机内容判别方法_国家计算机网路与信息安全管理中心_202410701140.5

基于多核判别联合概率最大均值差异的轴承故障诊断方法及系统_上海大学_202411113728.5

一种电力工程风积砂密实度判别装置_中国能源建设集团陕西省电力设计院有限公司_202420362224.6

一种基于电缆不同故障类型综合判别方法及系统_南京恒星自动化设备有限公司_202410797123.6

变速抽水蓄能机组转子绕组单相接地故障的判别方法_南京南瑞继保电气有限公司_202010735823.4

一种用于具有类指纹结构的褶皱防伪标签的防伪判别方法_南京航空航天大学_202410676059.6

一种基于图像信息判别原位溶浸性态的装置及方法_北京科技大学_202410673212.X

一种基于DTW算法的企业异常用电判别方法_浙江图盛输变电工程有限公司温州科技分公司_202310425587.X

一种基于石英的锑矿成矿潜力判别方法_中南大学_202411295412.2

一种基于网格的航站楼客流拥挤状态判别方法_南京航空航天大学_202010781592.0

人机相关技术

无人机外挂吊篮_江苏康叶宝生物科技有限公司_202420030384.0

一种无人机副翼操纵系统和无人机_河北通飞未来飞行器有限公司_202420675434.0

应急处置场景下的无人机控制方法、装置、无人机及介质_拓攻(南京)机器人有限公司_202111145912.4

一种无人机机库_龙合智能装备制造有限公司_202420201650.1

一种无人机_蔚蓝空间飞行器有限公司_202411199483.2

无人机集成起降平台系统_国网湖北省电力有限公司随州供电公司_202410682711.5

无人机飞行控制系统_河南优翔宜飞科技有限公司_202420282946.0

能够提高无人机空间利用率的可折叠机翼的无人机_观典防务技术股份有限公司_202411303828.4

一种无人机集群的多目标协同跟踪与决策方法及无人机_中国电子科技集团公司第二十研究所_202410849842.8

无人机的测试方法、测试装置、遥控器及无人机测试系统_黑龙江惠达科技股份有限公司_202411060753.1

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

针对虚假信息的人机内容判别方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务