一种教育领域舆情大数据分类方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：中诚力锘(北京)教育咨询集团有限公司

摘要：本发明属于自然语言处理技术领域，具体涉及一种教育领域舆情大数据分类方法；包括：获取教育领域舆情文本并对其进行舆情类别和情感类别标注，得到教育领域舆情数据集；采用继续预训练的编码模型对教育领域舆情数据集进行编码，得到舆情文本向量；从舆情文本向量中提取舆情文本特征向量；对舆情文本特征向量和舆情文本向量进行处理，得到舆情类别第一概率矩阵和情感类别第一概率矩阵；构建提示模板和选择题模板并采用多任务学习得到舆情类别第二概率矩阵和情感类别第二概率矩阵；融合舆情类别第一概率矩阵和第二概率矩阵得到舆情分类结果，融合情感类别第一概率矩阵和第二概率矩阵得到情感分类结果；本发明可提高分类精确度，有助于舆情控制。

主权项：1.一种教育领域舆情大数据分类方法，其特征在于，包括：S1：获取教育领域的舆情文本并对其进行舆情类别标注和情感类别标注，得到教育领域舆情数据集；S2：采用继续预训练的编码模型对教育领域舆情数据集进行编码，得到舆情文本向量；编码模型继续预训练过程中集成了绝对旋转位置编码方式的注意力机制；绝对旋转位置编码方式的注意力机制表示为：其中，self-attentionmn表示位置m的token和位置n的token的注意力分数，softmax表示softmax归一化函数；ω表示注意力超参数，qm表示第m个token对应的词向量集成绝对旋转位置信息之后的query向量，kn表示第n个token对应的词向量集成绝对旋转位置信息之后的key向量，vn表示第n个token对应的词向量集成绝对位置信息之后的value向量，dk表示key向量的维度；S3：采用首尾重要性循环神经网络从舆情文本向量中提取舆情文本特征向量；舆情文本特征向量包括尾部侧重特征和首部侧重特征；提取舆情文本特征向量的过程包括：S31：将舆情文本向量按照原始顺序送入首尾重要性循环神经网络中得到尾部侧重特征chorder；S32：将舆情文本向量按照原始顺序的逆顺序送入首尾重要性循环神经网络中得到首部侧重特征chreverse；首尾重要性循环神经网络表示为： ot＝reluV*st其中，st表示隐藏层第t步的状态，tanh表示tanh激活函数，U表示输入层连接矩阵，xt表示第t步的输入向量，W表示权重矩阵，st-1表示上一时刻隐藏层的状态，表示包含xt的词的数量，nword表示文档中词的数量，sumtext表示文档的总数，表示包含xt的文档的总数，ot表示第t步的输出，relu表示relu激活函数，V表示输出层的连接矩阵；S4：融合舆情文本特征向量和舆情文本向量，得到最终特征向量；采用两个不同的分类器对最终特征向量进行处理，得到舆情类别第一概率矩阵和情感类别第一概率矩阵；S5：根据教育领域的舆情文本构建提示模板和选择题模板；根据提示模板和选择题模板，采用多任务学习得到舆情类别第二概率矩阵和情感类别第二概率矩阵；对当前文本构造提示学习模板为：[这属于[MASK1]事件][当前文本][情感倾向是[MASK2]]；对当前文本构造选择题模板为：[当前文本][描述的是教育相关的哪方面的事件？作者的态度是？]；多任务学习的损失函数为：其中，loss表示训练总损失，表示第一遮蔽位置的类别数量，ym表示当前样本真实标签是否为m，pm表示当前样本属于m的预测概率，表示第二遮蔽位置的类别数量，yn表示当前样本真实标签是否为n，pn表示当前样本属于n的预测概率，ω′表示权重系数，nchoice表示选择题任务的类别数目，αt表示多任务学习超参数列表，h表示当前样本真实类别的one-hot向量，pt表示输出概率分布，γ表示多任务学习超参数；S6：融合舆情类别第一概率矩阵和舆情类别第二概率矩阵得到舆情分类结果，融合情感类别第一概率矩阵和情感类别第二概率矩阵得到情感分类结果。

全文数据：

权利要求：

百度查询：中诚力锘(北京)教育咨询集团有限公司一种教育领域舆情大数据分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种自动化振动清洗设备

下一篇：被动式腰部外骨骼

相关技术

一种自动化振动清洗设备

被动式腰部外骨骼

一种装配路径规划方法

一种穿线组件及局部放电检测装置

一种提高采收率用纳米渗吸驱油剂

社交网络舆情态势决策方法、装置、设备及介质

新能源车辆故障检测装置

一种压力仪表的检验设备

多屏显示方法、装置、设备和介质

一种固废基改性混凝土及其制备方法

一种欠驱动无人船自适应滑模轨迹跟踪控制方法

一种林业剪枝器

数据相关技术

数据传输方法、数据发送端、数据接收端和存储介质_奉加科技(上海)股份有限公司_202310687099.6

多源财政数据的数据治理方法和系统_上海市大数据中心_202410875165.7

一种用于数据交易的数据确权方法_福建大数据交易有限公司_202411196213.6

基于工业大数据平台的数据治理方法_山东创恩信息科技股份有限公司_202410977238.3

协同数据处理_哈曼国际工业有限公司_201811207668.8

数据增强方法及其装置_北京百度网讯科技有限公司_202410804435.5

数据读取方法及设备_北京字跳网络技术有限公司_202310308701.0

数据共享方法及系统_北京邮电大学_202111138594.9

处理胎儿的图像数据_皇家飞利浦有限公司_202380022290.7

距离测量数据的检测_西克股份公司_202110336145.9

分类相关技术

脑卒中后构音障碍分类模型训练方法、分类方法及装置_广东工业大学_202411129489.2

用于图片分类的遗忘模型的训练方法及图片的分类方法_西安电子科技大学_202410829755.6

扁平图像分类任务重组成树形图像分类任务的方法及系统_西安理工大学_202411196336.X

分类及分类模型训练方法、装置及存储介质_腾讯科技(深圳)有限公司_202210813655.5

一种档案分类存放设备_付丽霞_202420079326.7

元件安装系统及图像分类方法_株式会社富士_202280092821.5

一种生活垃圾分类装置_自然美环境科技有限公司_202410839203.3

一种生活垃圾分类处理用分拣设备_浙江邦凝生态环境建设发展有限公司_202410875420.8

一种芯片自动识别分类装置_丽江市康洁洗涤有限公司_202420195033.5

织物纤维分类方法、装置和电子设备_广东电网有限责任公司中山供电局_202410721554.4

领域相关技术

一种领域中文语言预训练模型构建的方法_西安电子科技大学_202410858178.3

一种跨领域冷启动推荐方法、装置、设备及存储介质_材料科学姑苏实验室_202410756883.2

一种用于能源领域的时间序列预测方法及装置、介质_山东浪潮科学研究院有限公司_202411205956.5

一种轻防腐领域用醇酸乳液的制备方法_广东衡光新材料科技有限公司_202410949784.6

物理模型嵌入到大语言模型应用于专业领域的方法和系统_华东理工大学_202410735958.9

一种应用于医疗领域文档的OCR和信息抽取方法_北京欧应科技有限公司_202010641082.3

一种应用于火电领域的监控设备_韦学栋_202322859006.1

一种面向溯源领域的区块链Raft集群优化方法及系统_广东技术师范大学_202410475598.3

一种化合物、药物组合物及其在扩张血管或抗病毒领域的应用_山东第一医科大学(山东省医学科学院)_202310463286.6

一种基于三维地图的城市安全领域可视化方法及装置_浪潮智慧城市科技有限公司_202411178198.2

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种教育领域舆情大数据分类方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务