基于分类网络模型的文本分类方法、装置、终端及介质

导航：龙图腾网> 最新专利技术> 基于分类网络模型的文本分类方法、装置、终端及介质

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：广州永哲信息技术有限公司

摘要：本发明公开了一种基于分类网络模型的文本分类方法、装置、终端及可读存储介质，该方法包括：获取多种类型的样本文件，并将每一样本文件均转换为包括正文文本、后缀文本、标题文本和其他信息文本的多源信息文本；调用基于多源信息融合与特征提取分类网络所构建的分类初始模型，并对多源信息文本进行预处理，生成带标签的训练数据传输到分类初始模型，对分类初始模型进行训练，获得分类网络模型；基于分类网络模型对待分类文本进行分类识别，确定待分类文本所归属的文本类别。本发明通过多源信息文本对多源信息融合与特征提取分类网络所构建的分类初始模型进行训练，生成分类网络模型对文本进行分类，实现了文本的准确分类。

主权项：1.一种基于分类网络模型的文本分类方法，其特征在于，所述基于分类网络模型的文本分类方法包括：获取多种类型的样本文件，并将每一所述样本文件均转换为多源信息文本，其中，所述样本文件的类型包括doc、docx、ppt、pptx、xls、xlsx、png、jpg、tiff、dwg、pdf，所述多源信息文本为含有可读文字的文本文件，所述多源信息文本至少包括正文文本、后缀文本、标题文本和其他信息文本；调用基于多源信息融合与特征提取分类网络所构建的分类初始模型，并对所述多源信息文本进行预处理，生成带标签的训练数据传输到所述分类初始模型，对所述分类初始模型进行训练，获得分类网络模型；基于所述分类网络模型对待分类文本进行分类识别，确定所述待分类文本所归属的文本类别；其中，所述预处理包括分词和清洗，所述对所述多源信息文本进行预处理，生成带标签的训练数据传输到所述分类初始模型的步骤包括：对每一所述多源信息文本按照预设分词规则进行分词处理，获得与每一所述多源信息文本对应的分词组，并对每一所述分词组中的分词进行过滤清洗，获得选定分词组；对各所述选定分词组基于预设长度进行编码，生成与每一所述多源信息文本对应的词嵌入向量；构造与预设类别数对应的类别嵌入向量，并在将所述类别嵌入向量的维度设定为所述词嵌入向量的维度后，将所述词嵌入向量和所述类别嵌入向量生成为带标签的训练数据传输到所述分类初始模型；所述生成带标签的训练数据传输到所述分类初始模型，对所述分类初始模型进行训练，获得分类网络模型的步骤包括：在生成带标签的训练数据后，将所述训练数据传输到所述分类初始模型，对所述分类初始模型进行训练，并计算所述分类初始模型的交叉熵分类损失函数值；根据所述交叉熵分类损失函数值，判断所述分类初始模型是否达到收敛条件，若达到收敛条件，则完成对所述分类初始模型的训练，并基于训练获得的目标模型参数，将所述分类初始模型生成为分类网络模型。

全文数据：

权利要求：

百度查询：广州永哲信息技术有限公司基于分类网络模型的文本分类方法、装置、终端及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：抗猪IgG抗体及其应用

下一篇：一种基于监控图像分析数据的摄像头调控方法

相关技术

抗猪IgG抗体及其应用

一种基于监控图像分析数据的摄像头调控方法

一种用于循环流化床锅炉的尿素溶液喷射装置

一种基于激光雷达的工程车辆定位方法、装置

一种铜铁双金属纳米诊疗剂及其制备方法和应用

一种数据处理系统、数据处理方法及存储介质

一种海洋污水处理装置

一种汽车钣金件自动焊接设备及其方法

中药喷雾剂及制作方法

眼用组合物

一种对话数据集的构建方法、系统及电子设备

插座

方法相关技术

攻击检测模型的构建方法及攻击检测方法_上海斗象信息科技有限公司_202411019557.X

对准装置及方法、成膜装置及方法和电子器件的制造方法_佳能特机株式会社_202410495098.6

模型压缩方法、训练方法、多媒体数据处理方法及装置_北京百度网讯科技有限公司_202311235188.3

温升预测模型训练方法、预测方法及控制方法_浙江吉利控股集团有限公司_202410908685.3

集成电路的制造方法、设计方法以及备用单元的设计方法_台湾积体电路制造股份有限公司_202410679429.1

图像编码/解码方法和图像数据的传输方法_LX半导体科技有限公司_202411317979.5

资源循环方法及资源循环管理方法_株式会社久保田_202380019741.1

包裹拉距方法及包裹分拣方法_苏州金峰物流设备有限公司_202410973216.X

数据更新方法、信息推送方法及装置_支付宝(杭州)信息技术有限公司_202410852906.X

学习装置、检查装置、学习方法以及检查方法_株式会社斯库林集团_202010947201.8

分类相关技术

风化分类设备_哈斯特帕大学_201980056644.3

遥感影像分类网络训练方法、遥感影像分类方法及产品_河南大学_202410910226.9

基于分类网络模型的文本分类方法、装置、终端及介质_广州永哲信息技术有限公司_202110877266.4

光伏银粉洗涤废水的分类方法和分类系统_湖北银科新材料股份有限公司_202410927593.X

图像分类模型获取方法和图像分类方法、装置和设备_北京大数据先进技术研究院_202410461353.5

一种家用垃圾分类装置_北京倍美利康医疗科技有限公司_202420498090.0

一种档案识别分类装置_合肥市泽川财务咨询服务有限责任公司_202420528414.0

一种食品分类装置_江西省易得利食品有限责任公司_202420143219.6

热敏电阻的分类方法_孝感华工高理电子有限公司_202410906026.6

一种垃圾智能分类系统_成都鸿翔环卫服务有限公司_202310337956.X

文本相关技术

文本输入法以及相关装置_科大讯飞股份有限公司_202111666573.4

基于LSTM的AI文本检测方法_电子科技大学成都学院_202411375257.5

文本标注方法及相关产品_平安科技(深圳)有限公司_202010465811.4

文本识别方法、装置及设备_口碑(上海)信息技术有限公司_202110535189.4

文本定长纠错方法、装置、设备及存储介质_平安银行股份有限公司_202111149204.8

噪声文本分类方法、装置及网络设备_深圳市联合信息技术有限公司_202410889833.1

一种专利文本分类方法及装置_广东电网有限责任公司_202010870909.8

文本转换方法、装置、介质及电子设备_北京有竹居网络技术有限公司_202111217727.1

攻击文本的确定方法、装置及电子设备_西交利物浦大学_202410779715.5

一种文本聚类分析系统及方法_湖南工商大学_202411390524.6

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于分类网络模型的文本分类方法、装置、终端及介质

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务