一种用于文本分类模型的数据智能分类方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：温州市数据集团有限公司

摘要：本申请涉及文本数据分类技术领域，具体涉及一种用于文本分类模型的数据智能分类方法，该方法包括：采集日志语句、日志词语和日志词语的词性；获取任意两条日志文本之间的词性分布系数；进而获取任意两条日志文本之间的文本相似性系数；获取任意两条日志文本之间的相似性故障相关度；计算词语位置系数；进而获取语句共现系数；获取任意两条日志文本之间的部件状态关联契合度；进而获取任意两条日志文本之间的概率转换系数；获取任意两条日志文本之间的修正关联度概率；使用聚类算法对所有日志文本进行分类。本申请弥补了现有方法在识别仪器状态波动位置相似性和描述相似性方面的不足，实现了对日志文本的高效、精准分类管理。

主权项：1.一种用于文本分类模型的数据智能分类方法，其特征在于，该方法包括以下步骤：采集各日志文本中的日志语句、日志词语和日志词语的词性，对日志词语和日志词语的词性进行编码构建各日志文本的日志词语向量集合，根据日志语句构建各日志文本的日志语句集合；根据各日志文本中日志词语的个数获取任意两条日志文本之间的词性分布系数；根据日志词语向量集合获取任意两条日志文本之间的文本相似性系数；根据词性分布系数和文本相似性系数获取任意两条日志文本之间的相似性故障相关度；根据日志语句集合中日志词语的位置获取各日志文本中的各日志语句与其他各日志文本中的各日志语句的词语位置系数；根据词语位置系数和日志语句集合获取各日志文本中的各日志语句与其他各日志文本中的各日志语句之间的语句共现系数；根据相似性故障相关度和语句共现系数获取任意两条日志文本之间的部件状态关联契合度；根据部件状态关联契合度获取任意两条日志文本之间的概率转换系数；根据概率转换系数获取任意两条日志文本之间的修正关联度概率；使用聚类算法，根据修正关联度概率对所有日志文本进行分类；所述根据各日志文本中日志词语的个数获取任意两条日志文本之间的词性分布系数，包括：计算相同词性下第a条日志文本中日志词语的个数与第b条日志文本中日志词语的个数之间的差值绝对值，计算所有词性中所有所述差值绝对值的和值，将以自然常数为底、以所述和值为指数的指数函数的计算结果作为第a条日志文本与第b条日志文本之间的词性分布系数；所述根据词性分布系数和文本相似性系数获取任意两条日志文本之间的相似性故障相关度，包括：将任意两条日志文本之间的文本相似性系数与词性分布系数之间的比值作为任意两条日志文本之间的相似性故障相关度；所述根据日志语句集合中日志词语的位置获取各日志文本中的各日志语句与其他各日志文本中的各日志语句的词语位置系数，包括：将各日志词语在其所在日志文本中出现的所有位置序号的均值作为各日志词语的全局平均位置；计算第a条日志文本中日志语句集合中第个日志语句中第个日志词语的全局平均位置与第b条日志文本中日志语句集合的第个日志语句中第个日志词语的全局平均位置之间的差值绝对值，将第条日志文本中第个日志语句和第条日志文本中第个日志语句之间所有对应的日志语句的差值绝对值的和值作为第条日志文本中第个日志语句和第条日志文本中第个日志语句之间的词语位置系数；所述语句共现系数，公式为：式中，是第条日志文本中第个日志语句和第条日志文本中第个日志语句的语句共现系数，是第条日志文本中第个日志语句和第条日志文本中第个日志语句的词语位置系数；是第a条日志文本中日志语句集合中第个日志语句中位置参数分别为、的两个日志词语之间的点互信息，是第b条日志文本中日志语句集合的第个日志语句中位置参数分别为、的两个日志词语之间的点互信息；是最大值函数；是第条日志文本的日志语句集合的第个日志语句中日志词语的个数，是第条日志文本的日志语句集合的第个日志语句中日志词语的个数；所述根据相似性故障相关度和语句共现系数获取任意两条日志文本之间的部件状态关联契合度，包括：计算第条日志文本与第条日志文本中所有日志语句之间的语句共现系数的和值，计算以自然常数为底、以所述和值为指数的指数函数的计算结果，计算所述计算结果和第条日志文本与第条日志文本之间的相似性故障相关度的乘积作为第条日志文本与第条日志文本之间的部件状态关联契合度；所述根据部件状态关联契合度获取任意两条日志文本之间的概率转换系数，包括：将任意两条日志文本之间的部件状态关联契合度减数字1后取绝对值的结果作为任意两条日志文本之间的修正关联度；计算所有日志文本之间的修正关联度的和值，计算任意两条日志文本之间的修正关联度与所述和值的比值，将数字1与所述比值的差值作为任意两条日志文本之间的概率转换系数；所述根据概率转换系数获取任意两条日志文本之间的修正关联度概率，包括：计算所有任意两条日志文本之间的概率转换系数的和值，将任意两条日志文本之间的概率转换系数与所述和值的比值作为任意两条日志文本之间的修正关联度概率；所述使用聚类算法，根据修正关联度概率对所有日志文本进行分类，包括：将所有日志文本按照日志时间顺序依次赋予一个名称标识符；将任意两个日志文本之间的修正关联度概率作为日志文本矩阵中对应名称标识符所在行、列位置的元素值；将日志文本矩阵作为马尔科夫图聚类算法的输入，输出日志文本的智能分类结果。

全文数据：

权利要求：

百度查询：温州市数据集团有限公司一种用于文本分类模型的数据智能分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种纺线防缠绕装置

下一篇：一种磷石膏基生态修复材料淋溶水回收设备

相关技术

一种纺线防缠绕装置

一种磷石膏基生态修复材料淋溶水回收设备

一种汉麻肽制备用原料储存装置

一种用于配电箱的自协同除湿机构

一种基于PWM的智慧路灯控制装置及系统

一种过滤式水质分析检测仪

一种墙体支撑装置

导向机构以及混合型输送线

一种移动可调节护栏钢筋绑扎安全胎架

一种具有定位安装功能的护栏

一种组合式口腔护理吸痰管

注塑件切割打标设备

数据相关技术

大数据共享方法、装置以及大数据共享系统_国网北京市电力公司_202111434664.5

数据处理方法_水利部信息中心(水利部水文水资源监测预报中心)_202410631344.6

点云数据发送装置、点云数据发送方法、点云数据接收装置以及点云数据接收方法_LG电子株式会社_202280087394.1

一种基于大数据的TSP数据平台数据处理系统_苏州英思唯智能科技有限公司_202410550872.9

数据存储方法和装置_北京白山耘科技有限公司_201911055807.4

数据同步方法和装置_华为云计算技术有限公司_202310165047.2

数据发送方法及装置_北京小米移动软件有限公司_201880000375.4

电池片数据采集系统_苏州华兴源创科技股份有限公司_202322816176.1

数据处理方法、终端设备和数据处理系统_创新先进技术有限公司_202111073291.3

隐私保护数据聚合装置和隐私保护数据聚合系统_株式会社NTT都科摩_202280089206.9

分类相关技术

垃圾分类遮雨亭_南通诺佳尔环境科技有限公司_202420276473.3

母细胞分类_霍夫曼-拉罗奇有限公司_202280085313.4

基于文本分类器的图像分类方法、系统、存储介质及电子设备_上海蜜度蜜巢智能科技有限公司_202410632356.0

一种颗粒复合肥结块等级评定用分类装置及分类方法_安徽富瑞雪化工科技股份有限公司_202410667187.4

分类方法、分类模型的训练方法、装置、设备及存储介质_北京小米松果电子有限公司_202010622932.5

移载检测分类机台_晟耀光电科技股份有限公司_202310499043.8

一种票据分类收纳装置_中国电建集团华东勘测设计研究院有限公司_202420114256.4

一种垃圾分类箱_广东东江环境科技有限公司_202420250087.7

一种智能垃圾分类小车_苏州大学_202420369088.3

一种基于物联网的智能分类垃圾箱系统及智能分类垃圾箱_湖南温瑞环保科技有限公司_202410851284.9

模型相关技术

车辆驱动系统的模型_上海科梁信息科技股份有限公司_202410735998.3

基于上下文模型的Instant-NGP模型压缩方法_上海交通大学_202410704702.1

一种基于NARX模型的大模型训练慢节点检测方法_天翼云科技有限公司_202410864138.X

增强多模态大语言模型视觉感知能力的方法、模型和装置_华中科技大学_202410716799.8

模型训练方法和基于模型的场景流估计方法_天津港(集团)有限公司_202411061324.6

电机轴承剩余寿命预测方法、系统、模型及模型训练方法_成都赛力斯科技有限公司_202411052755.6

模型训练方法、模型推理方法、电子设备及存储介质_上海壁仞科技股份有限公司_202410912446.5

牙齿模型套具及复层根管治疗术练习模型_北京大学口腔医学院_202410865138.1

用于模型解释的方法及装置_支付宝(杭州)信息技术有限公司_202210369552.4

用于分割的双级别模型_脸萌有限公司_202380018666.7

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种用于文本分类模型的数据智能分类方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务