一种基于词频和逆文档频率的精准匹配硬件日志分类方法

导航：龙图腾网> 最新专利技术> 一种基于词频和逆文档频率的精准匹配硬件日志分类方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：电子科技大学

摘要：本发明公开了一种基于词频和逆文档频率的精准匹配硬件日志分类方法，为基于精准正则匹配算法以及词频和逆文档频率算法对日志进行整理、分类，管理硬件日志和其他文本的辅助程序设计和维护的方法。该方法利用正则匹配进行精准匹配和模糊匹配，从而进行日志的有效整理和分类，并进行原文和筛选的记录和保存，同时新增支持用户自定义筛选规则，如果有默认功能之外的需求，用户可以根据自己的具体需求进行自定义筛选。本发明对复杂和繁琐的硬件开发过程中的日志文件和其他相应文件进行筛选、整理和归类，高效地提取针对本次研发的有用信息，极大地简化了开发流程的的调试环节，缩短了测试和调试的时间，优化了开发过程的测试的效率。

主权项：1.一种基于词频和逆文档频率的精准匹配硬件日志分类方法，其特征在于，包括以下步骤：1、获取日志文件上传或直接复制的方式，获取硬件开发过程中产生的日志文件；2、选择算法所述算法包括两种算法，分别是词频和逆文档频率算法以及正则匹配算法，其中，正则匹配算法是必须开启的算法，用户根据自己的需求决定是否开启词频和逆文档频率算法，词频和逆文档频率算法包括可以单独开启的词频算法以及在开启词频算法基础上进一步开启的逆文档频率算法；3、选择模式基于正则匹配算法包含常规模式和额外的用户自定义模式，用户根据自己的需要进行选择；在常规模式中，提供一些常见的利于硬件系统开发的模式，包括常见的“Warning”警告、“Info”信息以及“Error”错误的分类模式以及进行所有分类的全分类模式；在用户自定义模式中，是针对某些特定的场合或者特定的需求，用户根据自己的需求或特制系统的需求进行额外功能的规定和定制；4、获取匹配规则或格式根据选择的模式获取匹配规则或格式：如果步骤3中，选择的模式为常规模式，则根据选择的常规模式，自动获取相应的匹配规则；如果选择用户自定义模式，则需要用户输入自己的需求即匹配格式；5、转义对匹配规则或用户输入的匹配格式进行转义，以便于用户的快速理解和开发，也为不具备正则相关知识的用户提供便捷的使用可能；6、进行匹配运算针对获得日志文件和转义后的匹配规则或格式进行匹配运算，包括匹配查找、匹配结果获取、筛选并清理匹配结果、迭代运算、整理和归类步骤：6.1、匹配查找首先需要在所有获得的日志文件中匹配查找，即是把步骤5中进行转义后的匹配规则或格式，对所有日志文件进行查找运算：如果没有做限定的，则进行全查找模式即把日志文件中所有满足匹配规则或格式的项都筛选匹配；6.2、匹配结果获取对查找到的匹配结果进行提取，得到匹配文件，如果需要，向前后索引到所需提取的内容，而不单单是只提取匹配的内容，此外，默认按照不同的序号进行分类；6.3、筛选并清理匹配结果筛选提取匹配结果为有效信息，保存照清除筛选提取的匹配结果后的日志并进行对比，以便能更好的分析出开发遇到的问题；6.4、迭代运算清除筛选提取的匹配结果后的日志文件供下一轮的筛选，支持多轮筛选，默认按照日志中的索引号进行分类，所有索引号相同的日志列到一个文件；6.5、整理和归类最后将所有的日志文件，包含获取的日志文件、所有匹配文件以及清除筛选后索引号分类的文件，都整理并罗列出来，供用户快速查阅；7、进行词频算法运算如果在步骤2中开启了基于词频算法，则对步骤6得到的所有日志文件进行词频算法运算：7.1、分词对转义后的匹配规则或格式中的关键词和筛选后的所有日志文件进行分词运算，从而得到核心分词词组；7.2、统计对每个核心分词词组进行计数，记录每个核心分词词组在出现的次数；7.3、标准化将每个核心分词词组在出现的次数除以日志文件中总的词数，得到词频TFt,d: 其中，nt,d表示核心分词词组t在日志文件d中出现的次数，nk,d表示任一核心分词词组k在日志文件d中出现的次数，∑knk,d表示日志文件d中总的词数；根据词频nt,d对步骤6得到的所有日志文件进行整合优化，按照重要程度的排列和分类；8、进行逆文档频率算法运算如果在步骤2中开启了逆文档频率算法，可对步骤7后的结果进行逆文档频率算法运算：8.1、求解IDF值核心分词词组t对于所有日志文件集合D的逆文档频率值即IDF值IDFt,D为：其中，|D|表示所有日志文件集合D中日志文件的数量，|d∈D:t∈d|表示包含核心分词词组t的日志文件d的数量；8.2、求解TF-IDF值对于核心分词词组t，其在日志文件d的TF-IDF值TF-IDFt,d,D为：TF-IDFt,d,D＝TFt,d×IDFt,DTF-IDF值TF-IDFt,d,D越大，表示核心分词词组t对于日志文件d的重要性越；8.3、优化整合数据根据TF-IDF值TF-IDFt,d,D对步骤6得到的所有日志文件进行整合优化，按照重要程度的排列和分类；9、对比和回溯按照时间节点作为每一轮的分类原则，在对某一模块进行编译的时候，每一轮的编译都会产生临时日志文件，保存每一轮留下的日志，从而方便开发者比较和回溯。

全文数据：

权利要求：

百度查询：电子科技大学一种基于词频和逆文档频率的精准匹配硬件日志分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种空穴传输层材料Spiro-OMeTAD的合成方法

下一篇：绿色重楼病虫害防治方法

相关技术

一种空穴传输层材料Spiro-OMeTAD的合成方法

绿色重楼病虫害防治方法

一种低硬度彩色天然橡胶材料及其制备方法

一种玻璃瓶裂纹检测装置

一种塑料导气管成型设备

大语言模型生成SQL查询语句中的数据权限控制方法及设备

用于工业环境中对象的质量评估的方法和系统

塔式光热发电背板冲压平直度仿真模拟评价方法

一种纳米MoOx共晶体和太阳能光热发电板

一种沙门氏菌预富集培养基及其制备方法和在即食调味品中的应用

多通阀、热管理系统和车辆

一种基于机场场面空地互联的虚拟交通灯系统

精准相关技术

一种精准血液透析系统_江苏关怀医疗科技有限公司_202011613348.X

便于精准对接的试剂卡壳模具_烟台康州塑业有限公司_202323438155.7

一种精准雕刻装置_福建优倍特模塑科技有限公司_202420799228.0

一种精准升温马弗炉_浙江宏正检测有限公司_202420544715.2

一种高效精准播种器_江南大学_202411448623.5

一种精准工业自动控制仪表_无锡超巨自动化科技有限公司_202420442350.2

一种精准格式化磁盘的方法_北京中科通量科技有限公司_202411026140.6

存量旧建筑精准诊断改造与设计方法_广州市市政集团设计院有限公司_202410179527.9

一种精准用药辅助决策方法及系统_首都医科大学附属北京友谊医院_202411452638.9

一种吉他生产木料精准裁切定形装置_江西美丽达乐器有限公司_202420002190.X

匹配相关技术

一种汽车前脸系统匹配定位结构及匹配定位方法_奇瑞汽车股份有限公司_202411174960.X

匹配图像的方法及装置_浙江大华技术股份有限公司_202411440094.4

一种图文匹配方法、图文匹配多模态大模型及大模型训练方法_杭州联汇科技股份有限公司_202411448052.5

基于人工智能的保险匹配方法_深圳尹硕科技有限公司_202411155571.2

一种简历匹配度智能评估方法_湖北省珍岛数字智能科技有限公司_202411172556.9

用于约束系统匹配模拟试验的可调节车身_上汽通用汽车有限公司_202010190491.6

地图匹配定位方法、装置及存储介质_智道网联科技(北京)有限公司_202111194046.8

一种匹配测试界面的连接装置_杭州芯矩科技有限公司_202420443995.8

基于大数据的应急产业资源信息匹配优化方法_中技应急科创科技发展(辽宁)有限公司_202411322443.2

基于配网线路潮流匹配的设备检修方法、系统及相关装置_中国电力科学研究院有限公司_202410922249.1

硬件相关技术

一种SM3算法硬件实现电路_苏州特思恩科技有限公司_202411069896.9

学习模型的硬件部署方法、相关装置和介质_亿铸科技(上海)有限公司_202410955434.0

基于集成控制模块的硬件交互系统_新疆河润科技股份有限公司_202410991779.1

一种解码端运动矢量精细化的硬件结构_复旦大学_202410926967.6

一种控制器到机架星型连接的硬件架构_中控技术股份有限公司_202411077003.5

一种基于计算机软硬件的形变位移测试架_上海悉像科技有限公司_202411457373.1

硬件TEE下程序漏洞自动化检测方法与系统_湖南大学_202411095338.X

一种计算机硬件固定装置_江西机电职业技术学院_202420825543.6

一种动态可配置的NTT硬件实现方法及系统_山东多次方半导体有限公司_202411018345.X

一种提高硬件吞吐率的AI模型优化部署的方法_奕行智能科技(广州)有限公司_202411423835.8

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于词频和逆文档频率的精准匹配硬件日志分类方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务