一种具备主动学习能力的大模型自动进化系统及方法

导航：龙图腾网> 最新专利技术> 一种具备主动学习能力的大模型自动进化系统及方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：山东浪潮科学研究院有限公司

摘要：本发明提出一种具备主动学习能力的大模型自动进化系统及方法，属于人工智能技术领域，包括：数据模块，用于收集用户的交互数据、外部公开数据；生成模块，根据提示工程，对收集的数据，生成QA的评估数据集；评估模块，利用QA的评估数据集，对大模型进行测试评估获得评估结论和数据集；指导模块，根据评估结论和生成的数据集，通过自动化和规则的方式，制定优化计划，生成大模型进一步优化的方向；计划模块，用于执行优化计划，能够根据生成的优化计划，调用相应的计算资源、数据资源，去实现大模型的迭代优化，能够让大模型具备自主学习能力，使得大模型具备更加强大的泛化能力、场景适配能力，从而更好的满足用户的需求。

主权项：1.一种具备主动学习能力的大模型自动进化系统，其特征在于，包括：数据模块，用于收集用户的交互数据、外部公开数据；数据模块从多种异构数据源中获取信息,包括数据抓取和对数据的初步分析；数据抓取分为内部数据读取和外部数据读取，内部数据读取采用读取结构化数据库MySQL，外部数据读取是通过爬虫抓取公开的数据；数据初步分析具体步骤包括，首先去除无效字符；然后对数据进行切分，获取切分后的数据；最后对切分的数据做数据信息提取，生成对应数据的关键信息；多种异构数据源包括网络数据、图文信息和文档；关键信息包括摘要、知识点，表示段落或句子描述的主要内容和提到的关键词；生成模块，根据提示工程，对收集的数据，生成QA的评估数据集；评估模块，利用QA的评估数据集，对大模型进行测试评估获得评估结论和数据集，步骤包括：步骤1，数据准备，获取历史QA的评估数据集和从环境中新获取的外部知识数据构成的QA的评估数据集；将从环境中新获取的外部知识数据构成的QA的评估数据集，记为，与智能体已学习过的历史QA的评估数据集进行合并，得到最新的用于评估的QA的评估数据集：步骤2，模型预测，使用智能体当前的模型M对QA的评估数据集进行预测，得到预测结果；步骤3，评估指标计算，将预测结果与QA的评估数据集的真实标签进行比较，计算各项评估指标，包括准确率、精确率、召回率、F1分数；步骤4，评估结果分析，对步骤3得到的各项指标进行分析，关注以下两方面：1新数据上的指标表现，与历史数据上的指标表现进行比较，判断模型在新数据上的泛化能力；2模型M在各个类别或数据子集上的指标表现，识别模型M存在的偏差或薄弱点；识别模型存在的偏差或薄弱点步骤包括：绘制模型M在不同类别或子集上的混淆矩阵；混淆矩阵直观地展示了模型M将某个类别错误预测为其他类别的情况；步骤5，适应性调整，根据步骤4的分析结果，自适应地调整模型M对新知识的接受程度，具体调整方式使用MAML算法；假设模型参数为，学习率为，新数据上的损失函数为，参数更新公式为；这里的新参数即为调整后的模型参数，相比模型参数，在新数据上有更好的适应性；步骤6，模型更新，将步骤5得到的新参数应用到模型M中，得到更新后的模型，用于后续的预测和学习任务，形式化表示为：其中：M表示智能体当前的模型；表示经过自我评估和适应性调整后得到的新模型；表示将更新后的参数应用到原模型M的操作，即步骤6中的模型更新过程；表示模型参数；表示学习率；表示在新数据上计算得到的损失函数，衡量了模型在新数据上的表现；表示损失函数对模型参数的梯度，指示了如何调整参数以减小新数据上的损失;表示根据梯度下降法更新模型参数，即步骤5中的适应性调整过程；指导模块，根据评估结论和生成的数据集，通过自动化和规则的方式，制定优化计划，生成大模型进一步优化的方向；确定优化方向和生成优化计划的具体实现涉及多个步骤，以下是确定优化方向的详细实现方法：步骤1.1，数据分析：利用统计方法分析评估结果，识别模型性能低下的特定任务或数据集；应用混淆矩阵、ROC曲线工具来深入了解模型在不同类别上的表现；步骤1.2，模型诊断：通过模型诊断技术来识别模型中的过拟合或欠拟合问题；使用正则化技术来减少过拟合风险；步骤1.3，决策树分析：构建决策树模型，以评估结果作为输入，输出优化建议；决策树通过递归划分数据集，为不同的性能问题提供定制化的优化方向；利用决策树判断模型是否出现过拟合、不收敛和欠拟合；生成优化计划的具体执行步骤：步骤2.1，模型结构调整：根据优化方向，自动调整Transformer架构的层数、头数或激活函数；应用神经架构搜索技术来寻找最优的网络结构；指导模块决定采用NAS技术来自动搜索最优的Transformer架构；具体实现步骤如下：1.定义搜索空间：指定Transformer架构的可调超参数及其取值范围，编码器和解码器层数：从2到12之间的整数；注意力头数：从4到16之间的整数；前馈网络隐藏层维度：从128到2048之间的整数；激活函数：ReLU、GELU、Swish；2.选择NAS算法：采用基于强化学习的ENAS算法，该算法通过参数共享和策略梯度优化，能够高效地搜索大规模架构空间；3.定义Reward函数：Reward函数用于评估每个候选架构的性能，需要平衡模型质量和计算效率；采用加权和的方式，将Perplexity和推理速度作为Reward的两个分量，并设置权重系数；4.自动搜索和评估：ENAS算法在搜索空间中自动采样候选架构，并在验证集上评估其Reward；经过多轮迭代，算法将选出Reward最高的架构作为最优结构；5.重新训练和微调：使用搜索出的最优架构，在完整的训练数据上重新训练Transformer模型；步骤2.2，训练算法选择：根据任务特性和数据集特性，选择最适合的训练算法；步骤2.3，损失函数定制：针对不平衡数据集，设计加权损失函数，实验不同的损失函数，选择在验证集上表现最佳的损失函数；步骤2.4，多目标优化：采用Pareto优化的多目标优化技术，同时考虑多个性能指标，使用遗传算法来平衡不同指标的优化；步骤2.5，用户交互：提供用户交互界面，允许研究人员或开发者根据经验提出优化建议，结合用户反馈调整自动化优化流程；步骤2.6，计划执行：将优化计划传递给计划模块；计划模块，用于执行优化计划，能够根据生成的优化计划，调用相应的计算资源、数据资源，去实现大模型的迭代优化。

全文数据：

权利要求：

百度查询：山东浪潮科学研究院有限公司一种具备主动学习能力的大模型自动进化系统及方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种船舶激振装置及船体振动试验分析方法

下一篇：一种大花海棠染色体加倍的诱导方法

相关技术

一种船舶激振装置及船体振动试验分析方法

一种大花海棠染色体加倍的诱导方法

用于治疗三尖瓣功能不全的系统、方法和装置

基于AI的PCB或半导体多工序生产设备组合优化方法

一种移动医疗推车

振镜和激光雷达

一种光纤光栅生命体征监测装置和方法

通过光学衍射改善粒度

一种应用于硅碳复合材料的反应装置

一种切菜器

水封逆止阀及其使用方法

一种带有封堵机构的注液套杯组件

模型相关技术

模型评估方法及装置_中国电信股份有限公司_202410896650.2

生物教学用大脑模型_章嘉懿_202323663194.7

数据生成模型获取方法_珠海金山数字网络科技有限公司_202410682552.9

一种风险模型中多标签模型的处理方法_河南中原消费金融股份有限公司_202411079805.X

一种珠宝自动检测模型的建模方法、模型及检测方法_河北地质大学_202410804913.2

一种基于大模型的债务人画像分析处理方法与模型_杭州度言软件有限公司_202410871597.0

大语言模型和小语言模型协同的民生诉求事件分拨方法_中电万维信息技术有限责任公司_202410774675.5

一种模型训练方法、海底地形预测方法及模型训练装置_广州海洋地质调查局_202410589025.3

模型训练方法及装置_中国电信股份有限公司_202410896564.1

岩土信息模型的建立方法_华中科技大学_202410676259.1

自动相关技术

集自动理袋、自动升降、自动热合于一体的封口装置_漳州青牛科技有限公司_202323530394.5

自动层析柱_江苏汉邦科技股份有限公司_202410927877.9

自动配药器_浙江理工大学_201910792564.6

自动上料机_深圳悦和精密技术有限公司_202420410032.8

自动驾驶车辆_上海易咖智车科技有限公司_202420478325.X

自动接电装置_宜兴赛弗冶金机械有限公司_202323575951.5

自动脱模机_包头市公路建设开发有限责任公司_202421965120.0

自动理疗设备_台州市瀚维数康智能制造有限公司_202323265103.4

自动卸料装置_中交机电工程局有限公司_202410167345.X

自动选配装置_中国第一汽车股份有限公司_202410673972.0

能力相关技术

一种曳引能力自动测试方法_巨人通力电梯有限公司_202410823833.1

一种抗震能力强的平板电脑_深圳合悦丰科技有限公司_202323549490.4

一种具有高强度和承重能力的置物篮_惠州市昌旺达五金制品有限公司_202323003060.2

基于短路电流支撑能力的电力系统无功分区方法及系统_国网山东省电力公司济南供电公司_202410700478.9

一种提高大豆产量与耐盐能力的方法_中国农业科学院作物科学研究所_202410890137.2

一种交直流混联输电网负荷承载能力的评估方法_东南大学_202410697657.1

设备能力获取方法、装置、客户端及存储介质_普联技术有限公司_202410657940.1

一种基于能力自匹配模型的通信筹划方法_中国电子科技集团公司第七研究所_202410470550.3

一种深部地层支撑剂支撑裂缝导流能力预测方法_西南石油大学_202410888854.1

一种能够调节曳引能力的电梯曳引机台_杭州义忠德电梯配件有限公司_202322958734.8

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种具备主动学习能力的大模型自动进化系统及方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务