首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种具备主动学习能力的大模型自动进化系统及方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:山东浪潮科学研究院有限公司

摘要:本发明提出一种具备主动学习能力的大模型自动进化系统及方法,属于人工智能技术领域,包括:数据模块,用于收集用户的交互数据、外部公开数据;生成模块,根据提示工程,对收集的数据,生成QA的评估数据集;评估模块,利用QA的评估数据集,对大模型进行测试评估获得评估结论和数据集;指导模块,根据评估结论和生成的数据集,通过自动化和规则的方式,制定优化计划,生成大模型进一步优化的方向;计划模块,用于执行优化计划,能够根据生成的优化计划,调用相应的计算资源、数据资源,去实现大模型的迭代优化,能够让大模型具备自主学习能力,使得大模型具备更加强大的泛化能力、场景适配能力,从而更好的满足用户的需求。

主权项:1.一种具备主动学习能力的大模型自动进化系统,其特征在于,包括:数据模块,用于收集用户的交互数据、外部公开数据;数据模块从多种异构数据源中获取信息,包括数据抓取和对数据的初步分析;数据抓取分为内部数据读取和外部数据读取,内部数据读取采用读取结构化数据库MySQL,外部数据读取是通过爬虫抓取公开的数据;数据初步分析具体步骤包括,首先去除无效字符;然后对数据进行切分,获取切分后的数据;最后对切分的数据做数据信息提取,生成对应数据的关键信息;多种异构数据源包括网络数据、图文信息和文档;关键信息包括摘要、知识点,表示段落或句子描述的主要内容和提到的关键词;生成模块,根据提示工程,对收集的数据,生成QA的评估数据集;评估模块,利用QA的评估数据集,对大模型进行测试评估获得评估结论和数据集,步骤包括:步骤1,数据准备,获取历史QA的评估数据集和从环境中新获取的外部知识数据构成的QA的评估数据集;将从环境中新获取的外部知识数据构成的QA的评估数据集,记为,与智能体已学习过的历史QA的评估数据集进行合并,得到最新的用于评估的QA的评估数据集: 步骤2,模型预测,使用智能体当前的模型M对QA的评估数据集进行预测,得到预测结果;步骤3,评估指标计算,将预测结果与QA的评估数据集的真实标签进行比较,计算各项评估指标,包括准确率、精确率、召回率、F1分数;步骤4,评估结果分析,对步骤3得到的各项指标进行分析,关注以下两方面:1新数据上的指标表现,与历史数据上的指标表现进行比较,判断模型在新数据上的泛化能力;2模型M在各个类别或数据子集上的指标表现,识别模型M存在的偏差或薄弱点;识别模型存在的偏差或薄弱点步骤包括:绘制模型M在不同类别或子集上的混淆矩阵;混淆矩阵直观地展示了模型M将某个类别错误预测为其他类别的情况;步骤5,适应性调整,根据步骤4的分析结果,自适应地调整模型M对新知识的接受程度,具体调整方式使用MAML算法;假设模型参数为,学习率为,新数据上的损失函数为,参数更新公式为; 这里的新参数即为调整后的模型参数,相比模型参数,在新数据上有更好的适应性;步骤6,模型更新,将步骤5得到的新参数应用到模型M中,得到更新后的模型,用于后续的预测和学习任务,形式化表示为: 其中:M表示智能体当前的模型;表示经过自我评估和适应性调整后得到的新模型;表示将更新后的参数应用到原模型M的操作,即步骤6中的模型更新过程;表示模型参数;表示学习率;表示在新数据上计算得到的损失函数,衡量了模型在新数据上的表现;表示损失函数对模型参数的梯度,指示了如何调整参数以减小新数据上的损失;表示根据梯度下降法更新模型参数,即步骤5中的适应性调整过程;指导模块,根据评估结论和生成的数据集,通过自动化和规则的方式,制定优化计划,生成大模型进一步优化的方向;确定优化方向和生成优化计划的具体实现涉及多个步骤,以下是确定优化方向的详细实现方法:步骤1.1,数据分析:利用统计方法分析评估结果,识别模型性能低下的特定任务或数据集;应用混淆矩阵、ROC曲线工具来深入了解模型在不同类别上的表现;步骤1.2,模型诊断:通过模型诊断技术来识别模型中的过拟合或欠拟合问题;使用正则化技术来减少过拟合风险;步骤1.3,决策树分析:构建决策树模型,以评估结果作为输入,输出优化建议;决策树通过递归划分数据集,为不同的性能问题提供定制化的优化方向;利用决策树判断模型是否出现过拟合、不收敛和欠拟合;生成优化计划的具体执行步骤:步骤2.1,模型结构调整:根据优化方向,自动调整Transformer架构的层数、头数或激活函数;应用神经架构搜索技术来寻找最优的网络结构;指导模块决定采用NAS技术来自动搜索最优的Transformer架构;具体实现步骤如下:1.定义搜索空间:指定Transformer架构的可调超参数及其取值范围,编码器和解码器层数:从2到12之间的整数;注意力头数:从4到16之间的整数;前馈网络隐藏层维度:从128到2048之间的整数;激活函数:ReLU、GELU、Swish;2.选择NAS算法:采用基于强化学习的ENAS算法,该算法通过参数共享和策略梯度优化,能够高效地搜索大规模架构空间;3.定义Reward函数:Reward函数用于评估每个候选架构的性能,需要平衡模型质量和计算效率;采用加权和的方式,将Perplexity和推理速度作为Reward的两个分量,并设置权重系数;4.自动搜索和评估:ENAS算法在搜索空间中自动采样候选架构,并在验证集上评估其Reward;经过多轮迭代,算法将选出Reward最高的架构作为最优结构;5.重新训练和微调:使用搜索出的最优架构,在完整的训练数据上重新训练Transformer模型;步骤2.2,训练算法选择:根据任务特性和数据集特性,选择最适合的训练算法;步骤2.3,损失函数定制:针对不平衡数据集,设计加权损失函数,实验不同的损失函数,选择在验证集上表现最佳的损失函数;步骤2.4,多目标优化:采用Pareto优化的多目标优化技术,同时考虑多个性能指标,使用遗传算法来平衡不同指标的优化;步骤2.5,用户交互:提供用户交互界面,允许研究人员或开发者根据经验提出优化建议,结合用户反馈调整自动化优化流程;步骤2.6,计划执行:将优化计划传递给计划模块;计划模块,用于执行优化计划,能够根据生成的优化计划,调用相应的计算资源、数据资源,去实现大模型的迭代优化。

全文数据:

权利要求:

百度查询: 山东浪潮科学研究院有限公司 一种具备主动学习能力的大模型自动进化系统及方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。