首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于迁移学习与学习曲线分析的深度学习算法稳定性评估方法 

申请/专利权人:天津大学

申请日:2024-05-08

公开(公告)日:2024-07-05

公开(公告)号:CN118297103A

主分类号:G06N3/04

分类号:G06N3/04;G06N3/096;G06F18/10;G06F18/213;G06F18/21

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.07.23#实质审查的生效;2024.07.05#公开

摘要:本发明公开了一种基于迁移学习与学习曲线分析的深度学习算法稳定性评估方法,收集数据并预处理;在源领域上预训练深度神经网络模型,提取数据特征,在目标领域对预训练深度神经网络模型进行适应性调整,采用迁移学习方法更新模型参数;将预处理后的数据集输入调整后的模型,评估模型的训练、验证和测试性能,根据训练、验证性能绘制学习曲线,判断模型是否过拟合或欠拟合,根据判断结果调整模型参数;根据测试性能对模型进行调优;采用交叉验证方法重复上述操作,直至模型的测试性能满足预设评估结果;分析得到数据特征分布差异;根据数据特征分布差异优化迁移学习方法;对评估结果编制报告,将报告反馈给模型设计者,并提出改进的建议和方法。

主权项:1.一种基于迁移学习与学习曲线分析的深度学习算法稳定性评估方法,其特征在于,包括以下步骤:步骤1,从源领域和目标领域收集数据,并对收集到的源领域数据和目标领域数据进行预处理,将预处理后的源领域数据和目标领域数据分别划分为训练集、验证集和测试集;步骤2,在源领域上预训练深度神经网络模型,选择一个作为源模型,利用源模型的特征提取器提取源领域和目标领域的数据特征,在目标领域对预训练深度神经网络模型进行调整以适应目标领域的数据分布,在调整过程中采用迁移学习方法更新预训练深度神经网络模型的参数;步骤3,将目标领域的训练集和验证集分别输入步骤2调整后的深度神经网络模型进行训练验证,记录深度神经网络模型在不同训练数据规模或训练迭代次数下的训练集误差和验证集误差,根据训练集误差和验证集误差绘制学习曲线,分析学习曲线,判断深度神经网络模型是否存在过拟合或欠拟合的情况,并根据判断结果调整深度神经网络模型;步骤4,将目标领域的测试集输入步骤3调整后的深度神经网络模型进行测试,采用交叉验证方法迭代评估步骤3调整后的深度神经网络模型的测试性能,并当所述测试性能低于预设值时对深度神经网络模型进行调优;步骤5,分析深度神经网络模型输入的源领域以及目标领域的数据特征使用情况,根据分析结果引入新的数据特征并去除冗余或不相关的数据特征;步骤6,基于统计测试方法评估源领域与目标领域的数据特征分布差异,根据源领域与目标领域的数据特征分布差异优化迁移学习过程中的数据选择和深度神经网络模型调整策略;步骤7,根据深度神经网络模型的训练、评估和优化结果编制详细的报告,将所述报告反馈给深度神经网络模型的设计者和相关利益相关者,根据所述报告提出改进深度神经网络模型的建议和方法。

全文数据:

权利要求:

百度查询: 天津大学 一种基于迁移学习与学习曲线分析的深度学习算法稳定性评估方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。