首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于元学习的标签自校正方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:电子科技大学

摘要:本发明公开了一种基于元学习的标签自校正方法,首先采用预设的目标分类模型对图像数据集进行若干轮标签预测,根据每个图像样本的损失函数梯度将图像数据集划分得到干净样本集、噪音样本集和复杂样本集,设置标签校正网络,将目标分类模型的学习作为元学习的下层任务,使用复杂样本集进行训练,将标签校正网络作为元学习的上层任务,使用干净样本集和噪音样本集对进行训练,目标分类模型和标签校正网络交替进行训练更新,在此过程中定期对图像数据集进行重新划分,将迭代成后每个图像样本的标签作为其最终的标签,完成标签自校正。本发明通过图像数据集划分,解决了元数据集获取困难带来的问题,提高标签自校正的准确度和效率。

主权项:1.一种基于元学习的标签自校正方法,其特征在于,包括以下步骤:S1:对于需要进行标签自校正的图像数据集X,记其中每个图像样本为In,对应原始标签为fn,n=1,2,…,N,N表示图像数据集中图像样本的数量;将其图像数据集X划分为若干批次,采用预设的目标分类模型对该图像数据集进行M轮标签预测,计算每轮标签预测中每个图像样本的损失函数的梯度m=1,2,…,M;计算每个图像样本在M轮标签预测中的梯度变化值gn′: 计算N个图像样本梯度变化值的方差σ2: 其中,表示N个样本梯度变化值gn′的均值;然后计算每个图像样本在M轮标签预测中的梯度均值gn″: 计算每个图像样本的评分scoren:scoren=gn″-σ2预先设置2个阈值s1、s2,且s1<s2,如果图像样本n的评分scoren<s1,则将其作为噪音样本,如果图像样本n的评分s1≤scoren<s2,则将其作为复杂样本,如果图像样本n的评分scoren≥s2,则将其作为干净样本;从而将图像数据集划分得到干净样本集X1、噪音样本集X2和复杂样本集X3;S2:根据实际需要设置标签校正网络,其输入为干净样本或噪音样本,其输出是对干净样本或噪音样本的预测标签;S3:记迭代次数t=1;S4:将目标分类模型的学习作为元学习的下层任务,使用复杂样本集X3中的图像样本进行训练;将标签校正网络作为元学习的上层任务,使用干净样本集X1和噪音样本集X2中的图像样本进行训练;先对目标分类模型进行一次训练更新,再对标签校正网络进行一次训练更新;标签校正模型训练更新时的损失函数的计算公式如下: 其中,β表示预设的平衡参数,表示干净样本集X1中图像样本j的当前标签在类别k的概率,表示标签校正网络对干净样本集X1中图像样本j的校正标签在类别k的概率,表示噪音样本集X2中图像样本j的当前标签在类别k的概率,表示标签校正网络对噪音样本集X2中图像样本j的预测标签在类别k的概率;S5:将每个噪音样本输入更新后的标签校正网络,将得到的标签作为该噪音样本校正后的标签并对其标签进行更新;S6:判断是否t<tmax,tmax表示预设的最大迭代次数,如果是,进入步骤S7,否则进入步骤S10;S7:判断是否t%Q=0,Q表示预设的样本集更新周期,如果是,进入步骤S8,否则直接进入步骤S9;S8:统计每个图像样本在最近Q次训练中损失函数的梯度,采用步骤S1中相同方法计算每个图像样本在最近Q次训练中的评分,将N个图像样本重新划分得到干净样本集X1、噪音样本集X2和复杂样本集X3;S9:令t=t+1,返回步骤S4;S10:将当前N个图像样本的标签作为其最终的标签,完成标签自校正。

全文数据:

权利要求:

百度查询: 电子科技大学 基于元学习的标签自校正方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。