首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于过采样策略的带噪标签图片样本筛选学习方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:江苏开放大学(江苏城市职业学院)

摘要:本发明涉及一种基于过采样策略的带噪标签图片样本筛选学习方法及系统,包括以下步骤:步骤1、基于原始的噪声标签数据集,利用联合损失函数预训练具有基础分类性能的DNN模型;步骤2、预训练结束后,对原始噪声数据集中的样本迭代计算JSD损失,基于JSD损失进行均匀筛选,输出DNN模型的有标签子集和无标签子集;步骤3、利用半监督技术结合对比学习方法,基于步骤2输出的有标签子集和无标签子集,对DNN模型进行半监督鲁棒性训练,其中使用过采样技术使DNN模型对无标签子集的样本进行充分学习。本发明可以最大化利用无标签样本携带的特征表示信息,本发明的模型可以更快收敛并在高噪声率下取得更优性能。

主权项:1.一种基于过采样策略的带噪标签图像样本筛选学习方法,其特征在于,包括以下步骤:步骤1、基于原始的噪声标签数据集,利用联合损失函数预训练具有基础分类性能的DNN模型;步骤2、预训练结束后,对原始噪声数据集中的图像样本迭代计算JSD损失,基于JSD损失进行均匀筛选,输出DNN模型的有标签子集和无标签子集;步骤3、利用半监督技术结合对比学习方法,基于步骤2输出的有标签子集和无标签子集,对DNN模型进行半监督鲁棒性训练,其中使用过采样技术使DNN模型对无标签子集的图像样本进行充分学习;至少预训练两个具有基础分类性能的DNN模型,对其中至少一个DNN模型经步骤1-步骤3的训练后将其用于计算原始噪声数据集中图像样本的JSD损失,使计算的JSD损失结果与其他DNN模型在步骤2的JSD损失计算结果相结合进行基于JSD损失的均匀筛选,从而输出其他DNN模型的有标签子集和无标签子集;无标签子集图像样本数量为有标签子集图像样本数量为其中是用于DNN模型m的无标签子集,是DNN模型m的有标签子集;步骤1中,预训练至少两个相同结构的DNN模型,其中一个DNN模型的序号为m=1,另一个DNN模型的序号为m=2,得到至少两个具有基础分类性能的DNN模型;在步骤2中,当预训练结束后,在每轮迭代的开始,基于上一轮迭代训练后的两个DNN模型对原始噪声数据集中的每个图像样本按照公式1计算对应的JSD损失di: 其中和分别是序号为m=1和m=2的DNN模型对于图像样本的经过softmax函数的预测值;基于得到的每个图像样本的JSD损失,按照图像样本的原始标签所属的类别j∈{1,2,…,c}将对应JSD按照公式2进行排序: 其中dj是类别为j的图像样本按照从小到大顺序基于JSD排序后的一致性度量集合,sort是排序函数,是指示函数:当且仅当当前图像样本的噪声标签的one-hot形式对应的第j个分类等于1,当前图像样本噪声标签属于第j类别时,该函数返回1,否则返回0;随后基于排序后的一致性集合dj,j∈{1,2,…,c},按照公式3进行均匀筛选,从任意第j∈{1,2,…,c}个类别对应的一致性集合dj中选择前R个图像样本放入有标记集合Dl: 其中c是数据集类别数,R是筛选的数量,由公式4确定: 其中n是数据集图像样本总数,davg和dmin分别是所有图像样本的JSD损失的均值和最小值,τ和dμ分别是预设的固定的超参数;随后将原始数据集中筛选后的图像样本放入无标签子集

全文数据:

权利要求:

百度查询: 江苏开放大学(江苏城市职业学院) 一种基于过采样策略的带噪标签图片样本筛选学习方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。