恭喜多点(深圳)数字科技有限公司邓泽露获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜多点(深圳)数字科技有限公司申请的专利数据集清洗方法、装置、电子设备和计算机可读介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114676276B 。
龙图腾网通过国家知识产权局官网在2025-05-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210224634.X,技术领域涉及:G06V10/774;该发明授权数据集清洗方法、装置、电子设备和计算机可读介质是由邓泽露;徐克勤;刘鹏飞设计研发完成,并于2022-03-09向国家知识产权局提交的专利申请。
本数据集清洗方法、装置、电子设备和计算机可读介质在说明书摘要公布了:本公开的实施例公开了数据集清洗方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:获取训练图像样本初始集和验证图像样本集;利用训练图像样本初始集确定初始图像分类模型、初始分类准确度和训练图像样本集;将初始图像分类模型确定为参照图像分类模型,以及将初始分类准确度的值确定为参照分类准确度的值,以及将训练图像样本初始集确定为训练图像样本参照集;利用训练图像样本集进行迭代训练,以及确定目标图像分类模型和目标训练图像样本集。该实施方式可以自动清洗原始图像分类数据集中的脏数据,提高清洗效率和数据集的质量,从而提升图像分类模型的准确度。
本发明授权数据集清洗方法、装置、电子设备和计算机可读介质在权利要求书中公布了:1.一种数据集清洗方法,包括:获取训练图像样本初始集和验证图像样本集,其中,所述训练图像样本初始集中的训练图像样本包括训练图像和分类标签,所述验证图像样本集中的验证图像样本包括验证图像和分类标签;基于所述训练图像样本初始集确定初始图像分类模型、初始分类准确度和训练图像样本集;将所述初始图像分类模型确定为参照图像分类模型,以及将所述初始分类准确度的值确定为参照分类准确度的值,以及将所述训练图像样本初始集确定为训练图像样本参照集;利用训练图像样本集,执行以下训练步骤:利用训练图像样本集对原始图像分类模型进行训练,得到图像分类模型;确定图像分类模型对所述验证图像样本集的分类准确度;响应于确定分类准确度小于等于参照分类准确度,将参照图像分类模型确定为目标图像分类模型,以及将训练图像样本参照集确定为目标训练图像样本集;其中,利用初始图像分类模型对所述训练图像样本初始集进行清洗,得到训练图像样本集,包括以下步骤:第一步,对训练图像样本初始集中的每个训练图像样本执行以下清洗步骤:第一子步骤,将所述训练图像样本中的训练图像输入所述初始图像分类模型,得到分类信息组;第二子步骤,从所述分类信息组中选择满足预设条件的分类信息作为目标分类信息;第三子步骤,响应于确定所述目标分类信息包括的分类标签与所述训练图像样本包括的分类标签相同,将所述训练图像样本作为清洗训练图像样本加入清洗训练图像样本集;第四子步骤,响应于确定所述目标分类信息包括的分类标签与所述训练图像样本包括的分类标签不相同,且所述目标分类信息包括的分类概率大于等于设定的第一阈值,将所述训练图像样本包括的分类标签更新为所述目标分类信息包括的分类标签,以及将更新后的训练图像样本作为清洗训练图像样本加入清洗训练图像样本集;第五子步骤,响应于确定所述目标分类信息包括的分类标签与所述训练图像样本包括的分类标签不相同,且所述目标分类信息包括的分类概率小于所述第一阈值,且所述训练图像样本包括的分类标签对应的分类概率大于等于设定的第二阈值,将所述训练图像样本作为清洗训练图像样本加入清洗训练图像样本集;第二步,确定清洗训练图像样本集为训练图像样本集。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人多点(深圳)数字科技有限公司,其通讯地址为:518033 广东省深圳市福田区福田街道圩镇社区福田路24号海岸环庆大厦24层2405G;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。