买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:山东锋士信息技术有限公司
摘要:本发明涉及一种基于Focal损失函数的在线困难样本挖掘方法及系统,属于图像识别技术领域。方法为:将图像进行图像识别类模型训练,生成样本属于各个类别的概率,获得预测结果;结合样本标签与得到的图像预测结果对各样本进行在线挖掘,挖掘出困难样本,对挖掘出的困难样本进行自适应加权,计算损失;根据损失值回传样本梯度优化模型,验证当前模型有效性,判断模型是否达到指定步数,并保存整个训练过程中评价指标最优的模型。本发明通过结合样本层面与损失函数层面,先采样得到困难样本,再对困难样本做自适应的加权,得到一种在图像识别中解决样本不均衡问题的通用性方法,该方法同时可以实现单阶段、端到端、在线式的样本挖掘与模型训练。
主权项:1.一种基于Focal损失函数的在线困难样本挖掘方法,其特征是,包括步骤:S1.将图像进行图像识别模型训练,基于分类任务的图像识别模型会生成样本属于各个类别的概率,获得预测结果;每个样本为图像的每个像素点;S2.结合样本标签与得到的图像预测结果对各样本进行在线挖掘,挖掘出困难样本,对挖掘出的困难样本进行自适应加权,计算损失;通过设置阈值的方式进行采样,以预测概率作为采样标准,将每个样本的预测概率与进行比较,采样出小于的样本即困难样本,舍弃其他样本;基于Focal损失函数对当前困难样本做进一步的加权,加入权重系数;利用如下公式计算损失: ,其中,N属于样本数,M为类别数,i代表图像中的第i个像素点,其取值范围为{1,2,3,...,N};j代表第j类,其取值范围为{1,2,...,M};为指示函数,若样本i的真实类别yi等于j则,否则;为样本i属于类别j的概率值;为预先设置的阈值,γ0为可调节因子;S3.根据损失值计算样本梯度并更新网络参数从而实现图像识别模型的优化,验证当前图像识别模型有效性,得到当前图像识别模型的评价指标,判断模型是否达到指定步数,若达到指定步数则停止训练,若未达到指定步数则继续训练,在此过程中保存整个训练过程中评价指标最优的模型。
全文数据:
权利要求:
百度查询: 山东锋士信息技术有限公司 一种基于Focal损失函数的在线困难样本挖掘方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。