恭喜平安科技(深圳)有限公司王彦获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜平安科技(深圳)有限公司申请的专利数据分类模型的训练方法、分类方法、装置、设备和介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114662580B 。
龙图腾网通过国家知识产权局官网在2025-05-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210248165.5,技术领域涉及:G06F18/2415;该发明授权数据分类模型的训练方法、分类方法、装置、设备和介质是由王彦;马骏;王少军设计研发完成,并于2022-03-14向国家知识产权局提交的专利申请。
本数据分类模型的训练方法、分类方法、装置、设备和介质在说明书摘要公布了:本发明涉及一种数据分类模型的训练方法、分类方法、装置、设备和介质。该训练方法包括:将多个数据样本划分为少数类样本集合和多数类样本集合;从多数类样本集合中欠采样得到欠采样集合;基于少数类样本集合和欠采样集合组成的训练集对分类模型执行第一迭代训练,得到满足第一预设条件的分类模型;若该模型不满足第二预设条件则基于该模型对少数类样本集合进行过采样,将得到的样本加入训练集;基于更新后的训练集对该模型执行第二迭代训练,得到满足第二预设条件的数据分类模型。本申请的训练方法采用了欠采样得到的数据和过采样得到的数据训练分类模型,用于训练分类模型的数据平衡性较好,达到的训练效果好,训练后的分类模型分类准确率高。
本发明授权数据分类模型的训练方法、分类方法、装置、设备和介质在权利要求书中公布了:1.一种数据分类模型的训练方法,其特征在于,所述数据分类模型应用于电话客服场景中的电话分类,所述训练方法包括:将预先获取的多个历史数据样本划分为少数类样本集合和多数类样本集合;所述少数类样本集合为投诉类电话数据样本的集合,所述多数类样本集合为咨询类电话数据样本的集合;从所述多数类样本集合中欠采样得到欠采样集合;基于所述少数类样本集合和所述欠采样集合所组成的训练集对预设的分类模型执行第一迭代训练,得到满足第一预设条件的分类模型;检测所述满足第一预设条件的分类模型是否满足第二预设条件;若不满足第二预设条件,则基于所述满足第一预设条件的分类模型对所述少数类样本集合进行过采样,将过采样得到的数据样本加入所述训练集;基于更新后的训练集对满足第一预设条件的分类模型执行第二迭代训练,得到满足第二预设条件的数据分类模型;所述预先获取的多个历史数据样本中包括两种数据样本;所述将预先获取的多个历史数据样本划分为少数类样本集合和多数类样本集合,包括:分别统计所述多个历史数据样本中的所述两种数据样本的数量;对所述两种数据样本的数量进行比较,利用数量少的一种数据样本组成所述少数类样本集合,利用数量多的一种数据样本组成所述多数类样本集合;所述第二预设条件为达到第二预设训练次数阈值或达到第二预设准确度阈值;所述第二迭代训练中的每一次迭代训练包括:利用更新后的训练集训练当前的分类模型;判断本次训练是否达到第二预设训练次数阈值;若未达到第二预设训练次数阈值,则利用本次训练后的分类模型对所述少数类样本集合进行分类预测;判断分类预测结果是否达到第二预设准确度阈值;若未达到第二预设准确度阈值,则将分类预测错误的数据样本加入所述少数类样本集合,得到更新后的少数类样本集合;所述更新后的少数类样本集合用于作为所述第二迭代训练中的下一次迭代训练的更新后的训练集。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人平安科技(深圳)有限公司,其通讯地址为:518048 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。