恭喜腾讯科技(深圳)有限公司余炬波获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜腾讯科技(深圳)有限公司申请的专利一种训练数据选择方法及相关装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115130598B 。
龙图腾网通过国家知识产权局官网在2025-05-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210789247.0,技术领域涉及:G06F18/214;该发明授权一种训练数据选择方法及相关装置是由余炬波;郭诗辉设计研发完成,并于2022-07-06向国家知识产权局提交的专利申请。
本一种训练数据选择方法及相关装置在说明书摘要公布了:本申请实施例公开了一种人工智能领域的训练数据选择方法及相关装置,其中该方法包括:对目标数据集中各候选数据进行特征编码处理,得到各候选数据各自的编码特征;从目标数据集中选择候选数据作为初始的训练数据,将训练数据从目标数据集迁移至训练样本集;重复执行训练数据选择操作,直至满足数据选择结束条件;训练数据选择操作包括:根据目标数据集中各候选数据的编码特征以及训练样本集中各训练数据的编码特征,确定目标数据集中各候选数据对应的代表性参数;根据各候选数据对应的代表性参数,从目标数据集中选择候选数据作为训练数据,将训练数据从目标数据集迁移至训练样本集。基于该方法选择的训练数据训练得到的模型具有较优的性能。
本发明授权一种训练数据选择方法及相关装置在权利要求书中公布了:1.一种训练数据选择方法,其特征在于,所述方法包括:对目标数据集中各候选数据分别进行特征编码处理,得到所述目标数据集中各候选数据各自的编码特征;从所述目标数据集中选择至少一个候选数据作为初始的训练数据,并将所述训练数据从所述目标数据集迁移至训练样本集;所述训练样本集中包括的训练数据是用于训练目标模型的待标注数据,所述目标模型为用于基于运动序列数据识别动作类型的运动识别模型;重复执行训练数据选择操作,直至满足数据选择结束条件;其中,所述训练数据选择操作包括:根据所述目标数据集中各候选数据各自的编码特征、以及所述训练样本集中各训练数据各自的编码特征,确定所述目标数据集中各候选数据各自对应的代表性参数,所述代表性参数用于表征其对应的候选数据与所述训练样本集中的训练数据在编码特征空间中的距离;并根据所述目标数据集中各候选数据各自对应的代表性参数,从所述目标数据集中选择至少一个候选数据作为训练数据,将所述训练数据从所述目标数据集迁移至所述训练样本集;其中,所述编码特征是通过目标特征编码器生成的,所述目标特征编码器是通过以下方式训练的:构建参考数据对应的第一正样本、第二正样本和负样本;通过第一特征编码器,对所述第一正样本和所述负样本分别进行特征编码处理,得到所述第一正样本和所述负样本各自的预测编码特征;通过第二特征编码器,对所述第二正样本进行特征编码处理,得到所述第二正样本的预测编码特征;根据所述第一正样本、所述第二正样本和所述负样本各自的预测编码特征,构建目标损失函数;基于所述目标损失函数,调整所述第一特征编码器的模型参数;基于所述第一特征编码器的模型参数,调整所述第二特征编码器的模型参数;当满足模型训练结束条件时,确定所述第一特征编码器为所述目标特征编码器;其中,所述参考数据为运动序列数据,所述运动序列数据包括多帧用于反映动作姿态的动作数据,所述方法还包括:针对所述参考数据中每帧动作数据,根据所述动作数据在所述参考数据中的排布位置和参考时间窗口,在所述参考数据中确定所述动作数据对应的各帧关联动作数据;根据所述动作数据与其对应的各帧关联动作数据之间的差异、以及所述动作数据,确定所述动作数据对应的强化动作数据;根据所述参考数据中各帧动作数据各自对应的强化动作数据,确定所述参考数据对应的强化参考数据;则所述构建参考数据对应的第一正样本、第二正样本和负样本,包括:基于所述参考数据对应的强化参考数据,构建所述第一正样本、所述第二正样本和所述负样本。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人腾讯科技(深圳)有限公司,其通讯地址为:518057 广东省深圳市南山区高新区科技中一路腾讯大厦35层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。