买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本申请实施例公开了一种模型训练方法、动作识别方法、装置、设备及介质,属于人工智能技术领域,包括:每个终端设备按照数据采集顺序,依序根据每个子样本计算终端设备上局部模型的模型参数梯度,得到模型参数梯度集,并根据模型参数梯度集获取梯度方差,根据梯度方差和预设方差阈值对模型参数梯度集进行更新,根据更新后的模型参数梯度集确定目标模型参数梯度,并将目标模型参数梯度发送至边缘服务器,边缘服务器对多个目标模型参数梯度进行梯度聚合,得到聚合梯度,并根据聚合梯度更新边缘服务器上的全局模型,得到目标模型,将目标模型广播至各个终端设备,以使各个终端设备通过目标模型进行动作识别,能够提高动作识别模型的泛化性。
主权项:1.一种模型训练方法,其特征在于,应用于模型训练系统,所述模型训练系统包括多个终端设备以及边缘服务器,所述方法包括:每个所述终端设备从采集的环境感知数据分布中采样得到环境感知样本集,并确定所述环境感知样本集中每个子样本的数据采集顺序,按照所述数据采集顺序,依序根据每个子样本计算终端设备上局部模型的模型参数梯度,得到模型参数梯度集,并根据所述模型参数梯度集获取梯度方差;梯度方差的计算公式为: ,其中,Var表示梯度方差,bmin为环境感知样本集中子样本的数量,ni表示第i个梯度长度,梯度长度为模型参数梯度的模长,为各个梯度长度的平均值;每个所述终端设备根据所述梯度方差和预设方差阈值对所述模型参数梯度集进行更新,根据更新后的所述模型参数梯度集确定目标模型参数梯度,并将所述目标模型参数梯度发送至所述边缘服务器;预设方差阈值表示为: ,其中,b为环境感知样本集中的样本数量;bmax为环境感知样本集允许的最大样本数量;为梯度方差阈值;所述边缘服务器对多个所述目标模型参数梯度进行梯度聚合,得到聚合梯度,并根据所述聚合梯度更新边缘服务器上的全局模型,得到目标模型,将所述目标模型广播至各个所述终端设备,以使各个所述终端设备通过所述目标模型进行动作识别;所述按照所述数据采集顺序,依序根据每个子样本计算终端设备上局部模型的模型参数梯度,得到模型参数梯度集,包括:按照所述数据采集顺序,将各个所述子样本依序输入至所述局部模型进行动作识别,得到每个所述子样本的预测动作类别;每个所述子样本均具有预设动作标签;根据所述预测动作类别和所述预设动作标签进行交叉熵损失计算,得到目标损失;根据所述目标损失和所述局部模型的模型参数,确定所述局部模型在所述子样本的初始参数梯度;获取所述局部模型的训练轮次,并根据所述训练轮次生成噪声;所述噪声的噪声强度与所述训练轮次的平方根成反比;对所述初始参数梯度添加所述噪声,得到所述局部模型在所述子样本的所述模型参数梯度;根据各个子样本的所述模型参数梯度,确定所述模型参数梯度集;其中,训练轮次为局部模型的已训练次数,初始时的噪声强度为初始参数梯度的梯度长度的预设倍数,预设倍数处于[0.0001,0.001]区间范围内;所述根据所述梯度方差和预设方差阈值对所述模型参数梯度集进行更新,包括:若所述梯度方差小于或者等于所述预设方差阈值,且所述环境感知样本集的样本数量小于预设数量阈值,则从所述环境感知数据分布采样出一个新的子样本,并将所述新的子样本加入所述环境感知样本集;计算所述新的子样本的第一中间参数梯度;将所述第一中间参数梯度加入所述模型参数梯度集,以对所述模型参数梯度集进行更新,直至所述梯度方差大于所述预设方差阈值或者所述样本数量大于或者等于所述预设数量阈值;所述根据所述梯度方差和预设方差阈值对所述模型参数梯度集进行更新,还包括:若所述梯度方差大于所述预设方差阈值,且所述环境感知样本集的样本数量小于预设数量阈值,则根据所述梯度方差和预设平滑参数对所述预设方差阈值进行更新;对所述模型参数梯度集进行采样,得到第二中间参数梯度,并将所述第二中间参数梯度对应的子样本加入所述环境感知样本集;将所述第二中间参数梯度加入所述模型参数梯度集,以对所述模型参数梯度集进行初次更新;根据更新后的所述预设方差阈值和初次更新后的所述模型参数梯度集的所述梯度方差对初次更新后的所述模型参数梯度集进行再次更新,直至所述样本数量大于或者等于所述预设数量阈值;梯度方差阈值的更新公式表示为: ,其中,为梯度方差;为预设平滑参数;为梯度方差阈值。
全文数据:
权利要求:
百度查询: 深圳市大数据研究院 模型训练方法、动作识别方法、装置、设备及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。