买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:广东正扬传感科技股份有限公司
摘要:本申请实施例公开了一种驾驶场景的多任务属性识别方法、装置、介质及设备。该方法包括:获取驾驶场景中驾驶员的图像数据;将所述图像数据输入至预先训练好的多任务网络模型中进行属性识别;所述多任务网络模型的属性识别任务包括:口罩识别、眼镜识别、抽烟识别和打电话识别;根据所述多任务网络模型的属性识别输出结果,确定驾驶员的多任务属性识别结果。通过执行本技术方案,可以采用多任务网络模型,同时对驾驶员的多种特征进行识别,并输出能够整体反应驾驶员驾驶状态的输出结果,从而提高驾驶员状态识别准确度的目的。
主权项:1.一种驾驶场景的多任务属性识别方法,其特征在于,该方法包括:获取驾驶场景中驾驶员的图像数据;将所述图像数据输入至预先训练好的多任务网络模型中进行属性识别;所述多任务网络模型的属性识别任务包括:口罩识别、眼镜识别、抽烟识别和打电话识别,其中,不同的识别任务同时进行;根据所述多任务网络模型的属性识别输出结果,确定驾驶员的多任务属性识别结果;所述将所述图像数据输入至预先训练好的多任务网络模型中进行属性识别,包括:获取样本图像,确定所述样本图像中人脸的编码特征;根据所述编码特征利用人脸识别模型确定驾驶人员的人脸框;根据所述驾驶人员的人脸框,进行调整,再对驾驶人员的人脸裁剪,得到裁剪图像,最后归一化处理;将归一化处理后的图像数据输入至预先训练好的多任务网络模型中进行属性识别,得到多任务网络模型对是否戴口罩,是否戴眼镜,是否抽烟以及是否打电话的目标任务的属性识别结果;缓存对目标任务的属性识别结果;在缓存了特定时长的属性识别结果后,根据判定比例对缓存的属性识别结果判断目标任务的属性是否存在;若是,则确定样本图像的目标任务属性;所述根据所述编码特征利用人脸识别模型确定驾驶人员的人脸框,包括:采用驾驶场景人脸识别神经网络,对所述编码特征进行分析,若高于设定阙值,给出最接近上一次结果的人脸框坐标值;若低于设定阙值,则直接输出:无驾驶员,并结束;所述多任务网络模型的训练,包括:将归一化处理后的图像数据输入至多任务主网络得到特征图,采用OSEM模块分别提取针对不同属性识别任务的特征图,分别输入至各自的属性识别模块中,所述属性识别模块分别为是否戴口罩属性识别模块、是否戴眼镜属性识别模块、是否抽烟属性识别模块、是否打电话属性识别模块;整个网络的输出为每个任务的特征图、每个任务的属性识别结果,各个任务的属性识别的输出结果分别为是否戴口罩,是否戴眼镜,是否抽烟,是否打电话;将属性识别结果与标注结果相比较,通过相应的损失函数减少其差异,并将各个任务的特征图输入到相应的损失函数中,优化网络参数;调整损失函数的权重,以优化对多任务网络模型的训练结果和减少训练时间;对于是否抽烟以及是否打电话属性识别模块,每个识别模块包括主体识别模块和注意力模块;所述主体识别模块用于属性识别输出是否抽烟、是否打电话的结果;所述注意力模块包括注意力建议子网络与注意力网络,用于属性识别及优化主体网络的属性识别结果;确定利用所述注意力网络产生的细粒度特征计算分类损失、Lrank损失,以约束主体网络和注意力网络的属性分析结果。
全文数据:
权利要求:
百度查询: 广东正扬传感科技股份有限公司 一种驾驶场景的多任务属性识别方法、装置、介质及设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。