首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种改进YOLO-PAI的实时接打电话行为检测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国矿业大学

摘要:本发明公开了一种改进YOLO‑PAI的实时接打电话行为检测方法,步骤如下:从视频监控平台截取照片制作数据集,添加手和手机两个标签类别,手的标注辅助判断人是否存在接打电话行为;搭建新型卷积神经网络,对于主干网络CSPDarknet53进行剪枝,在保证精度的同时减少参数量。利用使用k‑means聚类算法获得的9个锚点解决小型目标检测问题,更好的检测手机特征信息。增加第四个尺度的特征映射分支,扩大检测范围;部署嵌入式设备,使用TensorRT深度学习推理框架。通过提出的SRblock_body结构,提取图像特征,构建更深层次网络改善网络结构,提高分类和检测效果,在保证检测精度的同时减少模型大小和参数量,更好的移植到嵌入式设备中。

主权项:1.一种改进YOLO-PAI的实时接打电话行为检测方法,其特征在于:包括以下步骤:步骤S1、通过监控平台获取的人员接打电话视频,建立并标注Phonehand_Imgs数据集,并划分训练集、验证集和测试集;步骤S2、使用目标检测模块和注意力机制模块搭建卷积神经网络,网络最终输出为人的手部、手机和检测框位置信息;所述卷积神经网络包括目标检测模块和注意力机制模块,其中,目标检测模块用于检测人的手部信息及手机位置信息,注意力机制模块用于为不同的特征分配不同的权重,使网络能够更有效地提取关键特征;所述卷积神经网络搭建的具体步骤为:步骤S2.1、输入图像在保证纵横比的前提下被缩放到416×416像素,并输入到网络中提取特征映射;利用剪枝算法将原先的五个部分1、2、8、8、41-2-8-8-4残块改进成1-2-8-4-4结构,并将初始通道数设定为16;步骤S2.2、引入SE模块,提出SRblock_body模块代替原先的CSPBlock模块,在SRblock_body模块中,将基于Inception结构体替换原来的3×3卷积核;输入经过一层3×3卷积层,降低特征图宽度和高度,再进行分路操作,一路操作进行一层1×1的卷积视为残差边,通道不降维,减少原先进入残差块的特征层数量;另一路操作输入到n个Residual结构中,先进行一层1×1的卷积层,通道降维从原来的32降到16,随后使用3x1+1x3卷积来代替3x3卷积,空间分解卷积可以将参数量减少一半,从而减少参数量;然后引入SE通道注意力机制模块,为不同的特征分配不同的权重,使网络能够更有效地提取关键特征;然后把两路分支提取的特征图拼接在一起,每经过一个RES-SEBlock通道数增加一倍,这种新的残差结构建立了一个大的残差边;步骤S2.3、将CSPDarknet53中的浅层Mish激活函数替换为Hard-swish函数,而更深层网络的后三层中的激活函数仍然使用Mish激活函数;利用SPP模块融合不同尺度大小的特征图,并利用自顶向下的FPN特征金字塔与自底向上的PAN特征金字塔提升网络的特征提取能力;步骤S2.4、使用k-means聚类算法获得9个锚点小型目标,增加第四个尺度的特征映射分支,扩大检测范围,丰富用于预测多尺度的特征图;步骤S3、利用搭建的卷积神经网络对数据集图像进行训练,对于步骤S1中的数据集图像进行特征提取,图像通过SRblock_body结构,在对图像进行卷积的过程中不断融合浅层的图像特征;步骤S4、在卷积的过程中,使用SE通道注意力机制和CBAM空间注意力机制,为不同的特征分配不同的权重,使网络能够更有效地提取关键特征;步骤S5、增加第四个尺度的特征映射分支,扩大检测范围,丰富用于预测多尺度的特征图;步骤S6、将接打电话检测模型转换为可以嵌入式部署的模型;步骤S7、将步骤S6中转换后的模型部署到监控终端设备中,将终端设备摄像头拍摄的视频流输入接打电话检测模型,并输出检测结果。

全文数据:

权利要求:

百度查询: 中国矿业大学 一种改进YOLO-PAI的实时接打电话行为检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。