买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南京信息工程大学
摘要:本发明公开了一种基于改进YOLOv8的唐卡目标检测方法,包括以下步骤:(1)获取需要检测的唐卡图片或视频并放入test文件并进行预处理;(2)构建改进YOLOv8网络模型,将深度可分离‑分组卷积‑SE注意力模块DGST替换特征金字塔层C2f中的瓶颈层Bottleneck;其中,DGST模块包括:SE注意力机制层、分组卷积以及神经网络ConvFFN模块;将需要检测的图片或视频输入改进YOLOv8网络进行训练;(3)将得到的模型输出数据进行处理,得到预测结果;本发明通过对YOLOv8模型的改进,提高检测的精确度,模型参数在一定程度上减少,实现模型轻量化。
主权项:1.一种基于改进YOLOv8的唐卡目标检测方法,其特征在于,包括以下步骤:(1)获取需要检测的唐卡图片或视频并进行预处理;(2)构建改进YOLOv8网络模型,将深度可分离-分组卷积-SE注意力模块DGST替换特征金字塔层C2f中的瓶颈层Bottleneck;其中,DGST模块包括:SE注意力机制层、分组卷积以及神经网络ConvFFN模块;将需要检测的图片或视频输入改进YOLOv8网络进行训练;包括以下步骤:(21)采用letterbox对需要检测的图片进行缩放,等比例缩放为标准大小后,输入网络进行识别;(22)将处理后的图片传入主干网络,进行特征的提取,其中,网络分为0-9层;具体如下:将处理后的图片经过卷积层CBS和特征金字塔改进层C2f_improve串行叠加4次,将图片与卷积核进行卷积运算,批量归一化处理后,通过激活函数提取特征即得到张量x;接着通过C2f_improve,即输入张量x被沿着通道维度切分为四个部分:x1,x2,x3,x4,其中,对x1,x2,x3,x4分别进行处理:x1保持不变,x2经过普通卷积,x3经过SE块,x4经过深度可分离卷积;处理后的四个部分沿着通道进行维度调用channel_shuffle函数对拼接后的通道进行混洗,最后经过ConvFFN模块进行处理并返回输出;将提取的特征经过空间特征池化层,进行特征融合;(23)将提取的特征输入颈部网络,再次进行特征融合和增强,其中,对第4层、第6层进行下采样;设定第4层、第6层、第9层的分辨率分别为80*80、40*40和20*20;将第4层、第6层、第9层作为动态锚点网络PANnet结构的输入,经过上采样,通道融合,最终将PANet的三个输出分支送入到检测头中进行损失函数的计算或结果解算;(24)将增强和融合的特征输入到头部网络,使用解耦头结将分类和检测头分离;其中,损失函数公式如下: ;其中,表示真实边界框的坐标,表示预测边界框的坐标;(3)将得到的模型输出数据进行处理,得到预测结果。
全文数据:
权利要求:
百度查询: 南京信息工程大学 一种基于改进YOLOv8的唐卡目标检测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。