买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:内蒙古工业大学
摘要:本发明涉及图像分割技术领域,具体涉及一种基于ResCo‑UNet的荞麦籽粒图像分割方法,包括以下步骤:基于传统U‑Net进行改进,构建ResCo‑UNet模型;使用工业相机拍摄采集荞麦籽粒图像,使用改进的卷积生成对抗网络进行数据增广;使用数据标注工具进行图像标注,形成数据集,所述数据集包括训练集、测试集以及验证集;使用训练集训练ResCo‑UNet模型,保留最优模型权重文件;将测试集输入ResCo‑UNet模型,载入最优模型权重文件;使用验证集对ResCo‑UNet模型进行验证有效性。本发明,在传统的U‑Net基础上对编码器和解码器进行了改进,提出在编码器中加入并行的CA2注意力机制,有效地对荞麦籽粒的特征进行提取,在解码器中使用ConvNeXtBlock进一步提炼提取的语义特征,使用TensorRT引擎对推流流程进行加速。
主权项:1.一种基于ResCo-UNet的荞麦籽粒图像分割方法,其特征在于,包括以下步骤:S1:基于传统U-Net进行改进,构建ResCo-UNet模型,所述传统U-Net包括编码器、解码器,所述编码器采用ResNet18分割网络,且ResNet18编码器中添加有并行的注意力机制CA2和可学习的权重参数,所述解码器添加有ConvNeXtBlock以提炼特征,同时保留U-Net中的跳跃连接,所述ResNet18用于分割网络,具体包括:使用7×7、步长为2的卷积层作为初始层,进行初步的特征提取;通过BN层和ReLU激活函数,使用3×3、步长为2的最大池化层缩小特征的空间尺寸,增大感受野;通过初始层后的特征图进入ResNet18的四层残差结构,每层残差结构包括两个卷积模块,残差结构设为输入输出映射关系为:fx,ω=Fx-Wx其中,x表示输入,Fx表示此阶段的输出,fx,w表示残差,把网络的恒等映射函数训练转换为残差函数fx,ω的训练,通过所有的残差块后,使用全局平均池化层对特征图进行处理,将高和宽都缩减到1,最后通过全连接层输出分类结果;所述并行的注意力机制CA2添加于ResNet18的卷积层,所述并行的注意力机制CA2由CBAM中的通道注意力与坐标注意力并行组合,且CBAM中的通道注意力与坐标注意力均赋予可学习的权重参数,并对通道注意力中多层感知机进行先升维再降维,坐标注意力还包括空间坐标信息,以增强移动网络中的特征表示能力;S2:使用工业相机拍摄采集荞麦籽粒图像,S3:使用改进的卷积生成对抗网络进行数据增广,生成同类图像,所述改进的卷积生成对抗网络进行数据增广包括:增加卷积生成对抗网络的模型深度;引入谱归一化技术控制判别器的Lipschitz常数,避免训练过程中出现模式崩溃和不稳定更新;S4:使用数据标注工具进行图像标注,形成数据集,所述数据集包括训练集、测试集以及验证集;S5:使用训练集训练ResCo-UNet模型,保留最优模型权重文件,并自动载入测试集测试;S6:使用验证集对ResCo-UNet模型进行验证有效性,验证完毕后,将ResCo-UNet模型应用于图像分割。
全文数据:
权利要求:
百度查询: 内蒙古工业大学 一种基于ResCo-UNet的荞麦籽粒图像分割方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。