首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于协调注意力深度神经网络的菊头蝠识别方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:广州大学

摘要:本发明公开了一种基于协调注意力深度神经网络的菊头蝠识别方法,涉及动物学图像识别技术领域。获取菊头蝠正脸及侧脸图像作为数据集;将数据集划分为训练集和测试集;对训练数据集图像进行预处理及数据增强;构建EfficientNet‑CA神经网络模型;所述EfficientNet‑CA模型是将EfficientNet‑B0模型的核心模块MBConv移动翻转瓶颈卷积模块中的Squeeze‑and‑Excitation挤压与激励模块替换为称为协调注意力的CoordinateAttention模块,构成EfficientNet‑CA模型;为提高训练精度与速度,使用ImageNet上的动物数据集对EfficientNet‑CA进行预训练,得到预训练模型,并将预训练模型的全连接层输出类别更改为8类;最后输入测试集对训练好的模型进行测试。该网络克服了Squeeze‑and‑Excitation挤压与激励模块只考虑编码通道间信息,而忽略位置信息的问题。

主权项:1.一种基于协调注意力深度神经网络的菊头蝠识别方法,其特征在于,包括以下步骤:S1、获取数据集获取菊头蝠正脸及侧脸图像作为数据集,所述数据集为在全国各地山区拍摄的菊头蝠高清图像,并经过翼手目动物学专家进行严密的分类所得;S2、归纳数据集图像按3:1的比例将数据集随机划分为训练集和测试集,最终训练集图像的数量为694张,每个菊头蝠类别约有85张图像,对训练集图像进行数据增强,包括但不限于随机旋转、裁剪、翻转,改变透明度、亮度,随机删除;S3、建立模型图像分类模型基于EfficientNet-B0进行改进,模型包括Stage1到Stage9共9个阶段,其中Stage1为一个3×3的卷积操作;将EfficientNet-B0的核心模块移动翻转瓶颈卷积模块MBConv中的Squeeze-and-Excitation模块替换为协调注意力模块CoordinateAttention,称为CA层,因此Stage2到Stage8均为重复堆叠的MBConv-CA模块,所述MBConv-CA模块包括卷积层、CA层和Dropout层,卷积层中不同的卷积核决定了Stage2到Stage8可以是一个或多个堆叠的相同或不同的MBConv-CA模块,堆叠结构基于EfficientNet-B0,不进行更改;Stage9为一个1×1的卷积操作、池化层和全连接层,通过Softmax函数得到图像所属类别的概率;S4、图像训练对EfficientNet-CA图像分类模型进行预训练,具体采用ImageNet上的动物数据集对EfficientNet-CA进行训练,得到预训练模型,并将预训练模型的全连接层输出类别更改为8类,再将训练集图像输入经预训练后的EfficientNet-CA图像分类模型进行学习训练,利用反向传播迭代更新图像分类模型各层权重;S5、图像分类将测试集图像输入到训练好的EfficientNet-CA图像分类模型,输出该图像在某一类别的概率,概率值最大的输出节点所属的类别即为该图像的预测类别。

全文数据:

权利要求:

百度查询: 广州大学 一种基于协调注意力深度神经网络的菊头蝠识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。