一种基于改进YOLOv5的复杂场景下手语识别方法

导航：龙图腾网> 最新专利技术> 一种基于改进YOLOv5的复杂场景下手语识别方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：桂林理工大学

摘要：本发明提出一种基于改进YOLOv5的复杂场景下手语识别方法，首先对主干网络进行改进，先引入改进的快速金字塔池化（SimSPPF）替换掉原YOLOv5中的骨干网络末端的金字塔池化块SPPF并同时作用在网络的第5层。为了模型更好地捕捉特征之间的关联性，强化模型对重要信息的提取，接着引入二阶注意力机制（SOCA）并作用在第8层；最后为了进一步细节化模型宽高比的计算方法，引入了具有更多惩罚项的Focal‑EIoU损失函数来替换原始YOLOv5的CIoU损失函数，解决了模型面对宽高比例相同但宽高值不同的问题，提高了整个模型的检测精度。实验结果表明，相对于原始的YOLOv5s模型，本发明提出的改进YOLOv5‑WBJ模型在手语检测上的准确率、召回率、平均精度都有了显著的提升，这些改进让聋哑人的交流更加方便。

主权项：1.一种基于改进YOLOv5s的手语交互动作复杂场景识别检测方法，其特征在于，包括如下步骤：步骤1：采集手语图像，构建手语图像数据集；步骤2：数据集预处理，划分数据集；步骤3：获取原始YOLOv5s预训练模型；步骤4：对YOLOv5s检测模型改进，得到改进的YOLOv5-WBJ模型；步骤5：将手语数据集输入到改进的YOLOv5-WBJ模型训练，实现识别；步骤6：改进YOLOv5-WBJ模型性能的最终评估。

全文数据：

权利要求：

百度查询：桂林理工大学一种基于改进YOLOv5的复杂场景下手语识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：控氧模组及冰箱

下一篇：使用双像素阵列的像素传感器

相关技术

控氧模组及冰箱

使用双像素阵列的像素传感器

增透膜、光学透镜及光纤激光设备

晶硅材料表面处理生产及检测装置

一种改进的无动力精馏工艺

一种新型卷边手推车塑料车斗

一种燃气管道用支吊架结构

用于车辆的诊断与刷新设备及方法、系统、车辆以及计算机存储介质

一种小型开槽机

一种变流柜冷却装置用顶盖结构

一种可调的上料装置

一种高弹性PVDF微孔滤膜卷膜设备

复杂相关技术

复杂结构的设计方法、系统、介质及产品_海南大学_202410808846.1

一种复杂交通路口的视觉警示装置及使用方法_中国建筑工程(澳门)有限公司_202410676449.3

复杂环形柱状铝压铸件的浇道结构_宁波爱柯迪科技产业发展有限公司_202323659787.6

超高强钢粉末、喂料及超高强钢复杂零件的制备工艺_江苏精研科技股份有限公司_202410714686.4

一种高阶复杂脉冲的s域参数识别方法_成都理工大学_202410509853.1

一种复杂工况下沥青有害物测试装置_苏州科技大学_202420149811.7

一种复杂场景下道路照明策略的配置下发方法及系统_中节能晶和科技有限公司_202410776424.0

复杂曲面数控加工工艺规划自动生成方法、装置及介质_兰州理工大学_202411073676.3

一种复杂地段的图像处理方法、系统、设备及介质_广东顺融检测科技股份有限公司_202410626539.1

一种新型导流洞钢衬复杂异形渐变结构_中国电建集团华东勘测设计研究院有限公司_202420012581.X

场景相关技术

利用视觉语言模型的实例级场景识别_谷歌有限责任公司_202410631660.3

用于直播场景的均匀数值采集系统_南京李斌科技有限公司_202410993663.1

手绘喷漆画夜空礼花场景专用礼花刀_田卫东_202323558028.0

微服务场景下通用表单实现系统及方法_山东浪潮智能生产技术有限公司_202410634370.4

基于具身智能的三维场景图谱处理方法、系统及介质_山东新一代信息产业技术研究院有限公司_202410673260.9

基于室内场景的多足机器人的定位方法及系统_苏州睿时智巡科技有限公司_202410864051.2

一种复杂场景下道路照明策略的配置下发方法及系统_中节能晶和科技有限公司_202410776424.0

一种基于工业应用场景的产品视觉检测方法_江苏蔚蓝数智科技有限公司_202411072662.X

一种驾驶场景数据筛选方法、电子设备及存储介质_中国第一汽车股份有限公司_202410662301.4

一种基于分阶段学习的雨雾场景图像的恢复方法_北京航空航天大学_202410705721.6

手语相关技术

一种基于机器视觉的聋哑人手语识别语音输出方法_北京工业大学_202110176544.3

多功能手语翻译手套_烟台大学_202322753714.7

一种基于知识的多模态特征融合的动态图神经手语翻译方法_厦门大学_202111255321.2

多模态的手语识别方法及装置_深圳疆泰科技有限公司_202410607841.2

一种多功能手语视频实时采集与编辑方法及系统_中国科学院深圳先进技术研究院_202410560146.5

一种手语词汇识别系统_长沙千博信息技术有限公司_202210363793.8

一种基于改进GRU-ViT网络的手语翻译方法_成都理工大学_202410598627.5

一种便携式手语翻译器_邵阳市特殊教育学校_202420083834.2

一种基于多模态语义交互增强的手语生成系统及方法_合肥工业大学_202410630950.6

一种规范化洗手语音提示器_中国人民解放军南部战区总医院_202420112186.9

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于改进YOLOv5的复杂场景下手语识别方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务