基于多线索相互蒸馏和自蒸馏的连续手语识别方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：河北工业大学;天津理工大学

摘要：本发明为基于多线索相互蒸馏和自蒸馏的连续手语识别方法，包括获取手语视频，从手语视频中提取脸部、左手手部以及右手手部视频并进行预处理，从视频中提取空间特征，再从空间特征中提取具有短期时间联系的手语词级特征，从手语词级特征中提取具有长期时间联系的上下文级特征，再利用全连接层和激活函数，获得归一化的分类概率矩阵；基于获得的分类概率矩阵构建总损失函数，并训练神经网络；将训练后的神经网络用于预测手语，并输出手语标签。该方法利用了原始手语图像中的脸部信息和手部信息，通过相互蒸馏的方式充分利用脸部信息和手部信息的知识，解决了局部信息利用不充分的问题，提高了神经网络的泛化能力；通过自蒸馏的方式增加了神经网络中不同模块之间的协调性。

主权项：1.一种基于多线索相互蒸馏和自蒸馏的连续手语识别方法，其特征在于，该方法包括以下内容：获取手语视频，从手语视频中提取脸部、左手手部以及右手手部视频；对手语视频、脸部视频、左手手部视频和右手手部视频进行包括随机裁剪、随机翻转和归一化在内的预处理；将手语视频输入到残差网络Resnet50中进行特征提取，得到全局空间特征；将脸部视频、左手手部视频和右手手部视频输入到残差网络Resnet18中，得到脸部空间特征、左手手部空间特征和右手手部空间特征；将左手手部空间特征和右手手部空间特征按照第二个维度进行拼接，得到手部空间特征；利用一维卷积模块分别从全局空间特征、脸部空间特征和手部空间特征中提取具有短期时间联系的全局手语词级特征、脸部手语词级特征和手部手语词级特征；一维卷积模块由一维卷积和时序最大池化构成，一维卷积模块的结构为Conv1D，MaxPooling1D，Coonv1D，MaxPooling1D，Conv1D为卷积核大小为5的一维卷积，MaxPooling1D为大小为2的时序最大池化；从全局手语词级特征、脸部手语词级特征和手部手语词级特征中提取具有长期时间联系的全局上下文级特征、脸部上下文级特征和手部上下文级特征，再利用全连接层和softmax激活函数，获得归一化的全局分类概率矩阵、脸部分类概率矩阵、手部分类概率矩阵和全局手语词级分类概率矩阵；基于获得的分类概率矩阵，构建总损失函数，训练神经网络；总损失函数包含链接时序分类损失函数、多线索相互蒸馏损失和自蒸馏损失三部分；将训练后的神经网络用于预测手语，并输出手语标签；链接时序分类损失函数的构建过程为：将全局分类概率矩阵Yfull、脸部分类概率矩阵Yface、手部分类概率矩阵Yhand和全局手语词级分类概率矩阵Ygloss分别与手语对应的真实标签l输入到各自的链接时序分类网络，得到预测概率；输入为全局分类概率矩阵Yfull的预测概率Pl|Yfull、输入为脸部分类概率矩阵Yface的预测概率Pl|Yface、输入为手部分类概率矩阵Yhand的预测概率Pl|Yhand和输入为全局手语词级分类概率矩阵Ygloss的预测概率Pl|Ygloss表达为如下公式33～36所示；公式33～36中，Π＝π1，…，πi，…πs表示所有可能路径的合集，pΠ|Yfull、pΠ|Yface、pΠ|Yhand和pΠ|Ygloss分别表示输入为Yfull、Yhead、Yhand和Ygloss时输出路径Π的概率，B是一种多对一的映射，用于去除路径Π中的空标签和重复标签；为了最大化预测概率，链接时序分类网络使用预测概率的对数的负数作为损失函数，则链接时序全局分类损失链接时序脸部分类损失链接时序手部分类损失和链接时序全局手语词级分类损失表达为如下公式37～40所示；公式37～40中，log·表示以自然数e为底数的对数函数；综上，链接时序分类网络损失函数共包含四部分的损失，表达为如下公式41所示；多线索相互蒸馏损失的构建过程为：利用全局分类概率矩阵Yfull、脸部分类概率矩阵Yface和手部分类概率矩阵Yhand构建KL散度损失DKL，表达为如下公式42～47所示；公式42～47中，和分别表示全局分类概率矩阵Yfull、脸部分类概率矩阵Yface和手部分类概率矩阵Yhand中的第t个向量对应概率分布中的第m个概率值，M表示概率值数量，即全连接层输出特征大小；综上，多线索相互蒸馏损失表达为如下公式48所示；构建自蒸馏损失的构建过程为：利用全局分类概率矩阵Yfull和全局手语词级分类概率矩阵Ygloss构建自蒸馏损失自蒸馏损失表达为如下公式49所示；公式49中，DKLpfull||pgloss和DKLpgloss||pfull均为KL散度损失，表示全局手语词级分类概率矩阵Yaloss中的第t个向量对应概率分布中的第m个概率值；因此，整个神经网络的总损失函数为三个部分损失之和，表达为如下公式50所示；公式50中，α和β表示用于调整损失比例的超参数。

全文数据：

权利要求：

百度查询：河北工业大学天津理工大学基于多线索相互蒸馏和自蒸馏的连续手语识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种轨道交通系统的测试方法及系统

下一篇：交通艇

相关技术

一种轨道交通系统的测试方法及系统

交通艇

近地空间星群电离层等离子体环境量化表征方法

一种烷基取代的6-烷基-4-胺基哒嗪或者其盐的合成方法

山地风电场风电机组叶轮组装的双承平台及抗风方法

用于参考信号配置的方法和设备

基于kafka的信息推送方法、装置、设备及存储介质

一种用于环保设备制造的金属线材加工设备

密闭自洁储备补偿供水设备、系统及使用方法

一种碳化养护混凝土养护制度的优化设计方法

一种船用电器控制箱壳体制造切割设备

一种破碎机

蒸馏相关技术

热泵三塔双效废酒精蒸馏回收系统及其蒸馏乙醇的方法_肥城金塔酒精化工设备有限公司_202410912072.7

基于多线索相互蒸馏和自蒸馏的连续手语识别方法_河北工业大学_202210528751.5

一种酿酒卧式蒸馏装置_双江小黑江酒业有限责任公司_202323223136.2

一种冻干粉蒸馏设备_广州暨科医药有限公司_202420372490.7

一种异丙醇双塔蒸馏装置_博洋微电子(铜陵)有限公司_202410908585.0

一种检测用流动相蒸馏回收装置_青海省药品检验检测院_201911091866.7

一种用于减压精馏的蒸馏釜_浙江倍合德制药有限公司_202420165089.6

可进行多方向搅拌的提纯蒸馏釜_江阴市三良橡塑新材料有限公司_202323461470.1

一种蒸馏酒生产设备及其制备工艺_烟台吉斯波尔酿酒有限公司_202411319731.2

一种辅助加热蒸馏提取设备_南通市食品药品监督检验中心_202420515479.1

连续相关技术

连续冲砂工具_辽宁新华仪器有限公司_201911255773.3

一种连续制砖机_江苏恒力达机械有限公司_202411385361.2

基于连续性特征的泛地图连续表达变换方法及终端_深圳大学_202410832606.5

非金属敷缆连续油管_威海鸿通管材股份有限公司_201810323257.9

一种薄板连续折弯装置_苏州市恒升机械有限公司_202420477727.8

一种金属连续冲压模具_珠海市默佳电器有限公司_202323500611.6

一种连续式送瓶装置_东富龙科技集团股份有限公司_202323208349.8

连续式五氯化磷制备装置_宿州汉泰化工有限公司_202410909639.5

手机天线弹片冲压连续模结构_昆山瑞正元电子科技有限公司_202323313551.7

连续式球磨机节电监测系统_广东省珠峰电气股份有限公司_202411306422.1

手语相关技术

手语翻译方法、装置、设备、存储介质及程序产品_咪咕文化科技有限公司_202410856700.4

基于双流Transformer的大规模手语数据高质量自动筛选方法_天津理工大学_202410898357.X

手语动作生成方法及装置_上海幻电信息科技有限公司_202210753218.9

一种手语基本手形识别方法_中国海洋大学_202410953488.3

可穿戴式手语翻译器_安徽信息工程学院_202410939470.8

一种手语翻译方法、装置、电子设备和存储介质_上海极豆科技有限公司_202410913549.3

一种基于机器视觉的手语识别方法_南京信息工程大学_202111386047.2

一种基于强化特征金字塔网络的连续手语识别方法_天津理工大学_202410437381.3

一种基于MobileNetv3网络模型改进的MGC-YOLOv5s手语手势识别方法_云南师范大学_202411202465.5

一种手语识别交互翻译装置_广西电力职业技术学院_202420172754.4

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于多线索相互蒸馏和自蒸馏的连续手语识别方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务