一种基于双主干特征融合的课堂学生姿势识别方法及系统

导航：龙图腾网> 最新专利技术> 一种基于双主干特征融合的课堂学生姿势识别方法及系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本发明公开一种基于双主干特征融合的课堂学生姿势识别方法，属于计算机视觉与教育技术领域，方法包括：获取课堂中学生的现场图片或视频；利用双主干特征提取网络对现场图片或视频进行特征提取；将各主干得到的对应尺度相同的特征图按照对应比例进行拼接融合，得到三层新特征图；将所述三层新特征图输入至解耦合头预测结构，进行特征图整合及预测数据解码计算，得到预测边框信息；将预测边框信息进行预处理，得到预测框及其对应的置信度，并将所述预测框进行非极大值抑制，得到课堂学生姿势识别结果。本发明通过双主干网络提取特征的方式，有效挖掘和融合多尺度视觉特征，实现了对复杂场景下的多目标学生姿势的精准高效识别。

主权项：1.一种基于双主干特征融合的课堂学生姿势识别方法，其特征在于，包括：获取课堂中学生的现场图片或视频；利用双主干特征提取网络对现场图片或视频进行特征提取，每个主干分别得到三个尺度不同的特征图；将各主干得到的对应尺度相同的特征图按照对应比例进行拼接融合，得到三层新特征图；将三层新特征图输入至解耦合头预测结构，进行特征图整合及预测数据解码计算，得到预测边框信息；将预测边框信息进行预处理，得到预测框及其对应的置信度，并将所述预测框进行非极大值抑制，得到课堂学生姿势识别结果；所述双主干特征提取网络包括基于CNN的轻量级混洗主干网络和基于Transformer的滑窗视觉主干网络；所述基于CNN的轻量级混洗主干网络，包括混洗空间下采样单元模块和混洗基本单元模块；所述基于Transformer的滑窗视觉主干网络，包括视觉分割层、线性编码模块、窗口分组模块A和窗口分组模块B；所述基于CNN的轻量级混洗主干网络与所述基于Transformer的滑窗视觉主干网络通过各主干网络提取到的特征拼接在一起；在所述混洗空间下采样单元模块上的运算操作为：S1，将输入的特征图X1先进行基本卷积模块运算，基本卷积模块点卷积+批量归一化+ReLu激活函数，然后进行下采样深度可分离卷积模块运算，下采样深度可分离卷积模块为深度可分离卷积+批量归一化运算，然后再进行基本卷积模块运算，得到输出特征图X11；S2，将输入的特征图X1先进行下采样深度可分离卷积模块运算，然后再进行基本卷积模块运算，得到特征图X12；S3，将X11与X12进行通道维度的拼接得到特征图Y1；S4，对特征图Y1进行通道维度的混洗操作得到特征图，通道维度的混洗操作计算方式为，其中，为对特征图Y1进行通道维度的混洗操作得到的特征图，group为分组数，为批大小，h和w分别为特征图Y1高度和宽度，c为特征图Y1的通道数,则表示将Y1按照的形状重新排列并展平成一个5维张量,transpose表示将的结果中所在维度和所在维度的位置进行互换；在所述混洗基本单元模块的运算操作为：S1，将从所述混洗空间下采样单元模块得到的特征图先进行分支划分为，将其在通道维度按照,其中，为对特征图进行分支划分得到的第一分支，为对特征图进行分支划分得到的第二分支，为输入特征图的通道数；S2，将第一分支先进行基本卷积模块运算，然后进行深度可分离卷积模块运算，深度可分离卷积模块为深度可分离卷积+批量归一化运算，然后再进行基本卷积模块运算，得到运算输出；S3，将与进行通道维度的拼接得到特征图Ys；S4，对特征图Ys进行通道维度的混洗操作得到特征图，通道维度的混洗操作计算方式为，其中，group为分组数，为批大小，h和w分别为特征图高度和宽度，Cs为特征图Ys的通道数,则表示将Y1按照的形状重新排列并展平成一个5维张量,transpose表示将的结果中所在维度和所在维度的位置进行互换，最终输出的特征图，为混洗基本单元模块输出的特征图序列，包括多个特征图[Os1、Os2、Os3]用于后续的特征融合操作；所述视觉分割层将输入的特征图X1利用卷积运算进行维度转化，得到输出特征图X1p，其中H和W分别代表特征图X1的高度和宽度；所述线性编码模块包括线性编码层和两个滑窗视觉模块，所述线性编码层是对经过视觉分割层运算后得到的特征图X1p按照X1p’=X1pE+Epos进行线性投影操作，其中E是线性投影的可学习权重矩阵，Epos是跟X1p位置相关的有D个维度的可学习位置嵌入，经过线性投影操作，将原始的X1p序列映射为D个维度的X1p’序列；所述窗口分组模块A包括一个窗口分割层和两个滑窗视觉模块，窗口分组模块B包括一个窗口分割层和六个滑窗视觉模块；所述窗口分割层按照的方式生成不同尺度的窗口序列，进而实现下采样操作，即特征图高和宽减半、通道翻倍，其中为当前运算尺度的卷积核，为当前运算尺度的跨层卷积核，LN为层归一化操作，k为从0到i-1的的累加变量，n为窗口分割的总层数；所述滑窗视觉模块包括串行连接的窗口注意力模块和移位窗口注意力模块；其中，在所述窗口注意力模块上的运算操作为：S1，对输入的序列进行层归一化，为后续操作提供数据分布；S2，将归一化后的序列划分成M个窗口，在每个窗口内计算标准的多头自注意力，其计算方式为: ；其中，为线性投影，计算输出注意力特征图；Wq、Wk、Wv是可学习的权重矩阵，分别用于生成查询向量、键向量和值向量；T表示转置，表示缩放因子，B表示相对位置偏执；S3，将与进行残差连接得到’；S4，对’进行归一化，得到'；S5，将'输入前馈网络，按照X1F=σ'W1+b1W2+b2，其中W1、W2为线性层，σ为GELU非线性函数，得到前馈特征X1F；S6，将'与X1F进行残差连接得到X1F’，作为下一模块输入；所述移位窗口注意力模块对窗口注意力模块步骤S2进行了扩充，在窗口注意力模块基础上引入了窗口移位操作，具体运算操作为：S1，对输入的序列X1F’进行层归一化，为后续操作提供数据分布；S2，将归一化后的序列X1F’先进行移位操作，生成移位版本X1F’_s；然后将移位版本的X1F’_s按照窗口注意力模块的步骤S2窗口注意力层的计算方式进行处理，计算输出注意力特征图_s；最后对_s做反向移位操作，还原成；S3，将与进行残差连接得到’；S4，对’进行归一化，得到'；S5，将'输入前馈网络，按照X1FF=σ'W1+b1W2+b2，其中W1、W2为线性层，σ为GELU非线性函数，得到前馈特征X1FF；S6，将'与X1FF进行残差连接得到特征图Ow，最终输出的特征图Ow，为滑窗视觉主干网络输出的特征图序列，包括多个特征图[Ow1、Ow2、Ow3]，用于后续特征融合操作。

全文数据：

权利要求：

百度查询：南京邮电大学一种基于双主干特征融合的课堂学生姿势识别方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：基于GPT的加弹机数字孪生机理模型构建方法及系统

下一篇：一种短纤维硬质保温复合材料的高效制备工艺

相关技术

基于GPT的加弹机数字孪生机理模型构建方法及系统

一种短纤维硬质保温复合材料的高效制备工艺

一种电化学储能安全防护系统

一种用于己内酰胺制6-氨基己腈加热的导热油供热系统

一种全氟异丁基甲醚的制备方法

一种高效智能条袋自动翻转运送机构

一种用于热处理的可拆卸支架

一种制备甲基丙烯酸甲酯的后处理方法及后处理装置

多层包覆富锂锰正极材料及其制备方法、正极片和电池

一种列车自主运行控制系统、方法、设备及介质

一种心理学注意力训练装置

一种镜头移动检测方法、装置、设备及介质

学生相关技术

一种水污染化学生态修复装置_广州才鸿科技有限公司_202411454640.X

基于GPS评估数据学生专业定向方法及设备_问向教育科技(上海)有限公司_202411067009.4

一种医学院学生用医疗包_广州医科大学附属第二医院_202411179211.6

针对学生的机械臂操作作业的自动评分方法、装置及存储介质_广东工业大学_202411268441.X

基于旋转小目标检测的学生指针式电表检测及读数方法_西南交通大学_202411236548.6

基于人脸识别的学生课程推荐方法、装置及设备_广东工贸职业技术学院_202310529492.2

基于动作识别的学生跑步姿态实时反馈方法和计算机设备_珠海市芯未科技有限公司_202411312571.9

一种基于AI算法的学生生涯规划方法_联通(辽宁)产业互联网有限公司_202411162185.6

一种中小学生心理健康综合测评方法及系统_江苏第二师范学院_202411192373.3

学生课桌椅_深圳市宇翔空间科技有限公司_202210557090.9

姿势相关技术

使用姿势使自主无人机着陆_斯纳普公司_202380036151.X

使用轻量级深度学习模型的实时设备上远距离姿势识别_创峰科技_202280095354.1

一种用于X光检测及急救的人体姿势转换装置_哈尔滨正达医疗设备制造有限公司_202411347807.2

基于用户姿势的车内按键背光调节方法及系统_广东森下汽车技术有限公司_202411570261.7

姿势评价装置、单间小室及姿势评价方法_松下知识产权经营株式会社_202380035845.1

一种基于双主干特征融合的课堂学生姿势识别方法及系统_南京邮电大学_202411148242.5

具有姿势控制的音频眼镜_伯斯有限公司_201980042544.5

一种人体姿势检测系统、方法与设备_江苏师范大学_202410393508.6

拍照姿势生成方法、装置、电子设备及存储介质_深圳市锐尔觅移动通信有限公司_202411074830.9

电子装置及其姿势识别方法_三星电子株式会社_201980065475.X

课堂相关技术

一种基于虚拟现实的电力云课堂教学用展示装置_海南省电力学校(海南省电力技工学校)_202411402699.4

基于图像标号签到的课堂在线考勤系统_中国石油大学(华东)_202411128176.5

一种实现在线课堂的新型方法、装置、设备及介质_平安科技(深圳)有限公司_202411403852.5

大模型多智能体驱动的自适应在线课堂构建方法及系统_清华大学_202410972551.8

一种用于课堂教学的智能评价系统及方法_上海方略门口教育科技有限公司_202411239205.5

基于任务对齐和重参数的学生课堂行为识别轻量化小目标检测模型及方法_哈尔滨师范大学_202410936551.2

一种基于多虚拟化身的沉浸式翻转课堂教学系统及其工作方法_江苏食品药品职业技术学院_202311349364.6

一种基于双主干特征融合的课堂学生姿势识别方法及系统_南京邮电大学_202411148242.5

一种课堂行为分析方法、系统、计算机及存储介质_紫光摩度教育科技有限公司_202411295919.8

基于关键词和语义匹配的课堂知识点覆盖度分析方法_北京师范大学_202411166314.9

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于双主干特征融合的课堂学生姿势识别方法及系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务