一种基于动态位置嵌入的课堂完备元动作识别方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：桂林电子科技大学

摘要：本发明公开了一种基于动态位置嵌入的课堂完备元动作识别方法，包括：得到单个学生课堂元动作视频、对视频进行关键帧采样；构建由动态位置嵌入的位置编码模块、VideoSwinTransformer基本模块、ViT3D基本模块组成的课堂完备元动作识别模型，依次获得动态位置特征表示、多个局部注意力向量、元动作类别概率向量、对课堂完备元动作识别模型进行迭代优化；将预处理后学生课堂元动作视频输入该模型获得课堂学生元动作类别。这种方法不仅使用动态位置嵌入方法进行条件位置编码结合深度卷积网络以提升对元动作空间结构的解析能力，并采用ViT3D的全注意力机制提取动作的潜在空间特征，捕捉元动作的全局时空信息，从而提升课堂视频的学生完备元动作识别准确率。

主权项：1.一种基于动态位置嵌入的课堂完备元动作识别方法，其特征在于，包括如下步骤：1首先获取高清课堂学生视频数据，对高清课堂学生视频数据进行人体检测，得到单个学生课堂元动作视频；2对单个学生课堂元动作视频进行采样，采样帧率为8～32帧视频，输入为学生动作视频帧序列，输出为学生动作关键视频帧；3构建基于动态位置嵌入的条件位置编码模块，输入为学生动作关键视频帧，输出为动态位置特征表示，包括：3-1动态位置嵌入如公式1所示：DPEX＝DWConvX1；3-2公式1中DWConv表示卷积过程中采用零填充，使数据中的各个元素通过逐步探索其邻居信息来理解在数据中的绝对位置，X表示输入视频帧；4构建视频滑窗变换器VideoSwinTransformer基本块：输入为动态位置特征表示，输出为多个局部注意力向量，包括：4-1VideoSwinTransformer在Transformer编码器中引入窗口注意力，实现层次结构、局部性和转换不变性；4-2VideoSwinTransformer基本块先经过窗口自注意力3DW-MSA计算，再经过规范化层LN，并且进行残差连接，然后进行MLP层与规范化层特征筛选，在连续的VideoSwinTransformer模块中交替采用两种分区配置，原理如公式2-公式5所示：公式2-公式5中，zl-1表示VideoSwinTransformer基本块输入，zl和zl+1是滑窗窗口自注意力计算及多层感知机MLP层输出的特征，3DW-MSA表示3维窗口注意力计算，3DSW-MSA表示3维带滑窗窗口注意力计算，LN表示规范化层；5构建ViT3D基本块：输入为步骤4输出的所有局部注意力向量，输出为元动作类别概率向量，包括：5-1ViT3D模块是ViT经过参数膨胀，将视频或者多张图片拼接成一组输入，使得模型深层特征图中所有小块patches进行完全注意力计算；5-2VideoSwinTransformer模块输出n张特征图后，输入到ViT3D模块中的TansformerEncoder进行完全注意力计算，提取每个像素块的注意力向量，原理如公式6所示： 5-3公式6中，Q为Query矩阵，表示当前的查询或问题，与当前处理的位置或元素相关，K为Key矩阵，表示数据集中所有可能的键，V为Value矩阵，表示与每个键相关联的值，KT表示K矩阵的转置，dk为Key的维度，Softmax函数，将输入的向量转换为概率分布，确保所有输出的权重加起来等于1；5-4每个像素块的注意力向量经过MLPHEAD层进行分类，得到识别的课堂元动作；6构建由动态位置嵌入的位置编码模块、VideoSwinTransformer基本模块、ViT3D基本模块组成的课堂完备元动作识别模型，并进行训练，训练采用VideoSwinTransformer模型框架，总迭代次数为10～1000轮，训练采用AdamW优化器进行梯度下降优化，主干网络的学习率设置为3e-5，Batchsize设置为8～512；7对新的课堂学生元动作视频进行人体检测并得到单个学生课堂元动作视频，输入已经训练好的课堂完备元动作识别模型，输出课堂学生元动作类别。

全文数据：

权利要求：

百度查询：桂林电子科技大学一种基于动态位置嵌入的课堂完备元动作识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种弹簧装配装置

下一篇：FinFET堆叠栅存储器的形成方法

相关技术

一种弹簧装配装置

FinFET堆叠栅存储器的形成方法

装配式建筑的锁合机构

基于通用成像模型的平行光管出射光束建模和像机内参数标定方法

一种全自动自助定制溯源内容的显示包装盒个性定制系统及其方法

图像处理方法、装置、电子设备和存储介质

一种饲料加工用烘干装置

一种脉冲调制装置

一种用于磨煤机的具有风粉均化功能的转子以及分离器

一株具有减肥、降血糖作用的乳酸片球菌及其后生元和应用

用于多聚甲醛的氨和氢氧化铵稳定剂

一种新型船舶外表面修复喷涂机

课堂相关技术

一种课堂行为分析方法、系统、计算机及存储介质_紫光摩度教育科技有限公司_202411295919.8

一种基于动态位置嵌入的课堂完备元动作识别方法_桂林电子科技大学_202410825570.8

一种基于教学反思的异步专递课堂教学行为事件识别的方法_云南师范大学_202411304164.3

课堂监控方法、装置、计算机设备及存储介质_平安科技(深圳)有限公司_201810870693.8

基于学生课堂行为图像和教育信息融合的成绩预测方法及系统_哈尔滨师范大学_202410778531.7

一种将在线课堂中的图像和视频卡通化的方法_扬州大学_202011013600.3

一种基于语音多特征渐进式嵌入的课堂教学效果评价系统_同济大学_202411119592.9

一种课堂教学器材_桂林电子科技大学_202420003160.0

课堂效果评估方法、装置及计算机可读存储介质_广州开放大学_202410739079.3

基于大语言模型的课堂教学质量评价方法_江西师范大学_202411253104.3

完备相关技术

一种基于动态位置嵌入的课堂完备元动作识别方法_桂林电子科技大学_202410825570.8

一种低秩完备矩阵预测AKI的优化方法及系统_桂林信息科技学院_202410833602.9

一种基于深度在线锚点子空间学习的非完备多视角大规模动物图像聚类方法_哈尔滨理工大学_202410247864.7

一种带有缺失标记的不完备数据的多标记分类方法及装置_河南师范大学_202110558329.X

一种基于全局表示和驱动融合的不完备多视图聚类方法_湖州师范学院_202410890793.2

一种轨道交通联锁系统完备性测试用例生成方法和系统_华侨大学_202411111928.7

基于特征模理论的悬浮系统完备公共地接地位置设计方法_北京航空航天大学_202410846556.6

一种使用功能及养护设施完备的桥底事故应急池结构_中交第二公路勘察设计研究院有限公司_202420213280.3

一种基于图卷积流形正则化伪标签引导的非完备多视角遥感数据聚类方法_哈尔滨理工大学_202311805159.6

一种面向不完备动作集的行为规则执行路径重建方法_中国人民解放军军事科学院战争研究院_202410992755.8

嵌入相关技术

嵌入式设备远程升级方法_中移物联网有限公司_202311531333.2

一种楼道嵌入式配电箱_山东省建设建工集团消防工程有限公司_202420441519.2

全嵌入式吸油烟机_青岛海尔智慧厨房电器有限公司_202310411668.4

基于优化图嵌入表示的异常行为检测方法_河南科技大学_202410763841.1

一种双向迭代嵌入成型拉延模具_昆山戴盟精密模具有限公司_202410962177.3

基于自监督注意力的引文网络嵌入及节点分类方法_河北师范大学_202411146643.7

嵌入式网络设备安全生产方法及装置_深圳通康创智技术有限公司_202411039581.X

一种基于QcefView组件实现数字地球嵌入的方法_中国人民解放军国防科技大学_202411053777.4

嵌入式系统用户态多应用的处理方法、装置、设备及介质_中移物联网有限公司_202410497214.8

一种多功能家用型嵌入式智能电表_湖南信息职业技术学院_202411230189.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于动态位置嵌入的课堂完备元动作识别方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务