一种基于大模型适配的事件-RGB语义分割方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：北京工业大学

摘要：本发明公开了一种基于大模型适配的多模态语义分割方法，首先对于每一对的输入数据，以RGB数据的曝光时间戳为基准，以不同的时间尺度划分事件信息，随后将事件处理为体素，和视频帧分别输入多时空尺度事件嵌入模块与SAM主干，然后将经过多时空尺度事件嵌入模块提取的时间特征输入SAM事件适配器中，与SAM中的图像信息进行交互，得到富含高质量运动信息的特征。最后特征将被输入简单的语义分割头来生成语义分割结果。本发明是端到端的，整体可以直接进行训练，之后可以使用训练的模型来处理事件‑RGB场景下的语义分割问题。本发明解决了由于RGB信息在极端场景下信息丢失的问题，并达到了比以往工作更优秀的语义分割结果。

主权项：1.一种基于大模型适配的多模态语义分割方法，其特征在于：包括以下步骤：步骤1：数据处理，对于每一对的输入数据，以RGB数据的曝光时间戳为基准，以不同的时间尺度划分事件信息，并依次处理为网络输入的格式；步骤2：依据步骤1得到的数据特性构建网络模型，所述网络模型包括参数被冻结的SAM主干、事件适配器SE_Adapter；步骤3：依据步骤1得到的数据特性以及步骤2中得到的网络模型的架构构建特异性数据编码模块，所述特异性数据编码模块为多时空尺度补丁嵌入模块MSP，包括若干卷积层、脉冲神经元、池化层以及线性层，该特异性数据编码模块参数可学习；步骤4：依据步骤2中的网络模型构建语义分割检测头，由若干线性层组成；步骤5：向步骤2、步骤3中得到的模型输入步骤1中得到的数据进行训练，其中图像数据输入SAM主干，事件数据输入MSP并随后输入SE_Adapter与SAM主干进行交互；步骤6：利用步骤4中训练好的网络模型进行多模态语义分割，将成对的事件-RGB多模态信息输入网络模型中，从而实现高精度、高效率的语义分割。

全文数据：

权利要求：

百度查询：北京工业大学一种基于大模型适配的事件-RGB语义分割方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：用于锂电池的极耳夹持装置

下一篇：抑制LECT2基因表达的组合物和方法

相关技术

用于锂电池的极耳夹持装置

抑制LECT2基因表达的组合物和方法

一种插接式离合器壳体结构及其铸造工艺

动效模板生成方法、图片动态展示方法、装置及电子设备

基于通用成像模型的平行光管出射光束建模和像机内参数标定方法

一种图像打印处理方法、装置、设备和计算机存储介质

多功能雨伞烘干机及其工作方法

一种中空纤维膜丝测试装置

一种可以感知温度的系统和方法

动态鳍片对齐系统

一种自动导引车、控制系统及闭环控制方法

数据的安全识别方法及存储介质

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于大模型适配的事件-RGB语义分割方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务