恭喜北京科技大学袁立获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京科技大学申请的专利一种耳廓指代分割方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119579905B 。
龙图腾网通过国家知识产权局官网在2025-05-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510140742.2,技术领域涉及:G06V10/26;该发明授权一种耳廓指代分割方法和系统是由袁立;尹雁宇;孔博;李江昀;张天翔;王宏;庄培显设计研发完成,并于2025-02-08向国家知识产权局提交的专利申请。
本一种耳廓指代分割方法和系统在说明书摘要公布了:本发明提供一种耳廓指代分割方法和系统,包括:将待分割人耳图像和文本描述输入耳廓指代分割模型,模型包括文本编码模块、文本引导的视觉编码模块和视觉解码模块、角度变换模块;文本编码模块得到文本特征;视觉编码模块通过组织成四阶段的结构实现文本特征与图像特征的融合,每个阶段的视觉编码器生成视觉特征,跨模态感知模块对齐与得到多模态特征,中的每个元素由注意力门控模块进行加权获得加权多模态特征,按元素与相加产生增强视觉特征,将输入视觉解码模块逐步恢复图像的空间分辨率,进一步融合文本和视觉特征输出多尺度特征;角度变换模块对多尺度特征进行角度变换,输出与文本描述相关区域的分割掩码。本发明可以对耳廓进行指代分割。
本发明授权一种耳廓指代分割方法和系统在权利要求书中公布了:1.一种耳廓指代分割方法,其特征在于,所述方法包括:S1、获取待分割人耳图像和相应的文本描述;S2、将所述待分割人耳图像和相应的文本描述输入基于文本引导和角度变换的耳廓指代分割模型,所述耳廓指代分割模型包括文本编码模块、文本引导的视觉编码模块、文本引导的视觉解码模块和角度变换模块;所述文本编码模块,将所述文本描述嵌入为高维词向量,得到文本特征;所述文本引导的视觉编码模块,通过组织成四阶段的结构实现文本特征与图像特征的融合,这四阶段以串联形式前后相接,前一阶段的输出作为后一阶段的输入,实现多阶段的特征融合,每个阶段包括视觉编码器、跨模态感知模块和注意力门控模块,每个阶段的视觉编码器生成视觉特征,所述跨模态感知模块跨模态地对齐融合所述视觉特征与文本特征,得到多模态特征,所述多模态特征中的每个元素由所述注意力门控模块进行加权,获得加权多模态特征,按元素与原视觉特征相加产生一组嵌入语言信息的增强视觉特征,将最后一个阶段产生的最小尺度的增强视觉特征输入所述文本引导的视觉解码模块;所述文本引导的视觉解码模块,逐步恢复图像的空间分辨率,同时进一步融合文本特征和视觉特征,为最终分割任务提供高质量的特征表征,输出多尺度特征;所述角度变换模块,对所述多尺度特征进行角度变换,输出与文本描述相关区域的分割掩码;所述文本引导的视觉解码模块,由三个阶段构成,每个阶段的输入是前一阶段输出的融合特征以及视觉编码模块中对应阶段的多模态特征;在每一阶段中,首先视觉解码器通过双线性插值对上一阶段的特征图进行上采样,逐步扩大特征图的空间分辨率,恢复原始图像的空间信息,同时为后续图像分割打下基础;上采样后的特征与视觉编码模块对应阶段的多模态特征在通道维度进行相加,进一步实现视觉特征与文本特征的深度融合;在整个解码过程中,视觉解码模块以视觉编码模块输出的最小尺度的增强视觉特征作为输入,经过三次逐级解码,逐步生成三个更大尺度的特征图,与初始输入特征图共同构成四个尺度的特征图,最终四个尺度的特征图大小与视觉编码模块对应的特征图一致,为特征的融合和分割提供了结构化支持,最终输出多尺度特征。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京科技大学,其通讯地址为:100083 北京市海淀区学院路30号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。