恭喜西北工业大学王鹏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜西北工业大学申请的专利一种基于对比学习关注和相关性学习的遮挡目标重识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116524536B 。
龙图腾网通过国家知识产权局官网在2025-06-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310422383.0,技术领域涉及:G06V40/10;该发明授权一种基于对比学习关注和相关性学习的遮挡目标重识别方法是由王鹏;高丽颖;矫炳亮;陈鸿宇设计研发完成,并于2023-04-19向国家知识产权局提交的专利申请。
本一种基于对比学习关注和相关性学习的遮挡目标重识别方法在说明书摘要公布了:本发明公开了一种基于对比学习关注和相关性学习的遮挡目标重识别方法,属于模式识别技术领域。该方法提出了一个细粒度的相关关系学习模块,通过计算待比较图像之间的像素级特征之间的相关性,然后用4D卷积逐步将像素级的相关性压缩成图像级的相似性,在图像匹配损失的引导下学习细粒度的行人相关关系,以解决图像之间信息不对称和空间错位问题,进一步提高了遮挡行人重识别的准确率。
本发明授权一种基于对比学习关注和相关性学习的遮挡目标重识别方法在权利要求书中公布了:1.一种基于对比学习关注和相关性学习的遮挡目标重识别方法,其特征在于,包括如下步骤:步骤1:构建遮挡行人重识别的基准网络;所述基准网络由VisiontransformerViT构成,即视觉Transformer模型,用于提取遮挡行人图像特征,ViT是一种基于自注意力机制的基准网络baseline,通过挖掘所有像素级特征之间的关系对特征进行建模;在行人身份损失和三元组损失的引导下,帮助网络提取行人特征,学习身份分类;步骤2:构建基于对比学习的行人注意力模块,将其插入到基准网络baseline中,以帮助网络有效地关注行人内容,消除无关噪声;具体过程包括如下子步骤:步骤2-1:构建行人注意力模块构造注意力模块,生成激活图以表示受关注的行人区域;具体来说,将基准网络层baseline得到的第i个图像的特征首先经过三层全连接层和GELU激活操作生成嵌入特征其中H代表图像高度,W代表图像宽度,d为图像通道维数,随后将嵌入特征进一步利用卷积和批量归一化层进行处理,并由sigmoid函数对特征进行过滤,最终生成注意力激活值ai: 其中Conv·、BN·、Sigmoid·分别代表一个3*3卷积层、批归一化层以及Sigmoid激活函数;如果用ai代表受网络关注的区域,那么1-ai可以表示受抑制的区域;基于此,可以通过空间平均池化层得到受关注区域的特征和被抑制区域的特征具体公式如下 其中和AvgPool·分别表示乘法运算和空间平均池化层;步骤2-2:引入对比损失使用对比学习的方法,将不同图像中受关注-抑制区域的特征作为负样本对将受关注-关注和受抑制-抑制区域的特征作为正样本对通过拉远负样本对的特征相似性和拉近正样本对之间的语义相似性,训练模块关注行人相关内容,抑制不相关的噪声;具体来说,引入负相关对比损失以增大受关注-抑制区域之间的语义差异, 其中N是样本批量大小,sim,代表特征表示之间的余弦相似度;代表被抑制区域的特征,代表受关注区域的特征;随后,引入正相关对比损失拉近所有图像中受关注-关注的特征之间的语义相似程度,拉近受抑制-抑制的特征之间的语义相似程度; 其中为受关注区域的特征,为被抑制区域的特征,ReLU为激活函数;步骤3:构建细粒度的相关关系学习模块;步骤3-1:基于对比学习的行人注意力模块的输出特征表示为fl,对于第i和第j个图像,它们之间的像素级相似度为: 其中p和q代表图像特征的位置索引,ωl表示一个线性层,将输出特征压缩到256维,ReLU代表ReLU激活函数,表示的第p个像素特征,表示的第q个像素特征,是的第p个像素特征与的第q个像素特征之间的余弦相似性;步骤3-2:采用4D卷积学习局部特征之间的细粒度相关性,在保持空间邻域信息的同时直接学习四维空间中的对应关系;具体来说,本模块设置了四组4D卷积,通道维数从3逐渐增加到128,然后在提取到的特征上应用四维平均池化层,并通过MLP模块和一个Sigmoid函数,将其压缩成为图像级相似度si,j;步骤3-3:使用图像匹配损失来训练相关学习模块, 其中当第i张图像和第j张图像是同一个行人时,1i,j为1,否则为0;步骤4:模块组合:本步骤将步骤1、步骤2、步骤3建立的各个模块进行组合,用于实现遮挡目标重识别;包括如下子步骤:步骤4-1:对于遮挡目标,将步骤2构建的基于对比学习的行人注意力模块插入到步骤1建立的基准网络中,给定一张遮挡行人图像,对遮挡行人提取特征,实现行人内容的有效关注,消除障碍物等噪声对模型的影响;步骤4-2:利用步骤2-2建立的对比损失,将不同图像中受关注-抑制区域的特征作为负样本对将受关注-关注和受抑制-抑制区域的特征作为正样本对通过拉远负样本对的特征相似性和拉近正样本对之间的语义相似性,训练模块关注行人相关内容,抑制不相关的噪声得到遮挡行人图像与所有图像的余弦相似性S1;步骤4-3:利用步骤3建立的细粒度相关关系学习模块,计算不同图像之间的像素级相似度特征,并采用4D卷积学习局部特征之间的细粒度相关性,在保持空间邻域信息的同时直接学习四维空间中的对应关系并将其压缩为图像级相似度S2,以相加的方式融合S1和S2,作为最终的相似性;将此相似性由大到小排序,取与相似性最高的L张图像最为检索结果,如果这些图像中存在与查询样例ID相同的图像则认为此次查询成功,若不存在与查询样例ID相同的图像则认为此次查询失败。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西北工业大学,其通讯地址为:710072 陕西省西安市友谊西路127号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。