一种基于部件提示学习的终身目标重识别方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本发明提供了一种基于部件提示学习的终身目标重识别方法，涉及计算机视觉中的目标重识别领域，无需存储旧任务目标图像数据用于后续新任务学习过程中进行回放，而是采用提示学习的方法引导预训练多模态视觉语言模型连续地学习多个重识别任务。本发明将可学习的提示分为全局提示和多个部件提示，其中全局提示关注目标图像的整体特征，而多个部件提示分别关注目标的上、中、下三个局部区域，以细粒度的视觉提示引导模型关注到目标的判别性局部区域，进一步提升模型提取特征的判别表达能力。

主权项：1.一种基于部件提示学习的终身目标重识别方法，其特征在于包括下述步骤：步骤1：模型与数据集准备；采用预训练的多模态视觉语言预训练模型CLIP作为骨干网络，CLIP的模型结构包含一个图像编码器和一个文本编码器，图像编码器将输入图像转换为视觉嵌入特征，文本编码器将相关的文本描述转换为文本嵌入特征，原始的CLIP模型采用对比学习策略将相关联的图像和文本嵌入特征在共享的向量空间中拉进，从而实现跨模态视觉-文本语义理解和对齐；终身目标重识别旨在将不同数据域下收集的连续个数据集以顺序数据流的方式输入到CLIP模型中以任务增量学习设定进行学习，即每个数据集作为一个增量学习任务；个数据集中的每个数据集均包含训练集、查询集和图库集，其中训练集用来对CLIP模型进行增量训练，查询集和图库集用来对最终训练好的CLIP模型进行测试；在训练第个数据集时，无需保存之前的第个数据集的图像数据，模型在连续地学习完个数据集之后得到最终训练好的测试模型；步骤2：第一阶段训练；在获取到第个数据集的训练集后，首先进行第一阶段的训练，第一阶段的目标是为每一个目标身份ID学习身份特定的自然语言文本描述，使用文本模板“Aphotoofaperson.”描述一个特定的目标身份，其中表示可学习的身份描述词嵌入向量，，表示词嵌入向量的个数；在第一个训练阶段，将CLIP文本编码器和图像编码器的参数冻结，只优化可学习的自然语言文本描述；步骤3：第二阶段训练；第二阶段训练的目标是通过提示学习的方式额外添加少量的可学习参数来对CLIP图像编码器进行参数高效微调，目标身份的语言文本描述和CLIP文本编码器的参数保持冻结，CLIP图像编码器主干网络也保持冻结，只训练额外添加的全局提示和部件提示参数；步骤4：在第个增量学习任务阶段，首先获取当前任务对应数据集的训练集进行第一阶段训练，第一阶段通过优化损失函数为每一个目标身份ID学习身份特定的自然语言文本描述；随后进入第二阶段训练，第二阶段通过优化损失函数实现对CLIP图像编码器的参数高效微调；在完成第二阶段训练后，保存当前任务对应的全局提示和部件提示参数，接着学习下一个增量任务，重复步骤2-步骤3直至完成所有个任务的学习，进入到下一步测试流程；步骤5：在测试阶段，对于每个增量学习任务，将对应任务的提示参数附加到CLIP图像编码器的各层中，并将对应任务数据集的查询集和图库集送入CLIP图像编码器得到编码视觉特征，然后根据得到的查询和图库视觉特征计算mAP和Rank-1性能指标，最后，计算个数据集的平均测试性能。

全文数据：

权利要求：

百度查询：西北工业大学一种基于部件提示学习的终身目标重识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种入口烟温可调的脱硝SCR反应器

下一篇：充液阀组、刹车控制系统及具有其的农业机械

相关技术

一种入口烟温可调的脱硝SCR反应器

充液阀组、刹车控制系统及具有其的农业机械

车辆制动控制方法、装置及电子设备

一种电压暂降状态串联型及并联型补偿设备治理方法

麻醉机

一种多功能管道内窥摄像系统及方法

基于双哈希模糊布隆滤波器云存储数据融合方法

用于用户设备预期的公共波束切换的方法和装置

断路器的控制电路及断路器

一种通过标准温度场检测油水混合箱箱壁结构的方法

一种电流基准电路和电源系统

最小死区三维沟槽电极硅探测器

目标相关技术

目标检测方法及系统_上海禾赛科技有限公司_202310582698.1

一种目标跟踪方法、装置和用于目标跟踪的装置_北京搜狗科技发展有限公司_202110732715.6

基于目标状态空间投影的深度机动目标跟踪方法_西安电子科技大学_202411101901.X

红外小目标中心位置估计方法_中国科学院长春光学精密机械与物理研究所_202411476796.8

跟踪目标的定位优化方法_重庆工商大学_202210354094.7

目标检测方法、装置、介质及设备_西安兵器工业科技产业开发有限公司_202410621662.4

多目标跟踪方法和装置_北京邮电大学_202111274909.2

运动目标追踪传感器_嘉兴学院_202420670040.6

防空导弹总体布局系统及目标拦截方法_上海机电工程研究所_202411022993.2

一种高对比度星点目标光源_中国科学院长春光学精密机械与物理研究所_202410808645.1

终身相关技术

一种基于生成特征重放的轴承增量故障诊断终身学习方法_苏州大学_202310126044.8

基于终身学习的视觉定位方法和装置_中国人民解放军国防科技大学_202411250925.1

一种终身联邦学习的无人系统协同SLAM方法_同济大学_202410980345.1

一种基于部件提示学习的终身目标重识别方法_西北工业大学_202411334329.1

一种基于终身学习的时变知识图谱嵌入表征方法_电子科技大学_202410809385.X

基于终身学习的视觉定位方法和装置_中国人民解放军国防科技大学_202411250925.1

一种基于终身学习的直升机装配物料送达时间预测方法_南京航空航天大学_202410775318.0

一种基于在线终身记忆的同步定位与建图方法_苏州科技大学_202410983321.1

一种基于可扩充参数量的目标检测终身学习方法_西北工业大学_202410863998.1

一种基于终身字典学习的多模态工业过程监测方法和装置_中南大学_202210895009.8

学习相关技术

一种学习坐姿及学习休息提醒纠正检测装置_李荷旸_202411293962.0

基于均衡选择及对比学习的含噪声标签图像学习方法与系统_江苏开放大学(江苏城市职业学院)_202410281796.6

数据学习服务器和用于生成和使用其学习模型的方法_三星电子株式会社_202411080834.8

一种基于关系学习的异构联邦子图学习方法_电子科技大学_202411013014.7

基于深度学习电力负荷预测方法_深圳渔航科技有限公司_202411155455.0

多智能体强化学习系统_北京卓翼智能科技有限公司_202411476483.2

波束选择中的机器学习_诺基亚技术有限公司_202380033184.9

一种学习开发板_长沙耀迈智能科技有限公司_202323458725.9

基于机器学习的智能转舵_零度新能源科技(广东)有限公司_202411488117.9

压力应对方式判定系统及方法、学习装置及方法、程序及学习完毕模型_广宣社股份有限公司_202080068209.5

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于部件提示学习的终身目标重识别方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务