基于草图和文本双重提示的自进化零样本目标识别方法

导航：龙图腾网> 最新专利技术> 基于草图和文本双重提示的自进化零样本目标识别方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：西北工业大学

摘要：本发明提供了一种基于草图和文本双重提示的自进化零样本目标识别方法，采用CLIP作为骨干网络，在DP‑CLIP框架中设计了视觉提示模块和文本提示模块，使用Transformer层从图像中提取类别知识并将其传输到一组可学习的向量中，然后将这些向量用作该类别的视觉提示，采用CLIP的文本编码器将目标类别标签嵌入到文本特征中，利用这些文本特征生成通道缩放向量，将缩放向量应用于CLIP视觉编码器的隐藏特征，引导模型关注与当前类别相关的通道。本发明有效地引导网络关注并捕捉该类别下有辨识性的视觉特征，以帮助网络进行草图‑照片图像的身份匹配，性能取得显著提升，直接迁移到其他的跨类别细粒度图像检索任务上。

主权项：1.一种基于草图和文本双重提示的自进化零样本目标识别方法，其特征在于包括如下步骤：步骤1：构建细粒度的ZS-SBIR目标识别的基础网络；基础网络由预训练的CLIP模型中的视觉编码器模型构成，同时处理手绘草图和照片图像提取目标特征；视觉编码器模型采用三元组损失作为监督，将同一身份的草图和照片作为正样本对，将不同身份的草图和照片看作负样本对，通过三元组损失拉近相同身份的图像特征和拉远不同身份的图像特征，引导网络提取身份相关的目标特征，学习草图和照片图像的身份分类；步骤2：构建视觉提示模型，为每个类别生成类别级视觉提示，并应用该视觉提示来关注并捕捉类别相关的辨识性视觉特征；步骤3：构建文本提示模型，为每个类别生成类别级文本提示，并将该文本提示应用到ViT模型中，引导模型关注该类别下的辨识性视觉特征；在视觉特征提取过程中，应用文本提示，帮助模型关注视觉特征中与当前类别相关的辨识性信息；此外，文本提示引导策略跟视觉提示引导策略也不相同，不是直接将文本提示插入到图像块特征中作为ViT层的输入，而是应用文本提示关注视觉特征中与类别相关的特征通道；步骤4：模型训练和测试；在模型训练时，采用当前图像的最终特征fg，即最后一层ViT层中[CLS]块向量的输出特征，用于计算损失函数；在训练过程中，采用三元组损失函数更新模型参数，仅更新构建的视觉提示模块参数、文本提示模块参数和ViT模型中的LayerNorm层参数，不更新ViT模型的其他参数和文本处理模型的参数；在测试时，测试类别与训练类别之间不存在重合，即在未见的新类别上进行测试，因此是一个类别级的零样本识别任务；对于每个测试类别，首先提取该类别下的视觉提示和文本提示，然后在ViT模型上应用双模态提示信息提取每个草图索引和照片库中所有照片的最终特征；之后，对于每张草图索引Sn，通过正弦相似性计算该草图特征与所有照片特征之间的特征相似性，然后将特征相似性按照从高到低进行排序，特征相似性最高的照片为与草图索引Sn表示相同身份的目标，也即对该草图索引Sn的目标识别结果。

全文数据：

权利要求：

百度查询：西北工业大学基于草图和文本双重提示的自进化零样本目标识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种带有封堵机构的注液套杯组件

下一篇：含氟甲醛基的哌啶型阴离子交换膜及其制备方法

相关技术

一种带有封堵机构的注液套杯组件

含氟甲醛基的哌啶型阴离子交换膜及其制备方法

基于AI的PCB或半导体多工序生产设备组合优化方法

一种电驱机械振动辅助负压可弯导引鞘

一种应用于硅碳复合材料的反应装置

一种非封闭交通条件下基于动应变的桥梁承载能力评定方法及系统

一种外卖无接触配送方法、装置、设备及存储介质

一种硅胶产品检测及分选装置

一种船舶激振装置及船体振动试验分析方法

一种骨科肢体创伤急救固定装置

一种玉米栽培供水装置

一种适用于垂直起降无人机的可折叠起落架

进化相关技术

基于排序的双种群进化算法求解柔性作业车间调度问题的方法_哈尔滨理工大学_202410607512.8

一种基于进化策略的单阶段SCMA码本优化方法_上海航天电子通讯设备研究所_202410753768.X

一种进化型人机交互式核聚变知识科普学习平台及方法_核工业西南物理研究院_202010595299.5

腺相关病毒(AAV)进化枝F载体及其用途_宾夕法尼亚州大学信托人_201880028016.X

基于微分进化算法的双膛窑电力调度与能源流优化方法_新余钢铁股份有限公司_202410529768.1

一种解淀粉芽胞杆菌体内进化系统及其应用_华中农业大学_202410877846.7

一种基于改进的进化算法的配电网故障重构方法_广东电网有限责任公司_202410629419.7

基于动量加速差分进化的最优位置估计方法_东南大学_202410640104.2

一种基于改进差分进化算法的矿井通风网络图自动绘制方法_辽宁工程技术大学_202210061676.6

SADE自适应差分进化算法_甘茨软件科技(上海)有限公司_202410812649.7

样本相关技术

生物样本存储系统_江苏美东生物科技有限公司_202322360898.0

医学检验样本储存箱_中国人民解放军联勤保障部队第九〇三医院_202323077645.9

基于动态样本权重的小样本文本多标记模型训练方法_北京易聊科技有限公司_202410522283.X

一种样本分析系统及其样本调度方法_深圳迈瑞生物医疗电子股份有限公司_201980101380.9

一种肿瘤样本存取装置_鞠昊_202323511360.1

一种叶片样本保存夹_绵阳师范学院_202420257081.2

一种样本采样处理装置_希莱乐检(郑州)生物科技有限公司_202420029804.3

一种样本采集处理装置_希莱乐检(郑州)生物科技有限公司_202420029803.9

一种样本混合器_重庆开创环境监测有限公司_202323416651.2

一种样本自动化输送装置_天津德祥生物技术股份有限公司_202410489195.4

提示相关技术

快速血糖测量提示装置_李丹凤_202323365617.7

能耗提示方法、装置及车辆_比亚迪股份有限公司_202011322868.5

移动体用灯具、灯具系统及移动体用提示系统_株式会社小糸制作所_201980082188.X

一种缺水提示装置及治疗仪_佛山市中创医疗器械有限公司_202420170914.1

风险提示方法、车辆、设备及程序产品_北京集度科技有限公司_202410667136.1

提取prompt上下文提示的方法及装置_北京惠每云科技有限公司_202410877470.X

车辆低速提示音的播放控制方法、系统、车辆及存储介质_重庆赛力斯新能源汽车设计院有限公司_202410829547.6

一种支持预压提示功能的激光训练手枪_湖南极风体育用品有限公司_202420242736.9

基于行为模式分治提示的类案匹配方法及系统_重庆大学_202410431845.X

加湿器及加湿器的初过滤网的堵塞提示方法_北京小米移动软件有限公司_202210574065.1

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于草图和文本双重提示的自进化零样本目标识别方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务