一种多样性提示学习的少样本遥感目标识别泛化性的方法

导航：龙图腾网> 最新专利技术> 一种多样性提示学习的少样本遥感目标识别泛化性的方法

申请/专利权人：大连理工大学

申请日：2024-04-29

公开（公告）日：2024-07-05

公开（公告）号：CN118097442B

主分类号：G06V20/10

分类号：G06V20/10;G06V10/80;G06V10/764;G06V10/82;G06V10/774;G06N3/0455;G06N3/0895

优先权：

专利状态码：有效-授权

法律状态：2024.07.05#授权;2024.06.14#实质审查的生效;2024.05.28#公开

摘要：本发明属于计算机视觉图像处理技术领域，一种多样性提示学习的少样本遥感目标识别泛化性的方法。用图像文本多模态的方式进行训练，将多个含有可学习的提示的文本向量输入参数固定的文本编码器得到文本特征，将图像输入到参数固定的图像编码器得到图像特征，用分类损失和风格多样性损失更新提示参数，直至DPL模型收敛。本发明在原CLIP模型的改进模型CoOp的基础上，增加多个不同的提示来提高文本风格描述的多样性。为使风格描述间互相远离，提出风格多样性损失，用使提示特征两两正交的方式使提示特征相互远离，从而提升模型的泛化性。为了使文本风格描述不偏离原始图像类别信息，用分类损失加以约束。本发明的方法提升了少样本遥感图像识别的泛化性。

主权项：1.一种多样性提示学习DPL的少样本遥感目标识别泛化性的方法，其特征在于，步骤如下：1构建模型模型整体结构由CLIP模型构成；CLIP模型是多模态结构，分为文本端和图像端两个输入分支；文本端使用文本编码器，由Transformer网络组成；文本编码器首先在作为输入的文本向量上加上位置编码获取文本向量的位置信息，再经过层归一化、遮罩多头注意力和全连接层，得到文本特征；图像端使用图像编码器，选用Vit-32的视觉Transformer结构，其中32表示输入图像块的数量；在CLIP模型中，文本端的输入是“提示+类别”的结构；提示有多种不同的形式，根据图像的风格选用适合的提示作为文本的描述，组合不同的类别，得到多个文本，如公式1所示：t＝{content+[CLASS]1,content+[CLASS]2,…,content+[CLASS]C}1其中，content是提示的文本描述；[CLASS]c是类别文本描述，C是类别数，c∈C；文本编码成文本向量的形式输入到文本编码器中；图像端的输入是图像；文本编码器和图像编码器分别输出文本特征和图像特征，用对比学习的方式让同一类别的正样本图像特征和文本特征彼此相近，并使不同类别的图像特征和文本特征彼此远离，将文本特征和图像特征映射到同一特征空间中，再用softmax进行归一化，得到的原始的CLIP分类损失如公式2所示：其中，sim是余弦相似度；fI是图像特征；是正样本文本特征，即与fI相同类别的文本特征；是第j个文本特征；τ是温度系数；在推理过程中，文本编码器相当于分类器，将不同类别的文本向量输入到文本编码器中，将待测试的图像输入到图像编码器中，判断不同类别的文本特征与待测试的图像特征的相似度，相似度最高的文本向量即为图像的类别；2多样性提示为了将CLIP模型迁移到单一专业领域数据集，使用CoOp模型对CLIP模型做出改进：CoOp模型加载CLIP模型训练好的图像编码器和文本编码器的参数并固定，将文本端的提示变为可学习的提示向量，通过学习提示向量使CoOp模型在单一专业领域数据集有好的表现；文本端引入可学习的提示向量来训练CoOp模型，如公式3所示：t＝p+[CLASS]3其中，p＝[V]1[V]2…[V]K是提示向量，即文本的抽象描述；[V]k是单词向量，由初始单词经过编码得到，k∈K；[CLASS]是图像的类别描述；为了提高文本提示的多样性，防止过拟合，在CoOp模型的基础上进一步改进，得到DPL模型；在文本端引入多个可学习的提示向量{p1,p2,…,pM}，则多个文本向量表示为：{t1,t2,…,tM}＝{p1+[CLASS],p2+[CLASS],…,pM+[CLASS]}；3风格多样性损失多个提示可避免模型的过拟合；如果不对提示施加约束，DPL模型沿着最适合当前数据集的方向学习，多个提示可能会学习到相同的参数；为此，提出一种风格多样性损失，在文本特征空间上拉远提示特征之间的距离，使其广泛地分布在整个空间中，提高DPL模型的泛化性能；风格多样性损失如公式4所示：其中，M是提示个数，fi和fj是不同的提示特征，即fi＝ftpi，ft是文本编码器；sim是余弦相似度，即该风格多样性损失使提示输入到文本编码器后的特征两两正交，来最大化特征之间的距离；4分类损失虽然用风格多样性损失可最大化提示特征之间的距离，使提示特征具有多样的风格，但是容易偏向另一个极端，即过于多样造成文本风格描述不准确，偏向负样本信息的描述，导致分类结果不准确；为此，用分类损失来约束风格多样的提示，实现准确分类；分类损失是输入到文本编码器的文本特征和输入到图像编码器的图像特征之间做对比学习，也就是最大化正样本的图像和文本对之间的相似度，最小化负样本图像和文本对之间的相似度；该分类损失与原始的CLIP分类损失类似，唯一区别是文本特征有多个，需要多个图像和文本对的分类损失相加；分类损失如公式5所示：其中fI是图像特征，是与图像类别相同的正样本文本特征，是第j个类别的第m个文本特征，M是提示个数；DPL模型的总损失如下：L＝Lcls+βLdiv6其中，Lcls是分类损失，Ldiv是风格多样性损失，β是平衡两个损失的超参数，取0.5。

全文数据：

权利要求：

百度查询：大连理工大学一种多样性提示学习的少样本遥感目标识别泛化性的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种匹伐他汀关键中间体的制备方法

下一篇：一种生物质燃料碳化和气化燃烧炉

相关技术

一种匹伐他汀关键中间体的制备方法

一种生物质燃料碳化和气化燃烧炉

一种便于保养的电力变压器

一种基于RFID的智能冷藏柜

酚醛树脂发泡体层叠板和复合板

一种建筑工程用水准仪

一种包装纸板加工用切缝装置

阴离子合成洗涤剂标准样品制备容器

具有主要和次要空气递送的面罩

一种应用于PCB制造串接直流式曝光装置及工艺流程

点云数据处理设备和方法

音柱系统

样本相关技术

样本分析流水线系统、样本进样装置及样本存储结构_基蛋生物科技股份有限公司_202323445977.8

血液样本保存箱_郑州安图生物工程股份有限公司_202323178439.7

生物样本存储系统的挑管控制方法及生物样本存储系统_青岛海尔生物医疗科技有限公司_202410655481.3

样本架提升平移机构_安图实验仪器(郑州)有限公司_202323152549.6

一种样本承载检测装置_苏州新实医疗科技有限公司_202323444330.3

样本引入体系的故障检测_塞莫费雪科学(不来梅)有限公司_202280084324.0

一种大气监测样本收集装置_上海大学_202421563158.5

一种血液样本防凝固装置_三门峡市城乡一体化示范区人民医院_202410789401.3

磁控溅射样本旋转控制装置及设备_北京航空航天大学合肥创新研究院_202410518673.X

一种收集液体样本的装置_杭州博拓生物科技股份有限公司_201810714355.5

目标相关技术

车辆及其目标检测方法_比亚迪股份有限公司_202410546925.X

一种目标检测模型构建方法、目标检测方法及相关装置_中国电力科学研究院有限公司_202410523072.8

目标识别模型的训练、目标识别方法、系统、设备及介质_苏州元脑智能科技有限公司_202410846360.7

目标对象的变化识别方法_苏州荟诗科技有限公司_202410379596.4

目标对象控制方法及装置_上海幻电信息科技有限公司_202011528945.2

目标跟踪方法、装置和存储介质_中国农业银行股份有限公司_202110701150.5

目标检测方法、装置及存储介质_小米汽车科技有限公司_202310715788.3

一种目标跟踪处理方法及装置_浙江大华技术股份有限公司_202010754392.6

训练和使用目标检测模型的方法及装置_支付宝(杭州)信息技术有限公司_202210753302.0

基于深度学习的水下目标检测机器人_河南大学_202410602431.9

遥感相关技术

一种遥感测绘定位装置_山东天星测绘有限公司_202420135146.6

遥感观测任务与质量闭环方法_中国科学院空天信息创新研究院_202410018588.7

一种无人机土壤遥感监测系统_自然资源陕西省卫星应用技术中心_202323257513.4

一种无人机生态遥感监测设备_罗雯涛_202323489021.8

一种单通道全色遥感图像压缩方法_星测未来科技(北京)有限责任公司_202410410520.3

一种低空摄影遥感观测设备_韶关市测绘研究院有限公司_202323522973.5

一种缝纫机用遥感系统_浙江曼艺智能科技有限公司_202321964110.0

自适应光学遥感影像相对辐射校正方法_中国科学院空天信息创新研究院_202410558219.7

遥感影像变化检测方法、电子设备、存储介质_广东省海洋发展规划研究中心_202410436094.0

一种遥感测绘数据精度增强方法及系统_苏州青宸科技有限公司_202410228220.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种多样性提示学习的少样本遥感目标识别泛化性的方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务