Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于Transformer-VAE的零样本目标识别方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

摘要:本发明涉及深度学习图像识别领域,尤其涉及一种基于Transformer‑VAE的零样本目标识别方法,将Transformer的编码器、解码器以及VAE的编码器、解码器结合起来,实现视觉特征域的编解码以及语义特征域的编解码,通过跨域对齐损失约束,将视觉特征域和语义特征域的隐变量限制在同一个空间,对已知类及未知类进行编码得到的隐变量进行分类,实现零样本目标识别。本发明的零样本目标识别在已知类上进行训练后能够很好得泛化到未知类上,大大降低了样本的采集与标注成本,大幅提升没有样本及样本较少场景下图像识别的任务性能,促进零样本目标识别的领域发展,加快零样本目标识别在科研与工业的研究与应用。

主权项:1.一种基于Transformer-VAE的零样本目标识别方法,在零样本目标识别的任务中,包括:已知类即可获得图像、图像类别标签及类别语义词向量的类别,未知类即只可获得类别语义词向量的类别,且已知类与未知类没有交集,其特征在于,该方法包括以下步骤:步骤1,将已知类的图像输入ImageNet上预训练好的网络得到对应图像的视觉特征,后通过Transformer编解码器和VAE编解码器进行视觉特征的编解码处理,得到编码后的视觉特征的隐变量和解码后的视觉特征;步骤2,采用人工标注或预训练好的wordembedding模型获得已知类和未知类的类别的语义特征,后通过Transformer编解码器和VAE编解码器进行语义特征的编解码处理,得到编码后的语义特征的隐变量和解码后的语义特征;步骤3,将视觉特征和语义特征的隐变量,通过引入跨域损失约束,限制在同一空间内,实现视觉特征与语义特征的跨域对齐;步骤4,对已知类及未知类进行编码得到的隐变量进行分类,实现零样本目标识别。

全文数据:

权利要求:

百度查询: 之江实验室 一种基于Transformer-VAE的零样本目标识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。