车辆密集场景中的图像-文本跨模态车辆检索模型训练方法

导航：龙图腾网> 最新专利技术> 车辆密集场景中的图像-文本跨模态车辆检索模型训练方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：电子科技大学

摘要：本发明涉及计算机技术领域，提供了一种车辆密集场景中的图像‑文本跨模态车辆检索模型训练方法。该方法解决现有技术中车辆检索模型无法准确理解图像主要内容的问题，提高检索准确率。方案包括获取训练样本集，对图像样本和文本样本进行特征提取，得到视觉‑文本联合嵌入；计算图像样本的语义特征；基于余弦相似度计算图像样本和文本样本间的特征相似度，得到全局和局部特征相似度，通过可学习网络整合全局和局部特征相似度，得到最终的模态间相似度；计算交通场景的图像样本间的语义相似度；根据损失函数更新的权重，所述损失函数包含三元组损失和图像语义损失。本发明用于车辆密集场景中的图像‑文本跨模态车辆检索。

主权项：1.一种车辆密集场景中的图像-文本跨模态车辆检索模型训练方法，其特征在于，包括：S1：获取训练样本集，所述训练样本集包含多个交通流监控视频中车辆密集的帧图像数据和其对应的描述文本，即图像样本和文本样本，分别对图像样本和文本样本的进行特征提取，并得到视觉-文本联合嵌入；S2：对图像样本对应的描述文本进行TFIDF向量计算，得到图像样本的语义特征；S3：基于余弦相似度计算图像样本和文本样本间的特征相似度，得到全局和局部特征相似度，通过可学习网络整合全局和局部特征相似度，得到最终的模态间相似度；S4：计算交通场景的图像样本间的语义相似度；S5：根据损失函数更新的权重，所述损失函数包含三元组损失和图像语义损失。

全文数据：

权利要求：

百度查询：电子科技大学车辆密集场景中的图像-文本跨模态车辆检索模型训练方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：基于鸿蒙系统的Web端与原生同步通信方法、系统及产品

下一篇：基于高强柔性索环连接的混凝土圆形筒状结构与预制筒片

相关技术

基于鸿蒙系统的Web端与原生同步通信方法、系统及产品

基于高强柔性索环连接的混凝土圆形筒状结构与预制筒片

具有悬臂式叶轮的血液泵

基于比例时滞惯性模糊CG神经网络的保密通信方法

一种平开窗

基于大模型的交互方法、装置、终端设备和存储介质

云计算架构多租户任务资源分配调度方法及装置

用于传递和存储用于ESIM设备变更的激活码的方法和装置

一种变压器电磁温度流体多物理场间接耦合计算方法及系统

信息展示方法及电子设备

一种基于电子元器件控制的防卡死智能锁体

用于修复叶片根部的方法

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

车辆密集场景中的图像-文本跨模态车辆检索模型训练方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务