恭喜第六镜视觉科技(西安)有限公司胡峻毅获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜第六镜视觉科技(西安)有限公司申请的专利一种基于云边端架构的开集目标检测方法、装置和设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119046890B 。
龙图腾网通过国家知识产权局官网在2025-03-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411534199.6,技术领域涉及:G06F18/25;该发明授权一种基于云边端架构的开集目标检测方法、装置和设备是由胡峻毅;白天;刘闯;何贤昆;庞天吉设计研发完成,并于2024-10-31向国家知识产权局提交的专利申请。
本一种基于云边端架构的开集目标检测方法、装置和设备在说明书摘要公布了:本发明公开了一种基于云边端架构的开集目标检测方法、装置和设备,涉及视觉语言检测技术领域。云端服务器可获取边缘设备上传的用户输入的文本并提取文本中的语言特征,然后基于预设类别表进行分类映射,以判断文本中所描述的类别是否都出现在预设类别表中,若存在新类别,则获取边缘设备对用户输入的图像提取得到的视觉特征,从而对语言特征和视觉特征进行特征融合得到视觉语言特征编码,并根据视觉语言特征编码确定图像中对应于文本的待检测目标并将其发送至边缘设备。若不存在新类别,则使边缘设备根据用户输入的图像确定对应预设类别表中至少部分类别的待检测目标。本发明提高了开集目标检测在云边端架构的实际场景中的实用性。
本发明授权一种基于云边端架构的开集目标检测方法、装置和设备在权利要求书中公布了:1.一种基于云边端架构的开集目标检测方法,其特征在于,云端服务器执行以下步骤,包括:获取边缘设备上传的用户输入的文本,提取文本中的语言特征;所述文本包括用户上传至边缘设备的图像中待检测目标的类别;根据预设类别表对语言特征进行分类映射,以判断文本中所描述的类别是否都出现在预设类别表中;若是,则向边缘设备下发表征用户输入内容不包括新类别的待检测目标的指令;使边缘设备通过图像检测模型根据用户输入的图像进行目标检测;所述图像检测模型通过预设类别表中各类别对应图像训练得到;若否,则向边缘设备发送表征用户输入内容包括新类别的待检测目标的指令,并获取边缘设备对用户输入的图像提取得到的视觉特征;通过特征融合器对语言特征和视觉特征进行特征融合得到增强语言特征和增强视觉特征,并通过由语言引导的查询模块根据增强视觉特征和增强语言特征之间的相似性,确定与增强语言特征匹配的增强视觉特征,得到视觉语言特征编码,并通过特征解码器根据视觉语言特征编码确定图像中对应于文本的待检测目标并发送至边缘设备;其中,所述特征融合器通过并行的两个自注意力模块,其后依次串接图像至文本的交叉注意力模块和文本至图像的交叉注意力模块,并串接并行的两个多层感知机构建得到;所述特征融合器、由语言引导的查询模块和特征解码器通过下述方式训练得到:获取样本图像和样本图像中各目标对应样本文本,并标注样本图像中各目标的真实边界框的位置和真实边界框的真实文本描述的对应关系;提取样本文本的语言特征,并获取边缘设备对样本图像提取得到的视觉特征;根据样本文本的语言特征和样本图像的视觉特征,通过特征融合器、由语言引导的查询模块和特征解码器,确定对应于文本的待检测目标的预测边界框的位置以及预测边界框的预测文本描述;根据真实边界框的位置和预测边界框的位置之间的偏差确定平均绝对误差损失和广义交并比损失,以根据平均绝对误差损失和广义交并比损失确定回归损失;根据真实边界框的真实文本描述和预测边界框的预测文本描述之间的偏差确定分类损失;根据回归损失和分类损失确定总损失,并以最小化总损失为目标对特征融合器、由语言引导的查询模块和特征解码器进行训练。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人第六镜视觉科技(西安)有限公司,其通讯地址为:712000 陕西省西安市沣东新城协同创新港研发办公楼7楼701室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。