买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:青岛博什兰物联技术有限公司
摘要:本发明提供的一种用于仪表盘识别的跨尺度检索算法。首先,算法采用基于Transformer网络的特征提取方法,并通过K‑means聚类来简化特征处理,增强了算法的鲁棒性和准确性。算法还包括了一个基于全局图像特征的TopK相似性匹配系统,以及一个专注于表盘区域的前景分割过程,这两者共同提高了识别的精度和效率。为了进一步优化仪表盘的读数识别,算法结合了边缘检测和图网络技术,以准确地定位指针和刻度。此外,通过结合DBNetPP和SATRN模型,算法有效地处理了文本检测和识别任务。算法还通过合理的数据集划分、优化器选择和损失函数的应用确保了高效的学习过程。最终,算法在测试阶段表现出高准确度,通过分析测试结果,进一步对模型进行优化,确保了其在实际应用中的高性能。
主权项:1.一种用于仪表盘识别的跨尺度检索算法,其特征是包括如下步骤:1构建仪表盘识别的跨尺度检索数据集本方法使用的是paddle的工业仪表读数数据集,Paddle的工业仪表读数数据集是一个专为工业仪表读数应用设计的图像数据集,该数据集包括在不同条件下捕获的各种类型的压力表和数字仪表图像,这些图像覆盖了不同的光照条件、角度和仪表类型,有助于训练模型在真实世界场景中具有强的鲁棒性和准确性;2相似仪表盘图像鲁棒特征提取将训练集作为参考图像,这些图像被用于构建一个基于Transformer网络的特征提取系统,Transformer网络是一种强大的深度学习模型,它能够捕捉那些基于图像局部区域或"patch"的高级特征,这种基于patch的方法允许模型关注图像的细节,从而提取出丰富而具有描述性的特征集;对每张参考图像,运用Transformer网络来提取其特征,这些特征不仅包括了图像的整体视觉信息,还深入到了小的局部区域,捕捉了关键的细节和纹理信息,这样的处理方式对于理解和表示图像以及复杂图像识别和分类任务方面至关重要;接下来,采用了K-means聚类算法来进一步处理这些特征集,K-means是一种有效的无监督学习算法,它通过将数据点分组到K个不同的聚类中来发现数据中的模式,K-means被用于聚集那些相似的基于patch的特征,从而形成N个不同的聚类中心,每个聚类中心代表了一组特征的集合,这些特征在视觉上或统计上是相似的;通过这种方式,能有效地将参考图像以及测试图像的复杂特征空间简化为易于处理的聚类中心,这不仅提高了后续图像分析和识别过程的效率,也为理解图像中的关键特征和模式提供了一种直观的方式;3基于全局图像的TopK相似性匹配在这一步骤中,首先通过K-means聚类生成一系列聚类中心,代表数据集中的主要特征模式,然后,在选择最相似的训练图像时,利用这些聚类中心,测试图像的特征与这些中心进行比较,通过计算余弦距离来评估相似性,这样,系统能够识别出与测试图像在特征空间中最为相似的聚类中心,并据此确定最相关的训练图像,这些选定的训练图像在全局特征上与测试图像最为接近,为后续的异常检测提供了理想的基础;4基于表盘定位区域的前景表盘分割接下来结合TopK个聚类中心获得的K个仪表盘图像进行协同物体分割,主要原因是精确性:通过选择最相似的K个仪表盘图像,确保分割过程集中于与测试图像在全局特征上最接近的样本,这增加了分割的准确性,限制分割过程在TopK个图像上,而不是整个数据集,提高了处理速度和效率,这种方法专注于最相关的样本,提高了测试图像的分割效果;基于前景表盘分割的指针定位方法在处理具有复杂或多变的背景环境的图像时提供了显著的优势,首先,通过专注于分割出的表盘前景,这种方法大大减少了背景噪声和无关信息的干扰,从而提高了指针检测和定位的准确性,其次,处理速度得到优化,因为在小且专注的区域内进行指针检测减少了所需处理的数据量,此外,这种方法提高了算法的适应性和鲁棒性,使其能够处理不同类型和设计的仪表盘,即便它们处于不同的背景中,此外,这种方法还提高了灵活性,允许针对不同图像类型或应用需求单独调整分割和定位算法,最后,清晰分割的表盘区域为后续的图像分析任务提供了简单且清晰的输入,从而简化了整个处理流程;5基于前景表盘分割的边缘检测在表盘上,指针的位置通常与数字标记的相对位置密切相关,通过深度学习版本的Canny边缘检测,使用卷积神经网络CNN学习图像中的边缘特征,对理解这些元素之间的空间和视觉关系具有重要作用,这一方法使得边缘检测网络能够识别潜在的指针位置和数字位置,为准确的指针定位提供了关键信息,通过深度学习和边缘检测的结合,在表盘图像中有效地捕捉到这些关键元素的位置和特征,从而实现精确的指针定位;6基于图网络的指针定位和刻度线关键点检测基于HED检测的边缘信息构建图网络并建立关系的方法对仪表盘识别带来多重好处,首先,它精确定位仪表盘元素的边界,包括指针、刻度和数字标记,提高了位置和轮廓的准确性,其次,通过构建图网络,建立元素之间的关系,有助于理解仪表盘的结构和元素之间的互动,此外,图网络还能够捕捉元素与周围环境的上下文信息,提供全面的视觉理解,该方法支持多任务处理,允许同时执行多个仪表盘识别任务,如指针位置检测、数字读数和警告标志识别,提高了效率和准确性,最重要的是,它提高了识别算法的鲁棒性,减少了光照和噪声对识别结果的影响,适用于不同环境和条件下的仪表盘应用;7基于DBNetPP的文本检测和基于SATRN模型的文本识别使用DBNetPP和SATRN这两个深度学习模型实现高效的图像文本处理任务,DBNetPP用于文本检测,能准确定位文本区域,降低误识别风险,而SATRN用于文本识别,自动对齐和识别文本内容,提高了文本识别的准确性,这两个模型的结合适用于光学字符识别、自然场景文本识别应用,为文本处理任务提供了强大的工具,同时加速模型训练和调整,使其容易适应不同任务;8仪表盘读数识别在这种情况下,计算仪表盘上指针的读数涉及到先确定指针当前的位置,然后基于此位置确定指针相对于最近的两个刻度点的位置和角度,具体来说,首先找出指针前后两个刻度点的位置,然后测量指针当前的角度位置,接着,通过计算这两个刻度点之间的距离差和指针角度的相对变化,能够计算出指针的准确读数,这个过程主要依赖于一些基本的几何和三角测量原理;9一种用于仪表盘识别的跨尺度检索算法训练与测试在训练过程中,数据集被分为训练集、验证集和测试集,设置一个逐渐减少的学习率,选择合适的批大小,并确定了一定数量的训练周期,根据不同的任务,本方法采用了相应的损失函数,并使用了Adam优化器,为了提高模型的泛化能力,本方法还应用了Dropout和数据增强技术,在测试过程中,加载训练好的模型,对测试集图像进行预处理,并进行性能评估,最后根据测试结果优化模型。
全文数据:
权利要求:
百度查询: 青岛博什兰物联技术有限公司 一种用于仪表盘识别的跨尺度检索算法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。