首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于重叠滑窗机制与YOLOV4的电网接线图图元识别方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:华南理工大学

摘要:本发明公开了一种基于重叠滑窗机制与YOLOV4的电网接线图图元识别方法,包括:1获取电网厂站接线图数据集;2对接线图分别进行分级预处理;3进行基于重叠滑窗机制的子图切割,切割中进行标定定位框坐标映射及标定定位框坐标校正,划分训练集与验证集;4进行YOLOV4模型初始化,用训练、验证集上分别进行模型训练与参数调优,保存最优模型;5用于接线图识别测试时,加载保存的模型,进行分级预处理与子图切割;6处理模型对子图的输出,整合并保存输出的图元坐标与分类信息。本发明能够在多种尺寸的接线图,尤其是高分辨率大型接线图中实现图元的准确识别,解决了电气接线图图元识别的实际问题。

主权项:1.基于重叠滑窗机制与YOLOV4的电网接线图图元识别方法,其特征在于,包括以下步骤:1获取电网厂站接线图数据集,其中包括N张接线图及各图中待识别图元的种类与标定定位框坐标;2对步骤1中获得的接线图按图片尺寸分别进行分级预处理;3对步骤2中预处理后的接线图进行基于重叠滑窗机制的子图切割,在切割过程中将标定定位框坐标映射至子图坐标系并按条件校正文字、变压器图元的标定定位框坐标,划分训练集与验证集,包括以下步骤:3.1预处理后的接线图进行基于重叠滑窗机制的子图切割,具体是:设定重叠率为r,滑动窗口大小为wwindow×wwindow,从左至右、从上至下进行滑动切割,右侧及下侧子图切割后小于滑动窗口大小时,使用灰度值为g的灰边填充;3.2在切割过程中将标定定位框坐标映射至子图坐标系,具体是:图元的标定定位框坐标需从原图坐标系映射至预处理后的坐标系,再映射至子图坐标系,设原接线图的宽、高分别为w、h,则映射至第i张接线图预处理后的坐标系上的对应关系如下式所示: 式中,x1,2ij、y1,2ij分别为数据集中第i张接线图第j个图元左上角与右下角在第i张接线图原图坐标系上的X轴、Y轴坐标,x′1,2ij、y′1,2ij分别为数据集中第i张接线图第j个图元左上角与右下角在第i张接线图预处理后坐标系上的X轴、Y轴坐标,sizes为预处理后接线图的最长边长度;映射至切割后第i张接线图子图上坐标系的对应关系如下式所示:x″1,2ij=x′1,2ij-x′0imy″1,2ij=y′1,2ij-y′0im式中,m=1,2,...,M,M为第i张接线图在步骤3.1中切割所得到的子图总数,x”1,2ij、y”1,2ij分别为数据集中第i张接线图第j个图元左上角与右下角在第m幅子图坐标系上的X轴、Y轴坐标,x'0im、y'0im为第i张接线图第m幅子图在第i张接线图预处理后坐标系上左上角的X轴、Y轴坐标;3.3在切割过程中按条件校正文字、变压器图元的标定定位框坐标,具体是:当滑窗切割切过文字标定定位框时,为不影响子图中的文字检测效果,若文字定位框被切割后面积与原定位框面积的比值大于阈值textf,则将原文字标定定位框校正至切割后的定位框;当滑窗切割切过变压器标定定位框时,当变压器被切割后宽或高与原变压器宽或高的比值大于阈值transf时,将原变压器的标定定位框校正至切割后的定位框;3.4对切割后的子图按原接线图的归属划分训练集与验证集;设定验证集占数据集的比例为a%,从数据集中随机抽取a%样本作为验证集,剩余样本作为训练集;4加载预训练参数进行YOLOV4模型的初始化,用步骤3中的训练集、验证集上分别进行模型训练与参数调优,保存最优模型参数,包括以下步骤:4.1加载预训练参数进行YOLOV4模型的初始化,所述预训练参数是指利用YOLOV4模型在大型通用目标检测数据集上训练得到的参数;4.2在步骤3获得的训练集中进行模型训练,训练过程为微调预训练模型,即先冻结YOLOV4模型的特征提取网络CSPDarknet53参数,对后续的各个模块单独训练epochp轮,再解冻特征提取网络参数,对整个YOLOV4模型中的参数进行微调,训练epochf轮;在训练中,将YOLOV4模型的输出定位框坐标映射回原接线图坐标系,具体是:模型输出定位框坐标映射至第i张接线图预处理后的坐标系上的对应关系如下式所示:x′1,2ijp=x″1,2ijp+x′0imy′1,2ijp=y″1,2ijp+y′0im式中,x”1,2ijp、y”1,2ijp分别为模型对第i张接线图第j个图元预测输出的在第m幅子图坐标系上的X轴、Y轴坐标,x'0im、y'0im为第i张接线图第m幅子图在第i张接线图预处理后坐标系上左上角的X轴、Y轴坐标,x′1,2ijp、y′1,2ijp为模型对第i张接线图第j个图元预测输出的在第i张接线图预处理后坐标系上的X轴、Y轴坐标;第i张接线图预处理后坐标系上定位框坐标至原接线图坐标系的对应关系如下式所示: 式中,x1,2ijp、y1,2ijp分别为模型对第i张接线图第j个图元预测输出定位框坐标在第i张接线图原接线图坐标系上的X轴、Y轴坐标,w、h分别为原接线图的宽、高,sizes为预处理后接线图的最长边长度;对输出的定位框进行非极大值抑制与后处理,非极大值抑制为分别取出每一类图元的定位框,并在类内按置信度由大到小排序,再在每一类图元的定位框中,取出置信度最大的定位框,依次与剩余定位框计算交并比,若交并比大于阈值f,则从剩余定位框中删去该定位框,不断重复至剩余定位框数目不变;后处理为对各模型输出定位框逐一遍历比对,若一个定位框的中心点位于另一个定位框中,则删去面积小的框;4.3在验证集上进行参数调优,保存最优模型参数,具体是:根据验证集上的mAP指标,调整超参数,包括模型输入大小、预测置信度阈值、非极大值抑制阈值、分级预处理阈值与膨胀卷积核大小、预处理后最长边长度、子图切割大小、子图切割重叠率和文字与变压器图元校正率;5用于接线图识别测试时,加载步骤4中保存的模型参数,对输入的接线图进行步骤2中所述的分级预处理后,进行步骤3中所述的子图切割;6将步骤5中获得的子图按步骤4中的YOLOV4模型输出过程进行处理,整合输出的图元坐标与分类信息,保存至指定文件格式,完成输出。

全文数据:

权利要求:

百度查询: 华南理工大学 基于重叠滑窗机制与YOLOV4的电网接线图图元识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。