首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于PCA与混合核函数LSSVR的泥石流预测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:西安工程大学

摘要:本发明公开的基于PCA与混合核函数LSSVR的泥石流预测方法,首先,建立泥石流监测预警系统,获取初始泥石流灾害发生的影响因子,并且通过PCA将获取的初始影响因子进行降维;其次,利用降维后的初始影响因子构建混合核函数LSSVR泥石流灾害模型;然后,运用鲸鱼算法优化建立的混合核函数LSSVR泥石流灾害模型,得到优化后的组合模型参数;最后,利用得到的组合模型参数,重构混合核函数LSSVR泥石流灾害模型,输出泥石流发生的预测结果。本发明公开的方法大大降低了模型结构的复杂性,防止维数灾难;引用混合核函数机制来平衡模型学习能力与泛化能力,提升预测精确度。

主权项:1.基于PCA与混合核函数LSSVR的泥石流预测方法,其特征在于,具体包括如下步骤:步骤1,建立泥石流监测预警系统,获取初始泥石流灾害发生的影响因子,并且通过PCA将获取的初始影响因子进行降维,具体过程如下:步骤1.1,设获取到的样本数据为n个,每个样本中含有a个初始影响因子,其中,a1为日降雨量,单位为mm、a2为次声,单位为Hz、a3为泥位,单位为mA、a4为土壤含水率,单位为%、a5为孔隙水压力,单位为kPa、a6为坡度,单位为°、a7为相对高差,单位为m;则每个样本包含m维的矩阵如式1所示: 式中,xij代表每个样本数据,其中,i=1,2,…,n;j=1,2,…,a;步骤1.2,利用PCA法进行数据降维;将样本矩阵X进行标准化处理,设标准化后的矩阵为Z且样本数据为zij,样本标准化如式2所示: 式中,为初始影响因子数据的均值;sj为初始影响因子数据的方差;其表达式分别如式3和式4所示: 然后,计算标准化后的矩阵Z的相关系数矩阵R,其中,rij=rji,如式5所示: 其中,rij为初始影响因子i与初始影响因子j的相关系数,表达式如式6所示: 根据特征方程计算矩阵R的特征值λi,i=1,2,…,a,λ1≥λ2≥…≥λa与特征向量μi,其中,特征方程的表达式如式7所示: 根据计算出的特征值λi计算主成分影响因子,其中,i=1,2,...,a,定义累计贡献率≥85%的标准,筛选出的b个主成分因子,其中,b<a;由特征值计算出的个体贡献率表达式如式8所示: 其中,Ti代表每个主成分的个体贡献度;a为初始影响因子;累计贡献率的表达式如式9所示: 其中,T代表每个主成分的累计贡献度;b为选取的主成分影响因子,a为初始影响因子;为初始因子总特征值;为主成分因子总特征值;因此,利用筛选出的主成分影响因子取代原有的初始影响因子,并根据主成分表达式Y计算出新样本数据,主成分表达式Y如式10所示: 其中,Yd代表主成分重构的新样本数据输出结果;λmn代表成分矩阵中的各维数特征值;步骤2,利用步骤1降维后的初始影响因子构建混合核函数LSSVR泥石流灾害模型,具体过程如下:步骤2.1,将式10中已重构的主成分灾害影响因子数据按照训练集:测试集=6:1的比例进行分配,将其作为混合核函数LSSVR泥石流预测模型的输入部分;步骤2.2,将步骤2.1中已给定的训练集作为模型输入,训练集的表达式如式11所示:T={x1,y1,…xk,yk}11式中,xi∈Rn;yi∈R;i=1,…,k,k为样本总数;将给定的训练集作非线性映射φ:Rn→F,n为数据维数,构造出LSSVR函数的表达式如式12所示:y=fx=wTφx+b12其中,w和b均为结构风险化最小化模型参数,且w代表空间F的权向量,b∈R代表偏差量;fx为被估计函数;在确定决策参数w、b时,求解问题如式13所示: 式中,ξk∈R为松弛因子,γ为惩罚参数;根据拉格朗日函数与非线性规则优化条件得出LSSVR的预测表达式如式14所示: 其中,不为零的元素αi所对应的样本xi,yi为支持向量;Kxi,xj为核函数;核函数一般分为全局核函数与局部核函数,将全局核函数与局部核函数相结合,其组合表达式如式15所示:Kmix=uKGlobal+1-uKLocal15其中,u∈[0,1]为组合权重系数;当u→1时,全局核函数产生较大影响作用;当u→0时,局部核函数产生较大影响作用;Kmix为混合核函数表达式;KGlobal为全局核函数表达式;KLocal为局部核函数表达式;拟选取的全局核函数为多项式核函数,局部核函数为径向基核函数,因此,构造的混合核函数如式16所示: 式中,Kmix为混合核函数表达式;KRBF为径向基核函数表达式;Kpoly为多项式核函数表达式;γ为可调超参数,σ为RBF核参数;q为多项式阶数;u为组合权重系数;步骤3,运用鲸鱼算法优化步骤2建立的混合核函数LSSVR泥石流灾害模型,得到优化后的组合模型参数;步骤4,利用步骤3得到的组合模型参数,重构混合核函数LSSVR泥石流灾害模型,输出泥石流发生的预测结果。

全文数据:基于PCA与混合核函数LSSVR的泥石流预测方法技术领域本发明属于地质灾害监测技术领域,具体涉及一种基于PCA与混合核函数LSSVR的泥石流预测方法。背景技术泥石流是山区常见的地质灾害之一,因其分布地域广、发生频率高、成灾速度快等特点,严重威胁着山区人民的生命财产安全与经济社会的可持续发展。因此,能否提供有效的泥石流灾害预报方法成为人们所关注的焦点。相关领域科研工作者针对泥石流成灾特点进行深入研究,并提出多种泥石流灾害预报方法,其方式各有利弊。曹禄来等运用模糊系统理论与人工神经网络模型相结合评价泥石流发生危险等级,将模糊逻辑推理知识作为危险性评价系统,以人工神经网络作为训练模型,降低数据处理复杂度与主观影响,但在训练过程中模型本身易陷入局部极值而影响精确度;李丽敏等将多传感器信息融合理论运用于泥石流预报模型中,利用多个泥石流影响因素综合预测危险度,较好地解决以往因单一监测手段造成的漏报问题,但并未分析多个致灾影响因素之间的相关性,若选取较多影响因素时,可能导致因素之间信息相互叠加,易发生维数灾难;董佳祺等利用支持向量机模型建立泥石流堆积物分维数模型,将多个影响因素作为模型输入,优点在于具有较好普适性,但模型中选取的单核局部核函数虽然学习能力较强,但泛化能力较弱,在实现模型训练最优组合上还存在一定上升空间。支持向量机SupportVectorMachine,SVM是建立于统计学习理论的结构风险最小化原则上的机器学习系统,其特点在于能够自主设计模型复杂程度,避免维度灾难,且具有良好的泛化能力;而最小二乘支持向量回归LeastSquaresSupportVectorRegression,LSSVR是在支持向量运算框架下,改变其内部标准SVM的约束条件与风险函数,在继承传统支持向量机优点的同时,还能够很好地解决数据量少、过学习等实际问题,提升了模型训练效率与准确性,在回归预测分析中具有良好效果。鉴于此,本发明提出了基于主成分分析与混合核函数LSSVR的泥石流预测方法。首先,建立泥石流监测预警系统,以获取泥石流灾害初始影响因子,其次运用主成分分析法PrincipalComponentAnalysis,PCA降维得到泥石流灾害主成分影响因子,然后将已重构的主成分影响因子数据输入至混合核函数LSSVR模型中,并运用鲸鱼优化算法WhaleOptimizationAlgorithm,WOA进行模型参数寻优,最后输出泥石流发生概率以及与其对应的灾害预警等级,完成预测预报。发明内容本发明的目的是提供一种基于PCA与混合核函数LSSVR的泥石流预测方法,解决了当前泥石流灾害发生受多重因素影响而导致的预测维数灾难,以及最小二乘支持向量回归模型中因选取单核函数而导致的模型训练性能部分缺陷、精确度低的问题。本发明所采用的技术方案是,基于PCA与混合核函数LSSVR的泥石流预测方法,具体包括如下步骤:步骤1,建立泥石流监测预警系统,获取初始泥石流灾害发生的影响因子,并且通过PCA将获取的初始影响因子进行降维;步骤2,利用步骤1降维后的初始影响因子构建混合核函数LSSVR泥石流灾害模型;步骤3,运用鲸鱼算法优化步骤2建立的混合核函数LSSVR泥石流灾害模型,得到优化后的组合模型参数;步骤4,利用步骤3得到的组合模型参数,重构混合核函数LSSVR泥石流灾害模型,输出泥石流发生的预测结果。本发明的其他特点还在于,步骤1中对获取的初始泥石流灾害发生影响因子通过PCA进行降维的具体过程如下:步骤1.1,设获取到的样本数据为n个,每个样本中含有a个初始影响因子,其中,a1为日降雨量mm、a2为次声Hz、a3为泥位mA、a4为土壤含水率%、a5为孔隙水压力kPa、a6为坡度°、a7为相对高差m;则每个样本包含m维的矩阵如式1所示:式中,xiji=1,2,…,n;j=1,2,…,a代表每个样本数据;步骤1.2,利用PCA法进行数据降维;将样本矩阵X进行标准化处理,设标准化后的矩阵为Z且样本数据为zij,样本标准化如式2所示:式中,为初始影响因子数据的均值;sj为初始影响因子数据的方差;其表达式分别如式3和式4所示:然后,计算标准化后的矩阵Z的相关系数矩阵Rrij=rji,如式5所示:其中,rij为初始影响因子i与初始影响因子j的相关系数,表达式如式6所示:根据特征方程计算矩阵R的特征值λii=1,2,…,a,λ1≥λ2≥…≥λa与特征向量μi,其中,特征方程的表达式如式7所示:λE-Rμ=07根据计算出的特征值λii=1,2,…,a计算主成分影响因子,定义累计贡献率≥85%的标准,筛选出的bb<a个主成分因子:由特征值计算出的个体贡献率表达式如式8所示:其中,Ti代表每个主成分的个体贡献度;a为初始影响因子;累计贡献率的表达式如式9所示:其中,T代表每个主成分的累计贡献度;b为选取的主成分影响因子,a为初始影响因子;为初始因子总特征值;为主成分因子总特征值;因此,利用筛选出的主成分影响因子取代原有的初始影响因子,并根据主成分表达式Y计算出新样本数据,主成分表达式Y如式10所示:其中,Yd代表主成分重构的新样本数据输出结果;λmn代表成分矩阵中的各维数特征值。步骤2的具体过程如下:步骤2.1,将式10中已重构的主成分灾害影响因子数据按照训练集:测试集=6:1的比例进行分配,将其作为混合核函数LSSVR泥石流预测模型的输入部分;步骤2.2,将步骤2.1中已给定的训练集作为模型输入,训练集的表达式如式11所示:T={x1,y1,…xk,yk}11式中,xi∈Rn;yi∈R;i=1,…,k,k为样本总数;将给定的训练集作非线性映射φ:Rn→F,n为数据维数,构造出LSSVR函数的表达式如式12所示:y=fx=wTφx+b12其中,w和b均为结构风险化最小化模型参数,且w代表空间F的权向量,b∈R代表偏差量;fx为被估计函数;在确定决策参数w、b时,求解问题如式13所示:s.t.yi=wTφxi+b+ξi式中,ξk∈R为松弛因子,γ为惩罚参数;根据拉格朗日函数与非线性规则优化条件得出LSSVR的预测表达式如式14所示:其中,不为零的元素αi所对应的样本xi,yi为支持向量;Kxi,xj为核函数;核函数一般分为全局核函数与局部核函数,将全局核函数与局部核函数相结合,其组合表达式如式15所示:Kmix=uKGlobal+1-uKLocal15其中,u∈[0,1]为组合权重系数;当u→1时,全局核函数产生较大影响作用;当u→0时,局部核函数产生较大影响作用;Kmix为混合核函数表达式;KGlobal为全局核函数表达式;KLocal为局部核函数表达式;拟选取的全局核函数为多项式核函数,局部核函数为径向基核函数,因此,构造的混合核函数如式16所示:式中,Kmix为混合核函数表达式;KRBF为径向基核函数表达式;Kpoly为多项式核函数表达式;γ为可调超参数,σ为RBF核参数;q为多项式阶数;u为组合权重系数。步骤3的具体过程如下:步骤3.1,针对混合核函数LSSVR模型式16中需要优化的四个参数:可调超参数γ、RBF核参数σ、多项式阶数q和组合权重系数u;设置鲸鱼空间位置维数D=4,鱼种群规模S=40和最大迭代次数为Tmax=200;步骤3.2,赋予每条鲸鱼随机位置,根据适应度函数评价处于最优的个体位置,定义最优个体位置为X*,其中适应度函数MSE的表达式如式17所示:步骤3.3,若当前的迭代次数小于最大迭代次数,更新优化算法结构中的参数:系数向量与系数分量随机数l以及收缩包围机制概率p;各表达式如下所示:其中,为系数向量;系数分量在整个过程中自2到0呈线性下降;为[-1,1]区间的随机数;代表鲸鱼螺旋式捕捉猎物的更新位置;为个体随机位置,t为当前迭代的次数;式中,代表鲸鱼螺旋式捕捉猎物的更新位置;b为定义螺旋形状的常数;随机数l∈[-1,1];为当前最佳位置,为第i条鲸鱼与猎物之间的距离;步骤3.4,产生判断机制:当p<0.5时,若则对应式21中的更新个体位置,若则对应式20中的更新个体位置;当p≥0.5时,则对应式21中的更新个体位置;步骤3.5,根据适应度函数17得出每个个体适应度,更新最佳位置根据每次迭代不断更新最佳位置,如果达到最大迭代,则输出最佳位置,其坐标为模型需要优化的参数[γ,σ,q,u];否则,返回步骤3.3依次执行步骤3.3至步骤3.5循环过程,直至满足要求。步骤4的具体过程如下:将步骤3.5得到的可调超参数γ、RBF核参数σ、多项式阶数q和组合权重系数u带入到式16中,重构混合核函数LSSVR泥石流灾害模型,并输入式10中已重构数据中的测试样本,输出泥石流发生概率值,将概率与泥石流预警等级相对应来判定泥石流危险度,其中,泥石流预警等级共分为四个预警等级,分别是常规级、预测级、预警级、警报级,完成预测预报。本发明的有益效果是,基于PCA与混合核函数LSSVR的泥石流预测方法,解决了当前泥石流灾害发生受多重因素影响而导致的预测维数灾难,以及最小二乘支持向量回归模型中因选取单核函数而导致的模型训练性能部分缺陷、精确度低的问题。本发明的方法具有以下有益效果:1通过建立泥石流监测预警系统,实时获取泥石流发生影响因子;2采用PCA法将泥石流7维初始影响因子降维至3维,大大降低了模型结构的复杂性,防止维数灾难;3将WOA优化混合核核函数LSSVR模型运用至泥石流灾害预测中,引用混合核函数机制来平衡模型学习能力与泛化能力,提升精确度,构建最优参数模型来预测泥石流发生概率。附图说明图1是本发明的基于PCA与混合核函数LSSVR的泥石流预测方法流程图;图2是本发明的基于PCA与混合核函数LSSVR的泥石流预测方法使用的泥石流监测预警系统结构示意图;图3是本发明的基于PCA与混合核函数LSSVR的泥石流预测方法使用的仪器监测管理模块的平台显示图;图4是本发明的基于PCA与混合核函数LSSVR的泥石流预测方法的所使用的无限测量柱布设图;图5是本发明的实施例中的PCA提取变量图;图6是本发明的实施例中的概率预测图与实际概率对比图;图7是本发明的实施例中的预测等级与实际预警等级对比图。图中,1.泥石流遥测终端,2.监测总站,3.客户端,4.仪器监测管理模块,5.视频监控管理模块,6.应急管理模块,7.爆闪灯,8.模型管理模块,9.系统管理模块,10.地质灾害管理模块,11.雨量传感器,12.土壤墒情传感器,13.泥位传感器,14.孔隙水压力传感器,15.次声传感器,16.倾角传感器,17.无线测量柱。具体实施方式下面结合附图和具体实施方式对本发明进行详细说明。本发明的基于PCA与混合核函数LSSVR的泥石流预测方法,如图1所示,具体包括如下步骤:步骤1,建立泥石流监测预警系统,获取初始泥石流灾害发生的影响因子,并且通过PCA将获取的初始影响因子进行降维;步骤1的泥石流监测预警系统,其结构示意图如图2所示,包括泥石流遥测终端1、监测总站2和客户端3,泥石流遥测终端1安装在监测区域现场附近,通过无线通信方式上传数据给监测总站2,监测总站2通过无线通信方式上传数据至客户端3;泥石流遥测终端1包括仪器监测管理模块4、视频监控管理模块5和应急管理模块6;仪器监测管理模块4包括安装在监测坡体上多个传感器,传感器通过无线通信方式连接监测总站2;视频监控管理模块5通过无线通信方式连接监测总站2;应急管理模块6包括设置泥石流遥测终端1外部的爆闪灯7。监测总站2包括模型管理模块8,用于接收泥石流遥测终端1采集的坡体实时数据,通过对数据处理做出预测判断,并通过无线通信的方式上传给客户端3和应急管理模块6的爆闪灯7。监测总站2还包括系统管理模块9和地质灾害管理模块10,系统管理模块9内部包括权限管理设置模块、值班人员管理模块和信息小助手模块。地质灾害管理模块10是管理在研究区内的历史地质灾害发生坐标位置与灾害范围内所能够产生威胁的房区、施工、公路等数据,它的主要功能包括地质灾害坐标位置数据、地质灾害区域负责人员数据、应急预案与安全撤离路线管理、查询统计信息与研究区GIS遥感地图显示等模块;其中,仪器监测管理模块10的平台显示如图3所示,仪器监测管理模块10的传感器主要包含雨量传感器11、土壤墒情传感器12、泥位传感器13、孔隙水压力传感器14、次声传感器15以及倾角传感器16;其中,雨量传感器11型号为TH-RSA2000,主要采集点累计降雨量值,安装于坡体或地平面上,应先制作水泥台,将雨量传感器11垂直安置在水泥台上;土壤墒情传感器12的型号为TDR-6,主要采集土壤内的湿度状态值,采取埋地测量法,根据测量需求垂直挖大约8cm或13cm或18cm的土坑,将传感器钢针水平插入土坑内,然后将坑内土壤填平;泥位传感器13主要利用电磁波雷达测距原理,在泥石流的流通渠道上方加装电磁波雷达物位计对泥水位进行监测;孔隙水压力传感器14为振弦式孔隙水压力计,主要采集土壤内的孔隙渗透水压力,主要埋设于坡体土壤中;次声传感器15主要采集山体泥石流的次生信息,提取信号的时间一频率一能量的分布特征,应先在坡体山脚下较开阔地制作水泥台,次声传感器15垂直安置于水泥台上;倾角传感器16为双轴数字输出型传感器,主要采集坡体的倾斜角度,安装于坡面上,传感器与被测面完全紧靠,且传感器底边线与被测物体轴线不存在夹角;另外,本发明在使用各类地埋式传感器时可安装无线测量柱布置策略,图4为无线测量柱在土壤中的布设事例图,无线测量柱的安装深度原则上与当地研究区监测点的基岩深度保持一致,根据研究位置的地质与水文情况来布设各类传感器数量,它将土壤墒情传感器和孔隙水压力传感器的信息集成于无线传感器节点,以无线通信方式将信息上传至模型管理模块8中。视频监控管理模块6是在研究区现场所安装的视频监控设备,能够对山体泥石流等地质灾害发生情况与山谷内河流流量进行实时监控,以便全天记录灾害点的位置与河水径流状况。模型管理模块8的功能是将所收集到的影响因子信息数据进行储存,通过对接收到的数据进行分析与预测判断,如果达到预警要求则及时上传预警信息给客户端3或下发报警提示给应急管理模块8;应急管理模块6的功能为预警信息发布与地质灾害信息查询。预警信息发布采用现场爆闪灯7,若模型管理模块8判定为报警模式,则下发的报警信息被应急管理模块6所接收,现场安装的爆闪灯7点亮,爆闪灯7主要安装于临近公路、施工、现场监测站或人员活动范围内较易观测的地点,以告知管理人员警情。系统管理模块9包括权限管理设置、值班人员管理、信息小助手。权限管理设置主要针对所有管理模块的信息等进行统一管理,设置不同用户可取得的权限与相对应的工作领域范围等;值班人员管理主要显示当前值班人员的基本信息;信息小助手供客户端获取因特网当前研究区的相关信息与资讯。客户端3可以为手机或PC客户端,模型管理模块8将做出的预警信息能够直接通过无线通信的方式传送到客户端,及时的让人们了解到监测区域的泥石流灾害,并且及时做出应对策略;并且检测系统管理模块9中的信息小助手能够实时推送监测区域的相关信息和资讯到客户端,以便人们掌握研究的实时信息,提早做到防范措施。步骤1中对获取的初始泥石流灾害发生影响因子通过PCA进行降维的具体过程如下:步骤1.1,设获取到的样本数据为n个,每个样本中含有a个初始影响因子,其中,a1为日降雨量mm、a2为次声Hz、a3为泥位mA、a4为土壤含水率%、a5为孔隙水压力kPa、a6为坡度°、a7为相对高差m;则每个样本包含m维的矩阵如式1所示:式中,xiji=1,2,…,n;j=1,2,…,a代表每个样本数据;步骤1.2,利用PCA法进行数据降维;将样本矩阵X进行标准化处理,设标准化后的矩阵为Z且样本数据为zij,样本标准化如式2所示:式中,为初始影响因子数据的均值;sj为初始影响因子数据的方差;其表达式分别如式3和式4所示:然后,计算标准化后的矩阵Z的相关系数矩阵Rrij=rji,如式5所示:其中,rij为初始影响因子i与初始影响因子j的相关系数,表达式如式6所示:根据特征方程计算矩阵R的特征值λii=1,2,…,a,λ1≥λ2≥…≥λa与特征向量μi,其中,特征方程的表达式如式7所示:λE-Rμ=07根据计算出的特征值λii=1,2,…,a计算主成分影响因子,定义累计贡献率≥85%的标准,筛选出的bb<a个主成分因子:由特征值计算出的个体贡献率表达式如式8所示:其中,Ti代表每个主成分的个体贡献度;a为初始影响因子;累计贡献率的表达式如式9所示:其中,T代表每个主成分的累计贡献度;b为选取的主成分影响因子,a为初始影响因子;为初始因子总特征值;为主成分因子总特征值。因此,利用筛选出的主成分影响因子取代原有的初始影响因子,并根据主成分表达式Y计算出新样本数据,主成分表达式Y如式10所示:其中,Yd代表主成分重构的新样本数据输出结果;λmn代表成分矩阵中的各维数特征值。步骤2,利用步骤1降维后的初始影响因子构建混合核函数LSSVR泥石流灾害模型;步骤2的具体过程如下:步骤2.1,将式10中已重构的主成分灾害影响因子数据按照训练集:测试集=6:1的比例进行分配,将其作为混合核函数LSSVR泥石流预测模型的输入部分;步骤2.2,将步骤2.1中已给定的训练集作为模型输入,训练集的表达式如式11所示:T={x1,y1,…xk,yk}11式中,xi∈Rn;yi∈R;i=1,…,k,k为样本总数;将给定的训练集作非线性映射φ:Rn→F,n为数据维数,构造出LSSVR函数的表达式如式12所示:y=fx=wTφx+b12其中,w和b均为结构风险化最小化模型参数,且w代表空间F的权向量,b∈R代表偏差量;fx为被估计函数;在确定决策参数w、b时,求解问题如式13所示:s.t.yi=wTφxi+b+ξi式中,ξk∈R为松弛因子,γ为惩罚参数;根据拉格朗日函数与非线性规则优化条件得出LSSVR的预测表达式如式14所示:其中,不为零的元素αi所对应的样本xi,yi为支持向量;Kxi,xj为核函数;核函数一般分为全局核函数与局部核函数,不同类型的核函数存在不同优点。全局核函数随着与测试点距离的增加而对核函数影响也随之增加的特性,它的泛化能力较强,但学习能力较弱;局部核函数随着与测试点距离的减小而对核函数影响也随之减少的特性,它的学习能力较强,但泛化能力较弱。由此可看出,全局核函数与局部核函数相结合能够实现优势互补的效果,将全局核函数与局部核函数相结合,其组合表达式如式15所示:Kmix=uKGlobal+1-uKLocal15其中,u∈[0,1]为组合权重系数;当u→1时,全局核函数产生较大影响作用;当u→0时,局部核函数产生较大影响作用;Kmix为混合核函数表达式;KGlobal为全局核函数表达式;KLocal为局部核函数表达式。拟选取的全局核函数为多项式核函数,局部核函数为径向基核函数,因此,构造的混合核函数如式16所示:式中,Kmix为混合核函数表达式;KRBF为径向基核函数表达式;Kpoly为多项式核函数表达式;γ为可调超参数,σ为RBF核参数;q为多项式阶数;u为组合权重系数。步骤3,运用鲸鱼算法优化步骤2建立的混合核函数LSSVR泥石流灾害模型,得到优化后的组合模型参数;步骤3的具体过程如下:步骤3.1,针对混合核函数LSSVR模型式16中需要优化的四个参数:可调超参数γ、RBF核参数σ、多项式阶数q和组合权重系数u;设置鲸鱼空间位置维数D=4,鱼种群规模S=40和最大迭代次数为Tmax=200;步骤3.2,赋予每条鲸鱼随机位置,根据适应度函数评价处于最优的个体位置,定义最优个体位置为X*,其中适应度函数MSE的表达式如式17所示:步骤3.3,若当前的迭代次数小于最大迭代次数,更新优化算法结构中的参数:系数向量与系数分量随机数l以及收缩包围机制概率p;各表达式如下所示:其中,为系数向量;系数分量在整个过程中自2到0呈线性下降;为[-1,1]区间的随机数;代表鲸鱼螺旋式捕捉猎物的更新位置;为个体随机位置,t为当前迭代的次数;式中,代表鲸鱼螺旋式捕捉猎物的更新位置;b为定义螺旋形状的常数;随机数l∈[-1,1];为当前最佳位置,为第i条鲸鱼与猎物之间的距离;步骤3.4,产生判断机制:当p<0.5时,若则对应式21中的更新个体位置,若则对应式20中的更新个体位置;当p≥0.5时,则对应式21中的更新个体位置;步骤3.5,根据适应度函数式17得出每个个体适应度,更新最佳位置根据每次迭代不断更新最佳位置,如果达到最大迭代,则输出最佳位置,其坐标为模型需要优化的参数[γ,σ,q,u];否则,返回步骤3.3依次执行步骤3.3至步骤3.5循环过程,直至满足要求。步骤4,利用步骤3得到的组合模型参数,重构混合核函数LSSVR泥石流灾害模型,输出泥石流发生的预测结果;步骤4的具体过程如下:将步骤3.5得到的可调超参数γ、RBF核参数σ、多项式阶数q和组合权重系数u带入到式16中,重构混合核函数LSSVR泥石流灾害模型,并输入式10中已重构数据中的测试样本,输出泥石流发生概率值,将概率与泥石流预警等级相对应来判定泥石流危险度,其中,泥石流预警等级共分为四个预警等级,分别是常规级、预测级、预警级、警报级,如表1所示,完成预测预报。表1分类等级划分图实施例以陕西省安康市紫阳县城关镇太平村磨子沟监测数据进行试验验证,分别为a1:日降雨量mm、a2:次声Hz、a3:泥位mA、a4:土壤含水率%、a5:孔隙水压力KPa、a6:坡度°、a7:相对高差m7个参数作为初始评定影响因子,以泥石流可能发生的概率作为预测对象,建立泥石流发生概率与影响因子之间的预测模型。将90组原始数据利用主成分分析法进行主成分影响因子特征筛选。其经PCA提取后的变量如图5所示,与核主成分矩阵结果如表2所示。由图5可知,前3个成分的累计贡献率分别为47.9%、78.2%、85.6%,根据主成分的定义选取标准,前3个主成分的累计贡献率已大于所定义主成分选取标准80%,能够较为全面的反应初始7种影响因子所反映的信息。因此,将前3种影响因子作为新的变量取代初始影响因子作为混合核函数LSSVR泥石流预测模型的新影响因子。通过PCA法来降维,模型维度由初始的7维至3维,大大简化了模型数据结构的复杂度。表2核主成分矩阵根据表2中的主成分矩阵可得,3种主成分的表达式为:Y1=0.043a1+0.144a2-0.119a3-0.185a4+0.433a5+0.365a6+0.426a722Y2=0.505a1+0.568a2-0.068a3-0.126a4+0.158a5+0.029a6+0.002a723Y3=-0.055a1-0.144a2+0.550a3+0.616a4-0.080a5+0.016a6-0.209a724将经PCA得到的90组重构主成分影响因子数据,按照训练集:测试集=6:1的比例进行分配,设置编号前1~75组数据为训练集,用于建立预测模型;76~90组数据为测试集,测试集的数量共15个用于验证预测模型准确度。实验中采用混合核函数LSSVR作为泥石流概率预测模型,利用WOA算法对其进行最佳参数寻优。得出的泥石流实际发生概率与模型预测的对比图如图6所示;并根据预测概率对应相应预警等级,由图7的模型预测出的结果与实际预警等级对比可得,本发明提出的混合核函数LSSVR模型精确度达到93.3%,体现出较好的预测性能,具有相对可靠性。

权利要求:1.基于PCA与混合核函数LSSVR的泥石流预测方法,其特征在于,具体包括如下步骤:步骤1,建立泥石流监测预警系统,获取初始泥石流灾害发生的影响因子,并且通过PCA将获取的初始影响因子进行降维;步骤2,利用步骤1降维后的初始影响因子构建混合核函数LSSVR泥石流灾害模型;步骤3,运用鲸鱼算法优化步骤2建立的混合核函数LSSVR泥石流灾害模型,得到优化后的组合模型参数;步骤4,利用步骤3得到的组合模型参数,重构混合核函数LSSVR泥石流灾害模型,输出泥石流发生的预测结果。2.如权利要求1所述的基于PCA与混合核函数LSSVR的泥石流预测方法,其特征在于,所述步骤1中对获取的初始泥石流灾害发生影响因子通过PCA进行降维的具体过程如下:步骤1.1,设获取到的样本数据为n个,每个样本中含有a个初始影响因子,其中,a1为日降雨量mm、a2为次声Hz、a3为泥位mA、a4为土壤含水率%、a5为孔隙水压力kPa、a6为坡度°、a7为相对高差m;则每个样本包含m维的矩阵如式1所示:式中,xiji=1,2,…,n;j=1,2,…,a代表每个样本数据;步骤1.2,利用PCA法进行数据降维;将样本矩阵X进行标准化处理,设标准化后的矩阵为Z且样本数据为zij,样本标准化如式2所示:式中,为初始影响因子数据的均值;sj为初始影响因子数据的方差;其表达式分别如式3和式4所示:然后,计算标准化后的矩阵Z的相关系数矩阵Rrij=rji,如式5所示:其中,rij为初始影响因子i与初始影响因子j的相关系数,表达式如式6所示:根据特征方程计算矩阵R的特征值λii=1,2,…,a,λ1≥λ2≥…≥λa与特征向量μi,其中,特征方程的表达式如式7所示:λE-Rμ=07根据计算出的特征值λii=1,2,…,a计算主成分影响因子,定义累计贡献率≥85%的标准,筛选出的bb<a个主成分因子:由特征值计算出的个体贡献率表达式如式8所示:其中,Ti代表每个主成分的个体贡献度;a为初始影响因子;累计贡献率的表达式如式9所示:其中,T代表每个主成分的累计贡献度;b为选取的主成分影响因子,a为初始影响因子;为初始因子总特征值;为主成分因子总特征值;因此,利用筛选出的主成分影响因子取代原有的初始影响因子,并根据主成分表达式Y计算出新样本数据,主成分表达式Y如式10所示:其中,Yd代表主成分重构的新样本数据输出结果;λmn代表成分矩阵中的各维数特征值。3.如权利要求2所述的基于PCA与混合核函数LSSVR的泥石流预测方法,其特征在于,所述步骤2的具体过程如下:步骤2.1,将式10中已重构的主成分灾害影响因子数据按照训练集:测试集=6:1的比例进行分配,将其作为混合核函数LSSVR泥石流预测模型的输入部分;步骤2.2,将步骤2.1中已给定的训练集作为模型输入,训练集的表达式如式11所示:T={x1,y1,…xk,yk}11式中,xi∈Rn;yi∈R;i=1,…,k,k为样本总数;将给定的训练集作非线性映射φ:Rn→F,n为数据维数,构造出LSSVR函数的表达式如式12所示:y=fx=wTφx+b12其中,w和b均为结构风险化最小化模型参数,且w代表空间F的权向量,b∈R代表偏差量;fx为被估计函数;在确定决策参数w、b时,求解问题如式13所示:s.t.yi=wTφxi+b+ξi式中,ξk∈R为松弛因子,γ为惩罚参数;根据拉格朗日函数与非线性规则优化条件得出LSSVR的预测表达式如式14所示:其中,不为零的元素αi所对应的样本xi,yi为支持向量;Kxi,xj为核函数;核函数一般分为全局核函数与局部核函数,将全局核函数与局部核函数相结合,其组合表达式如式15所示:Kmix=uKGlobal+1-uKLocal15其中,u∈[0,1]为组合权重系数;当u→1时,全局核函数产生较大影响作用;当u→0时,局部核函数产生较大影响作用;Kmix为混合核函数表达式;KGlobal为全局核函数表达式;KLocal为局部核函数表达式;拟选取的全局核函数为多项式核函数,局部核函数为径向基核函数,因此,构造的混合核函数如式16所示:式中,Kmix为混合核函数表达式;KRBF为径向基核函数表达式;Kpoly为多项式核函数表达式;γ为可调超参数,σ为RBF核参数;q为多项式阶数;u为组合权重系数。4.如权利要求3所述的基于PCA与混合核函数LSSVR的泥石流预测方法,其特征在于,所述步骤3的具体过程如下:步骤3.1,针对混合核函数LSSVR模型式16中需要优化的四个参数:可调超参数γ、RBF核参数σ、多项式阶数q和组合权重系数u;设置鲸鱼空间位置维数D=4,鱼种群规模S=40和最大迭代次数为Tmax=200;步骤3.2,赋予每条鲸鱼随机位置,根据适应度函数评价处于最优的个体位置,定义最优个体位置为X*,其中适应度函数MSE的表达式如式17所示:步骤3.3,若当前的迭代次数小于最大迭代次数,更新优化算法结构中的参数:系数向量与系数分量随机数l以及收缩包围机制概率p;各表达式如下所示:其中,为系数向量;系数分量在整个过程中自2到0呈线性下降;为[-1,1]区间的随机数;代表鲸鱼螺旋式捕捉猎物的更新位置;为个体随机位置,t为当前迭代的次数;式中,代表鲸鱼螺旋式捕捉猎物的更新位置;b为定义螺旋形状的常数;随机数l∈[-1,1];为当前最佳位置,为第i条鲸鱼与猎物之间的距离;步骤3.4,产生判断机制:当p<0.5时,若则对应式21中的更新个体位置,若则对应式20中的更新个体位置;当p≥0.5时,则对应式21中的更新个体位置;步骤3.5,根据适应度函数17得出每个个体适应度,更新最佳位置根据每次迭代不断更新最佳位置,如果达到最大迭代,则输出最佳位置,其坐标为模型需要优化的参数[γ,σ,q,u];否则,返回步骤3.3依次执行步骤3.3至步骤3.5循环过程,直至满足要求。5.如权利要求4所述的基于PCA与混合核函数LSSVR的泥石流预测方法,其特征在于,所述步骤4的具体过程如下:将步骤3.5得到的可调超参数γ、RBF核参数σ、多项式阶数q和组合权重系数u带入到式16中,重构混合核函数LSSVR泥石流灾害模型,并输入式10中已重构数据中的测试样本,输出泥石流发生概率值,将概率与泥石流预警等级相对应来判定泥石流危险度,其中,泥石流预警等级共分为四个预警等级,分别是常规级、预测级、预警级、警报级,完成预测预报。

百度查询: 西安工程大学 基于PCA与混合核函数LSSVR的泥石流预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。