首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于GBDT-LR和信息量模型的滑坡易发性评价方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:合肥工业大学

摘要:本发明公开了了一种基于GBDT‑LR和信息量模型的滑坡易发性评价方法,本发明结合研究区域滑坡发育的特点,基于GIS和Python等软件,综合考虑前人研究成果,最终确定13个评价因子,基于信息量模型(I)、梯度提升决策树‑逻辑回归(GBDT‑LR)算法构建滑坡易发性评价模型,采用Borderline‑Smote算法解决滑坡样本的不对称问题,通过频率比、十折线交叉验证和ROC曲线对评价模型进行评估,最终制成贵池区易发性区划图,并结合实际情况分析所制成的滑坡易发性区划图的合理性;为滑坡发生的可能性提供参考,为政府治理滑坡灾害提供科学的参考依据。

主权项:1.一种基于GBDT-LR和信息量模型的滑坡易发性评价方法,其特征在于:具体包括如下步骤:1选择研究区域;2评价单元和评价因子的选取;3选择非滑坡样本,采用Borderline-Smote算法进行数据采样,生成和非滑坡样本相同数量的滑坡样本;4采用信息量模型和GBDT-LR算法进行耦合的方法构建滑坡易发性模型;5将样本数据分别从频率比、十折线交叉验证、ROC曲线3个方面对构建的滑坡易发性模型进行评价;所述的信息量模型,具体内容如下:在实验过程中,用滑坡样本频率计算信息量,如式1所示: 式1中,I表示评价单元中总信息量;n表示评级因子数量;xi表示当前评价单元内所取的评价因子等级;Y表示滑坡事件;S表示研究区域总面积;Si表示研究区域内含有xi评价因子的总面积;N表示研究区域内滑坡总面积;Ni表示研究区域内含有xi评价因子的滑坡总面积;信息量I作为滑坡评价的综合性指标,其值越大,滑坡发生的可能性越大,反之,发生滑坡的可能性越小;所述的GBDT-LR算法,具体步骤如下:1将训练样本数据输入GBDT模型进行训练;2用训练好的GBDT模型预测每个样本落在哪个棵树的哪个叶结点上;3将预测结果进行one-hot编码,得到新的离散特征;4将新特征与原特征进行组合,得到新的数据集;5将新数据集输入LR模型进行训练;6用训练好的LR模型进行滑坡预测,得到预测值;所述的LR模型,具体内容如下:函数表达式如下: 式2中,α代表逻辑回归的常数项;β代表逻辑回归的回归系数;P代表滑坡发生概率,P的值越接近1,表明该斜坡单元发生滑坡的可能性越大,否则,表明发生滑坡的可能性越小;所述的GBDT模型,具体内容如下:GBDT模型首先,通过输入的训练样本得到第一棵决策树,训练结果落到某个叶子节点上,同时训练好的第一棵决策树将产生预测值,将实际值与预测值之间的差值称之为残差;然后将残差作为第二棵决策树的实际值,重复上述步骤,反复迭代,直到训练结果达到预先设定的训练次数阈值或精度阈值即停止训练;最后,将所有决策树的预测值加在一起即可得预测值;GBDT模型算法过程如下:假设输入训练数据集损失函数Ly,fx;输出回归树1初始化 2对m=1,2,…,Ma对每个样本i=1,2,…,N,计算负梯度rmi作为近似残差; b对rmi拟合一个回归树,得到第m棵树的叶结点区域Rmj,j=1,2,…,J,J为回归树叶节点的个数;c对j=1,2,…,J,计算叶节点区域最佳拟合值cmj d更新θ表示落入当前节点的样本集合;3得到回归树 。

全文数据:

权利要求:

百度查询: 合肥工业大学 基于GBDT-LR和信息量模型的滑坡易发性评价方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。