首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于集成学习的降水预测方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:南京信息工程大学

摘要:本发明公开了一种基于集成学习的降水预测方法及系统,方法包括:获取需要降水预测时段和区域的预报因子,构建准时空同步的训练集和测试集;使用训练集通过相互交叉验证分别训练随机森林、XGBoost和极度随机树三种单一机器学习模型,并对三种单一机器学习模型的定量降水估计结果进行线性回归得到三种单一机器学习模型的权重,对测试集的三种单一机器学习模型定量降水估计结果加权相加,得到基于集成学习的定量降水估计;将基于集成学习的定量降水估计设为初估场、通过双调和样条插值的同一时空分辨率下的高密度自动站降水观测设为观测值,对初估场和观测值进行最优插值融合,用于降水预测。本发明提高了降水预测的准确性和实用性。

主权项:1.一种基于集成学习的降水预测方法,其特征在于,包括:获取需要降水预测时段和区域的预报因子,构建准时空同步的训练集和测试集;使用训练集通过相互交叉验证分别训练随机森林、XGBoost和极度随机树三种单一机器学习模型,并对三种单一机器学习模型的定量降水估计结果进行线性回归得到三种单一机器学习模型的权重,对测试集的三种单一机器学习模型定量降水估计结果加权相加,得到基于集成学习的定量降水估计;将基于集成学习的定量降水估计设为初估场、通过双调和样条插值的同一时空分辨率下的高密度自动站降水观测设为观测值,对初估场和观测值进行最优插值融合,用于降水预测;其中,所述获取需要降水预测时段和区域的预报因子,构建训练集和测试集,包括:获取1h时间分辨率的FY-4A光谱数据、云参数产品、ERA5再分析物理量资料、高密度自动站的降水观测值和数字高程数据,并通过线性插值,样条插值,双调和样条插值构建训练集和测试集,用于训练集成学习模型和定量降水估计,其中,FY-4A指风云四号A星;还包括:通过FY-4A光谱数据构造和降水强相关的组合通道信息,分别是风云四号A星多个不同的光谱通道两两相减构造的六个亮温差:T6.25-T10.7、T8.5-T10.7、T7.1-T12.0、T12.0-T10.7、T3.75L-T7.1和T3.75L-T10.7;亮度梯度;其中,亮度梯度的定义如下: 1其中,T代表10.7微米的光谱亮温,i和j代表像素点位置;所述通过线性插值,样条插值,双调和样条插值构建训练集和测试集,用于训练集成学习模型和定量降水估计,包括:基于FY-4AAGRI、ERA5和DEM的空间分辨率的差异,对数据进行插值处理构造准时空同步的训练集和测试集;构建训练集的方法为根据高密度自动站的地理位置信息,对卫星观测数据进行0.01°×0.01°空间分辨率的样条插值,选择距离最近的四个点的ERA5数据和DEM数据进行线性插值;匹配上高密度自动站观测的逐小时降水量数据,用于模型训练;构造测试集的方法为根据卫星观测数据的地理位置信息,选择距离最近的四个点的ERA5数据和DEM数据进行线性插值,故测试集的空间分辨率为4km×4km;匹配上双调和样条插值的高密度自动站降水数据,用于评估集成学习模型和定量降水估计性能;通过五折交叉验证分别训练随机森林、XGBoost和极度随机树三种单一机器学习模型,包括:确定随机森林和极度随机树的两个参数,分别是单个决策树使用特征的最大数量max_features和决策树的个数n_trees;max_features的数值小于输入的变量参数,max_features的取值为1,,或,k为模型输入的变量个数;决策树的个数n_trees的取值为500~800;因此,将n_trees设置为以500为首项,10为公差,800为末项的递增数列,以模型降水估计值和降水观测值的相关系数为评价指标,递增数列中,使相关系数最高的项为模型n_trees参数;相关系数的定义为: 2其中,Gi表示第i个观测站观测到的降水量;表示所有观测站观测到的降水量的平均值;Si表示QPE算法估计第i个格点的降水量;表示QPE算法估计的所有降水格点的降水量;n表示观测站的数量;确定XGBoost模型的五个参数,分别是弱评估器的数量n_estimators、学习率learning_rate、树的最大深度max_depth、损失函数的最低值gamma和正则化惩罚系数alpha;其中,设置弱评估器的数量n_estimators为训练得到的决策树的个数n_trees,learning_rate的取值为0.01~0.2,max_depth的取值为3~10,gamma的取值范围为0~0.3,alpha的取值范围为0~0.3;使用训练n_trees时同样的训练方法,对学习率learning_rate、树的最大深度max_depth、损失函数的最低值gamma和正则化惩罚系数alpha分别在有效取值范围内设置等差数列,以最优相关系数为评价指标分别训练,训练每个参数时,其余参数的值保持不变;将基于集成学习的定量降水估计设为初估场、通过双调和样条插值的同一时空分辨率下的高密度自动站降水观测设为观测值,对初估场和观测值进行最优插值融合,用于降水预测,包括:对于任意待分析像元X,定义其背景值为Xb,则再分析结果Xa表示为 3其中,为待分析像元邻域内的个观测值;H为观测算子;表示观测值对应的背景值;K为卡尔曼增益,用于量化邻近观测值对分析点的相对贡献,表示为 4其中,为H的转置矩阵;观测误差协方差矩阵R为对角矩阵,对角元素由对应产品的观测误差方差组成;背景误差协方差矩阵为对称矩阵,表示为 5其中,为背景误差方差;背景场和观测场的误差方差通过实测值进行估计;表示格点i和j之间的空间关联,采用高斯权重函数来近似拟合这种空间相关性: 6 7其中,dx和dy分别代表数据点i、j空间距离在径向和纬向的正交分量,lx和ly表示相关性在空间上的关联距离。

全文数据:

权利要求:

百度查询: 南京信息工程大学 一种基于集成学习的降水预测方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。