买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南京邮电大学
摘要:本发明公开了一种基于机器学习的NDVI预测集成优化方法及系统,包括获取研究区域的研究数据并筛选和预处理,形成输入变量数据集;所述研究数据至少包括NDVI数据集和气候变量数据集;选取至少一种类型的NDVI预测模型,构建包括至少两种NDVI预测模型在内的NDVI预测模型集合;构建NDVI预测集成优化模型,包括目标函数、权重矩阵和约束条件;采用预配置的算法求解NDVI预测集成优化模型,确定最优权重,计算和评价预测精度,并输出预测结果。针对单个机器学习模型易出现欠拟合或过拟合问题,构建基于线性加权的NDVI预测集成模型,并通过增强精英保留的遗传算法确定各模型的权重,降低模型不确定性的不利影响。
主权项:1.基于机器学习的NDVI预测集成优化方法,其特征在于,包括如下步骤:步骤S1、获取研究区域的研究数据并筛选和预处理,形成输入变量数据集;所述研究数据至少包括NDVI数据集和气候变量数据集;步骤S2、选取至少两种类型的机器学习模型,构建包括至少两个NDVI预测模型在内的NDVI预测模型集合;步骤S3、构建NDVI预测集成优化模型,包括目标函数、权重矩阵和约束条件;步骤S4、采用预配置的算法求解NDVI预测集成优化模型,确定最优权重,输出预测结果,计算和评价预测精度;所述步骤S1进一步包括:步骤S11、确定研究区域的范围,并将研究区域,根据流域区划标准划分为至少两个子流域,获取预定格式的时间序列数据作为研究数据;所述研究数据至少包括NDVI数据集和气候变量数据集;步骤S12、利用变量优选方法筛选出与流域各子流域NDVI具有强相关的气候变量及其滞时影响因子,构建输入变量集;所述输入变量包括:短波辐射、风速、降水、温度、气压、露点温度和水汽压差VPD;所述步骤S12进一步包括:步骤S12a、使用广义线性回归法对每个子流域分别建立NDVI与气候变量之间的线性关系模型,并计算各变量的系数和显著性水平,选择显著性水平小于预定值的变量作为候选变量;步骤S12b、使用逐步回归法对每个子流域分别进行向前、向后或双向的逐步变量选择,根据AIC指标或BIC指标选择最优的变量组合作为候选变量;步骤S12c、使用AIC指标或BIC指标对每个子流域分别比较广义线性回归法和逐步回归法得到的候选变量组合,选择指标值最小的变量组合作为输入变量集;所述步骤S2进一步包括:步骤S21、筛选至少两种类型的机器学习模型,每种类型的机器学习模型包括至少一种机器学习模型;所述机器学习模型至少包括:线性回归模型、支持向量机模型、KNN模型、随机森林模型和极端梯度提升决策树模型;步骤S22、针对每种机器学习模型,分别建立NDVI预测模型并得到每个模型的预测结果;所述步骤S22进一步为:步骤S22a、采用线性回归模型对每个子流域分别建立NDVI与输入变量集之间的线性回归模型,并使用最小二乘法或岭回归法进行参数估计,得到线性回归模型的预测结果;步骤S22b、使用支持向量机模型对每个子流域分别建立NDVI与输入变量集之间的支持向量回归模型,并使用核函数进行非线性映射,得到支持向量机模型的预测结果;步骤S22c、使用KNN模型对每个子流域分别建立NDVI与输入变量集之间的K近邻回归模型,并使用欧氏距离或曼哈顿距离进行相似度计算,得到KNN模型的预测结果;步骤S22d、使用随机森林模型对每个子流域分别建立NDVI与输入变量集之间的随机森林回归模型,并使用自助采样法和随机特征选择法进行特征和样本的随机化处理,得到随机森林模型的预测结果;步骤S22e、使用极端梯度提升决策树模型,对每个子流域分别建立NDVI与输入变量集之间的极端梯度提升决策树回归模型,并使用梯度提升法和正则化项进行模型优化和过拟合控制,得到极端梯度提升决策树模型的预测结果;步骤S22f、针对每一子流域,按照拟合效果降序排列,获取前N项效果最佳的机器学习模型,并获取加权结果,获得每个子流域对应的最佳机器学习模型,并存储,N为自然数。
全文数据:
权利要求:
百度查询: 南京邮电大学 基于机器学习的NDVI预测集成优化方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。