首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于半嵌入式特征选择的可解释性水质预测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:哈尔滨工业大学

摘要:一种基于半嵌入式特征选择的可解释性水质预测方法,属于环境工程技术领域。本发明解决了现有水质预测方法无法定量准确地解释各流域特征对河流水质变化的影响的问题。本发明根据机器学习回归算法选择对应的解释器,基于SHAP包输出的SHAP值对模型进行解释,比较各流域特征对河流水质的贡献大小,识别核心水质驱动因素,分析各核心驱动因素对河流水质的作用机制。本发明适用河流水质预测。

主权项:1.一种基于半嵌入式特征选择的可解释性水质预测方法,其特征在于,该方法具体包括:步骤一、收集目标河流的河道线分布图,确定河流所覆盖的流域范围,获取流域范围的DEM图,根据所述DEM图提取流域河网,划分流域汇水区;步骤二、根据目标河流水质的影响因素,构建目标河流水质预测特征体系,获取影响目标河流水质的特征,以流域汇水区为单位收集目标河流特征的历史数据及对应的水质数据,对所述特征的历史数据及对应的水质数据进行清洗,生成机器学习模型的初步输入数据集;步骤三、依次对所述初步输入数据集中每两个特征的历史数据进行自相关性分析,获取强自相关性特征对;所述强自相关性特征对的斯皮尔曼相关系数大于0.8;步骤四、建立前置机器学习模型,基于该模型利用SHAP解释框架,计算初步输入数据集中所有特征的全局特征重要性值,删除强自相关性特征对中全局特征重要性值较低的特征,完成特征选择,获取机器学习模型的最终输入数据集;步骤五、将所述最终输入数据集划分为训练集和测试集,利用训练集分别以决定系数r2、均方误差MSE、平均绝对误差MAE、平均绝对百分比误差MAPE作为模型评价指标,对机器学习回归模型的参数进行寻优,获取最优参数组合;步骤六、以最优参数组合作为机器学习回归模型参数,利用训练集和测试集分别对机器学习回归模型进行训练和验证,获取最优机器学习回归模型;步骤七、采用步骤六所述的最优机器学习回归模型,利用当前目标河流水质的特征数据对目标河流水质进行预测,步骤七后还包括:基于最优机器学习回归模型的SHAP解释框架,对水质预测值进行拆解,获取表征各特征对水质预测值影响的SHAP值的步骤。

全文数据:

权利要求:

百度查询: 哈尔滨工业大学 一种基于半嵌入式特征选择的可解释性水质预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术