首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于效能网络强化权重选择的气体浓度预测方法和装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:清华大学

摘要:本申请提供了一种基于效能网络强化权重选择的气体浓度预测方法和装置,该方法包括:将采集的气体浓度序列输入到M个预测模型进行预测处理,得到M个气体浓度预测结果;将采集的气体浓度序列转换为气体浓度序列二维图像,以及,将M个气体浓度预测结果转换为M个气体浓度预测结果二维图像,根据所述气体浓度序列二维图像和所述M个气体浓度预测结果二维图像,得到三维向量;将三维向量输入到效能网络进行处理,得到M个预测模型的权重;根据M个预测模型的权重对M个气体浓度预测结果进行加权求和,得到最终的气体浓度预测结果。如此,通过该方法得到准确的M个预测模型的权重,从而根据M个预测模型的权重得到准确的气体浓度预测结果。

主权项:1.一种基于效能网络强化权重选择的气体浓度预测方法,其特征在于,所述方法包括:将采集的气体浓度序列输入到M个预测模型进行预测处理,得到M个气体浓度预测结果,M为大于1的正整数;将所述采集的气体浓度序列转换为气体浓度序列二维图像,以及,将所述M个气体浓度预测结果转换为M个气体浓度预测结果二维图像,根据所述气体浓度序列二维图像和所述M个气体浓度预测结果二维图像,得到三维向量;将所述三维向量输入到效能网络进行处理,得到M个预测模型的权重,所述效能网络基于复合系数从多个维度均衡缩放网络结构参数,且通过强化学习方法训练得到的;根据所述M个预测模型的权重对所述M个气体浓度预测结果进行加权求和,得到最终的气体浓度预测结果;其中,所述效能网络包括:动作网络模块、价值网络模块、目标动作网络模块和目标价值网络模块;将当前时刻的三维向量、下一时刻的三维向量、训练权重、奖励值,作为一条训练数据;从暂存器中随机获取多条训练数据作为训练样本,并根据所述训练样本对所述效能网络进行训练,包括:将所述当前时刻的三维向量和所述训练权重输入到所述价值网络模块,得到当前动作价值,并将所述下一时刻的三维向量输入到所述目标动作网络模块,得到M个预测模型的新训练权重;所述目标价值网络模块根据所述新训练权重、所述下一时刻的三维向量和所述奖励值,计算目标动作价值;根据所述动作价值和所述目标动作价值的误差,对所述价值网络模块的网络参数进行更新,得到更新后的价值网络模块;所述更新后的价值网络模块根据所述当前时刻的三维向量和所述新训练权重,计算动作价值函数梯度和动作参数梯度;根据所述动作价值函数梯度和所述动作参数梯度,对所述动作网络模块的网络参数进行更新,得到更新后的动作网络模块;按照上述步骤进行目标时间训练后,利用所述更新后的价值网络模块对所述目标动作网络模块的网络参数进行更新,以及利用所述更新后的动作网络模块对所述目标价值网络模块的网络参数进行更新。

全文数据:

权利要求:

百度查询: 清华大学 基于效能网络强化权重选择的气体浓度预测方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。