首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于强化学习的工质热物性获取方法、系统和存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:苏州浪潮智能科技有限公司

摘要:本发明涉及一种基于强化学习的工质热物性获取方法、系统和存储介质,方法包括:将神经网络模型作为强化学习的决策网络,以进口温度作为所述神经网络模型的输入,并通过所述神经网络模型获得最优的热物性参数;将物理模型作为强化学习的估值网络,并将所述最优的热物性参数输入所述物理模型,通过所述物理模型获得预测出口温度;根据所述预测出口温度获取强化学习的奖励;根据所述奖励修正所述神经网络模型的网络参数,直至所述神经网络模型收敛。采用本方法,只需测量工质流量、进口温度和出口温度,便解决了高温、高压下甚至超临界条件下工质物性预测问题,降低了常温、常压条件下工质物性测量的人力、物力。

主权项:1.一种基于强化学习的工质热物性获取方法,其特征在于,所述方法包括:将神经网络模型作为强化学习的决策网络,以进口温度作为所述神经网络模型的输入,并通过所述神经网络模型获得最优的热物性参数;将物理模型作为强化学习的估值网络,并将所述最优的热物性参数输入所述物理模型,通过所述物理模型获得预测出口温度;根据所述预测出口温度获取强化学习的奖励;根据所述奖励修正所述神经网络模型的网络参数,直至所述神经网络模型收敛,所述通过所述神经网络模型获得最优的热物性参数,具体包括:通过所述神经网络模型输出热物性参数的均值和方差;根据所述热物性参数的均值和方差构建高斯分布;从所述高斯分布中随机采样,作为最优的热物性参数;获取所述奖励的计算公式为: 其中,Tout,predict为通过解所述物理模型获得的预测出口温度;Tout,exprienment为实际测试获得的测试出口温度;reward为所述强化学习的奖励;x为所述决策网络输出当前温度下热物性参数均值的概率;γ为工质经验系数;n为1~N中的其中一个。

全文数据:

权利要求:

百度查询: 苏州浪潮智能科技有限公司 基于强化学习的工质热物性获取方法、系统和存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。