买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明提出考虑区域用户个性舒适度的建筑空调优化控制方法及系统,涉及建筑节能与智能控制技术领域。包括将暖通空调系统控制问题描述为马尔可夫决策过程,定义每个智能体的状态、动作和奖励;采用元学习方法学习得到用户舒适度奖励函数初始模型;分别利用不同区域用户的舒适度反馈数据,对用户舒适度奖励函数初始模型进行差异化训练,得到每个智能体差异化的舒适度奖励函数模型;基于能耗奖励模型和每个智能体差异化的舒适度奖励函数模型,得到每个智能体的奖励函数,对每个智能体的策略网络和价值网络进行训练,利用训练好的策略网络进行建筑暖通空调系统的控制决策。本发明使HVAC系统保证区域用户个性舒适度的前提下,实现节能减排。
主权项:1.考虑区域用户个性舒适度的建筑空调优化控制方法,其特征在于,包括以下步骤:获取建筑不同区域用户的舒适度反馈数据,以及建筑空调系统的历史运行数据,进行数据预处理;将暖通空调系统控制问题描述为马尔可夫决策过程,定义每个智能体以及每个智能体的状态、动作和奖励;采用元学习方法,基于多个区域用户的舒适度反馈数据,进行多个区域的舒适度奖励函数初始参数学习,得到用户舒适度奖励函数初始模型;分别利用不同区域用户的舒适度反馈数据,对用户舒适度奖励函数初始模型进行差异化训练和参数更新,得到每个智能体差异化的舒适度奖励函数模型;基于能耗奖励模型和每个智能体差异化的舒适度奖励函数模型,得到每个智能体的奖励函数,对每个智能体的策略网络和价值网络进行训练,利用训练好的策略网络进行建筑暖通空调系统的控制决策;使用元学习方法,得到用户舒适度奖励函数初始模型,具体为:将每个区域用户的舒适度奖励函数分别定义为一个子任务;面向每个子任务针对的区域用户,获取多组室内环境状态和舒适度反馈数据,并划分为Supportset和Queryset;利用Supportset中的数据分别对各个子任务进行训练,通过梯度下降更新各个子任务的参数;利用训练得到的参数,在Queryset中进行测试,然后计算出各子任务下的损失函数;将多个子任务的损失函数平均,用梯度下降更新元学习训练任务的初始参数;计算损失函数: ;其中,表示采样得到的室内用户对于室内环境状态的实际舒适度反馈数据;表示由权重参数表示的模型对相同输入数据的预测输出;表示Supportset共K组数据,k表示第k,1≤k≤K组数据;表示Supportset中第k组室内环境数据,b表示第b个训练子任务,1≤b≤B;使用梯度下降更新参数: ;其中,为更新后的元学习网络的权重参数;计算各子任务下的损失函数: ;其中,为Queryset中第k′组室内环境数据;表示经过Supportset训练后利用Queryset进行测试时得到的模型权重参数;K′表示Queryset共K′组数据,表示第k′,1≤k′≤K′组数据;对所有用户的损失函数进行平均,采用梯度下降更新初始参数: ;其中,b表示第b个训练子任务,1≤b≤B。
全文数据:
权利要求:
百度查询: 山东大学 考虑区域用户个性舒适度的建筑空调优化控制方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。