首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

深度强化学习型能量管理策略的无权重训练及测试方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:重庆大学

摘要:本发明涉及一种深度强化学习型能量管理策略的无权重训练以及测试方法,属于新能源汽车与人工智能算法的交叉领域。该方法包括:S1:建立面向离线迭代训练的仿真道路场景,并搭建来自于真实道路的测试场景,同时设计面向短时域行驶范围的实时速度规划方法;S2:针对多种配备单电机的并联混合动力系统构型,建立基于Python环境与Simulink环境的联合仿真训练架构;S3:设计无权重化训练方法,通过消除原先奖励函数中关于瞬时燃料消耗和SOC偏差的优化项后,引入规则型发动机启停策略实现针对SOC变化的维持,并利用发动机最佳运行曲线与燃油消耗率引导深度强化学习型智能体探索最优型能量管理策略;S4:离线仿真训练与测试环节结束后进行硬件在环测试。

主权项:1.一种深度强化学习型能量管理策略的无权重训练及测试方法,其特征在于,该方法具体包括以下步骤:S1:建立面向离线迭代训练的仿真道路场景,结合来地图与地理信息系统的真实数据,利用三维仿真建模软件,修改基于MathWorks官方地图中CurvedRoad的训练场景,并且搭建来自于真实道路的测试场景,同时设计面向短时域行驶范围的实时速度规划方法;S2:针对多种配备单电机的并联混合动力系统构型,建立基于Python环境与Simulink环境的联合仿真训练架构,通过Matlab.engine引擎与Matlab函数形成交互式数据传递架构;S3:设计一种无权重化训练方法,通过消除原先奖励函数中关于瞬时燃料消耗和SOC偏差的优化项后,引入规则型发动机启停策略实现针对SOC变化的维持,并利用发动机最佳运行曲线与燃油消耗率引导深度强化学习型智能体探索最优型能量管理策略;为了优化训练过程,两个优化项均以归一化形式进行表征,具体如下: 其中,RNEW-EMS表示无权重化奖励函数,BSFC表示燃油消耗率,BSFCmax是最大燃油消耗率,BSFCmin是最小燃油消耗率,abs表示绝对值,Teng是发动机转矩,τ是一个防止分母成为零的极小常数,Tmaxeng是当前发动机的最大转矩,Tmineng是当前发动机的最小转矩,TOOT是发动机最佳运行曲线的转矩;S4:离线仿真训练与测试环节结束后进行硬件在环测试,将训练得到的最优型能量管理策略在Python环境下保存为PyTorch工具的pth文件,在Simulink环境中通过Constant常量模块的形式重建矩阵,而数据总量由相邻两层的神经元个数决定,通过HuahaiRapidU3车规级控制器以及Speedgoat移动实时目标机,利用CAN通讯方式完成针对深度强化学习型混合动力系统能量管理策略的硬件在环测试、校准与监控。

全文数据:

权利要求:

百度查询: 重庆大学 深度强化学习型能量管理策略的无权重训练及测试方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。