首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于深度强化学习的电动汽车无模型稳定性控制方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:长安大学

摘要:本发明提供了一种基于深度强化学习的车辆无模型稳定性控制方法,该方法以独立驱动电动汽车为研究对象,利用卷积神经网络对摄像头采集到的路面图像进行处理,辨识路面状态,作为车辆稳定性控制的依据。建立车辆理想稳定性状态参考模型,将车辆的稳定性控制等效为马尔科夫决策过程,构建强化学习的环境,包括设计状态空间、动作空间与奖励函数,设计Actor‑Critic网络结构,并利用深度确定性策略梯度和价值损失函数更新网络参数,进行离线学习,最后基于稳定性控制Agent对车辆姿态进行在线调节。本发明通过对路面图像信息进行实时采集和处理,无需建立状态方程和观测方程即可判断路面类型,避免了过程噪声和观测噪声对估计结果的影响,提高了道路辨识的精确度,并可根据道路条件动态调整稳定性控制策略,提高控制策略的工况适应性。

主权项:1.一种基于深度强化学习的车辆无模型稳定性控制方法,其特征在于,该方法包括以下步骤:步骤一,建立车辆七自由度动力学模型:所述的车辆七自由度动力学模型包括车辆纵向动力学方程、车辆横向动力学方程、车辆横摆动力学方程、四个车轮的转动方程、四个车轮的侧偏角方程、四个车轮的滑移率方程以及轮胎力的魔术公式;步骤二,建立路面辨识模型,对采集到的路面图像进行处理,判断当前路面类型;所述的路面辨识模型为卷积神经网络;步骤三,根据车辆行驶状态与路面类型,建立当前车辆-路状态下的理想稳定性状态参考模型,所述的理想稳定性状态参考模型采用车辆在当前路况与行驶条件下的质心侧偏角与横摆角速度进行表征;步骤四,基于马尔科夫决策过程,设计深度强化学习的环境;步骤五,设计深度强化学习的状态空间和动作空间:以车辆的质心侧偏角和横摆角速度为控制依据,选择车辆的状态空间S={ωr,β};将直接横摆力矩作为控制量,选择车辆的动作空间A={Mz};式中:β表示质心侧偏角;ωr表示横摆角速度;Mz表示附加横摆力矩;步骤六,设计深度强化学习的回报函数:所述的深度强化学习的回报函数由回报函数增量和附加惩罚项两部分组成;步骤七,根据路面类型,设计不同强化学习Agent的Actor-Critic网络和策略梯度,动态调整稳定性控制策略,并采用转矩平均分配的方法将直接横摆力矩分配给驱动轮。

全文数据:

权利要求:

百度查询: 长安大学 基于深度强化学习的电动汽车无模型稳定性控制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。