恭喜东南大学陈国浠获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜东南大学申请的专利基于深度预测网络和深度强化学习的自动驾驶车辆控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115629608B 。
龙图腾网通过国家知识产权局官网在2025-05-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211316067.7,技术领域涉及:G05D1/43;该发明授权基于深度预测网络和深度强化学习的自动驾驶车辆控制方法是由陈国浠;张亚;张辉设计研发完成,并于2022-10-26向国家知识产权局提交的专利申请。
本基于深度预测网络和深度强化学习的自动驾驶车辆控制方法在说明书摘要公布了:本发明公开了一种基于深度预测网络和深度强化学习的自动驾驶车辆控制方法,首先定义上层的离散控制器对应车辆底层的控制信号;设置超参数,搭建基于编码器‑解码器框架的深度预测网络和双深度Q网络;再对受控车辆进行深度强化学习训练,设计奖励函数,迭代更新网络的权重,直到受控车辆获得的奖励值达到预设水平或训练轮数到达预设值;对收集到的历史数据进行预处理,根据时延情况确定数据和标签,将受控车辆前方车辆的特征数据转化为图数据为深度预测网络提供训练集和验证集,在训练集上进行训练,直到在验证集上的损失函数值不再下降;最后将训练好的深度预测网络和双深度Q网络部署到受控车辆中,实现车辆的自动驾驶控制。
本发明授权基于深度预测网络和深度强化学习的自动驾驶车辆控制方法在权利要求书中公布了:1.基于深度预测网络和深度强化学习的自动驾驶车辆控制方法,其特征在于,包括以下步骤:S1:定义上层的离散控制器对应车辆底层的控制信号,所述上层的离散控制器至少包括左变道、保持、右变道、加速、减速五个动作指令,将上层的离散动作映射成底层的物理控制信号,底层的物理控制信号由比例控制器得到;定义车辆的运动学模型为: β=tan-112tanδ,其中,x,y是车辆在Frenet坐标系下的坐标;v是车辆的前进速度;ψ是航向角;β是重心处的滑移角;a是加速度命令;δ是前轮转向命令;a和δ由比例控制器得到,加速度控制量a的具体表达式为:a=Kpvr-v,其中,vr是期望速度;v是当前速度;当指令为加速时,给定速度参考值vr大于当前的速度值,Kp是控制器增益;前轮转向命令δ的具体表达式为: ψr=ψL+Δψr, vlat,r=-Kp,latΔlat,其中,ψL是车道朝向;vlat,r是横向速度指令;Δψr是受控车辆对应所需的航向变化;Kp,lat和Kp,ψ是控制器增益;由上层的强化学习控制器的动作映射得到,当指令为变道时,车道中心线的横向位置Δlat会对应指令要求进行改变;所述期望速度vr和车辆相对于车道中心线的横向位置Δlat均由上层的强化学习控制器的动作映射得到;S2:设置超参数,搭建基于编码器-解码器框架的深度预测网络和双深度Q网络,对各个网络的权重进行初始化;S3:对受控车辆进行深度强化学习训练,设计奖励函数,受控车辆与环境交互,得到奖励值,迭代更新网络的权重,直到受控车辆在一轮驾驶行为中获得的奖励值达到预设水平或训练轮数到达预设值,终止训练;S4:对收集到的历史数据进行预处理,根据时延情况确定数据和标签,将受控车辆前方车辆的特征数据转化为图数据,为深度预测网络提供训练集和验证集,在训练集上进行训练,直到在验证集上的损失函数值不再下降,终止训练;S5:将训练好的深度预测网络和双深度Q网络部署到受控车辆中,通过深度预测网络对受控车辆前方车辆的位置和速度进行预测,将预测信息连同受控车辆的速度和位置信息展开成列向量,作为双深度Q网络的输入,得到当前时刻动作价值最高的动作,再将这个上层的离散动作通过参考值和比例控制器映射成底层的物理控制信号,实现车辆的自动驾驶控制。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:210096 江苏省南京市玄武区四牌楼2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。