Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜东南大学李旭获国家专利权

恭喜东南大学李旭获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜东南大学申请的专利城市低速环境下的营运车辆侧向防撞驾驶决策方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115257789B

龙图腾网通过国家知识产权局官网在2025-01-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211070522.X,技术领域涉及:B60W50/00;该发明授权城市低速环境下的营运车辆侧向防撞驾驶决策方法是由李旭;胡玮明;胡锦超;胡悦;孔栋;徐启敏设计研发完成,并于2022-09-02向国家知识产权局提交的专利申请。

城市低速环境下的营运车辆侧向防撞驾驶决策方法在说明书摘要公布了:本发明公开了一种城市低速环境下的营运车辆侧向防撞驾驶决策方法。首先,利用硬件在环驾驶模拟仿真平台构建城市交通场景,模拟并采集不同驾驶条件和行驶工况下的安全驾驶行为。其次,通过模仿学习的方式,利用数据集聚合算法模拟人类驾驶员的安全驾驶行为。最后,通过无监督学习的方式,利用近端策略优化算法进一步学习侧向防撞策略,实现对营运车辆侧向防撞驾驶行为的高级决策输出。本发明提出的方法,能够模拟人类驾驶员的安全驾驶行为,且考虑了视觉盲区、交通参与者类型等因素对行车安全的影响,为大型营运车辆提供更加合理、有效的防撞驾驶策略,实现了城市低速环境下的营运车辆侧向防撞驾驶决策。

本发明授权城市低速环境下的营运车辆侧向防撞驾驶决策方法在权利要求书中公布了:1.城市低速环境下的营运车辆侧向防撞驾驶决策方法,首先,利用硬件在环驾驶模拟仿真平台构建城市交通场景,模拟并采集不同驾驶条件和行驶工况下的安全驾驶行为;其次,通过模仿学习的方式,利用数据集聚合算法模拟驾驶员的安全驾驶行为;最后,通过无监督学习的方式,利用近端策略优化算法进一步学习侧向防撞策略,为大型营运车辆提供防撞驾驶策略,实现城市低速环境下的营运车辆侧向防撞驾驶决策;其特征在于:步骤一:利用驾驶模拟仿真平台构建城市交通场景营运车辆在城市低速环境下行驶,其左侧或右侧存在其他交通参与者,包括机动车、非机动车或行人;首先,利用驾驶模拟仿真平台构建城市交通场景,涵盖直道、弯道和交叉路口,设置具有高度随机性的交通流和交通参与者;其次,多名驾驶员利用驾驶模拟器控制营运车辆,该驾驶模拟器具有方向盘、油门和制动踏板,采集车道变换、车道保持、车辆跟驰、左转向、右转向、加速、减速、匀速这8种行驶工况下的安全驾驶行为;最后,基于采集的安全驾驶行为,构建安全驾驶行为数据库D;步骤二:利用模仿学习方法模拟驾驶员的安全驾驶行为利用数据集聚合算法模拟人类驾驶员的安全驾驶行为;安全驾驶行为数据库D会在每个时间步i连续地聚合新的数据集Di,具体的训练过程如下:子步骤1:初始化参数φ;子步骤2:初始化策略π;子步骤3:进行N个时间步长的循环,每一次循环包括子步骤3.1至子步骤3.5,具体地:子步骤3.1:利用下式更新策略: 式中,πi表示第i时刻的策略,π*表示专家策略,βi表示第i次迭代时对策略软更新的参数,表示第i时刻的最优策略;子步骤3.2:利用πi对专家轨迹进行采样;子步骤3.3:输出由πi访问的策略和专家给出的动作组成的数据集Di={St,π*St},St表示t时刻的状态空间;子步骤3.4:聚合数据集:D←D∪Di;子步骤3.5:在数据集D上训练策略其中表示i+1时刻的最优策略;子步骤4:最后,返回N+1时刻的最优策略步骤三:利用无监督学习方法进一步学习防撞策略利用近端策略优化算法构建防撞决策模型,并在步骤二的基础上,对防撞决策模型进行训练;首先,将营运车辆的侧向防撞决策问题转换为一定奖励函数下的马尔科夫决策过程,描述为S,A,P,R;其中,S为状态空间,A为驾驶动作,P表示由于目标车辆运动不确定性而导致的状态转移概率,R为奖励函数;其次,对马尔科夫决策过程的基础参数进行定义,具体地:1建立状态空间首先,利用自车的运动状态信息、自车与周围交通参与者的相对运动状态信息构建状态空间: 式中,St表示t时刻的状态空间,px,py分别表示自车的横向位置和纵向位置,单位为米,vx,vy分别表示自车的横向速度和纵向速度,单位为米每秒,ax,ay分别表示自车的横向加速度和纵向加速度,单位为米每二次方秒,θs表示自车的航向角,单位为度;分别表示自车与周围第j个交通参与者的相对距离和相对速度,单位分别为米和米每秒;其中,j=1,2,3,4,5,6,分别表示前方的交通参与者、左前方的交通参与者、左后方的交通参与者、后方的交通参与者、右后方的交通参与者和右前方的交通参与者;考虑到实际交通场景中的交通参与者数量并不固定,当传感器观测到i个交通参与者数量时,状态空间的最后j-i行用零填充,其中,i小于j;2建立动作空间为了输出高级驾驶决策,将动作空间定义为离散的横向动作和纵向动作;At=[a1,a2,a3,a4,a5,a6]3式中,At表示t时刻的动作空间,a1,a2,a3分别表示左转、右转和直行,a4,a5,a6分别表示加速、减速和保持速度不变;3建立奖励函数为了定量评价防撞策略的优劣,建立考虑交通参与者类型对行车安全影响的防碰撞奖励函数: 式中,Rt表示t时刻的奖励函数,xmin_1,xmin_2表示侧向安全距离阈值,单位为米,xmin_1=2,xmin_2=2.5;表示自车与周围第j个交通参与者的相对距离,单位为米;此外,对造成侧向碰撞的决策施加负反馈,即当输出的决策策略导致侧向碰撞时,当前时刻获得的奖励值减去50;其次,对构建的防撞决策模型进行训练,具体包括以下几个子步骤:子步骤1:初始化策略参数θ0和值函数参数φ0;子步骤2:进行T个时间步长的循环,每一次循环包括子步骤2.1至子步骤2.5,具体地:子步骤2.1:在环境中运行策略πk=πθk,θk表示k时刻的策略网络参数;子步骤2.2:计算t时刻的最优奖励值子步骤2.3:基于当前值函数Vφk,计算优势函数的估计值子步骤2.4:利用下式进行策略更新: 式中,θk+1表示k+1时刻的策略网络参数,ε表示超参数,πθ表示参数为θ的策略网络输出值,T表示更新的时间步长,表示参数为θk的策略网络输出值,Dk表示数据集中的数据,该数据由k时刻输出驾驶策略和专家给出的动作组成,clip·表示截断函数,将截断在[1-ε,1+ε]中,τ表示决定软更新幅度的超参数,argmax·表示使目标函数具有最大值的变量,表示状态-动作对的优势值;子步骤2.5:利用下式进行值函数更新: 式中,φk+1表示k+1时刻的值函数参数,VφSt表示状态空间St下的值函数;最后,当防撞决策模型训练完成后,将自车的运动状态信息、自车与周围交通参与者的相对运动状态信息输入到防撞决策模型中,输出加减速、变道的驾驶建议,实现了有效、可靠的大型营运车辆侧向防撞驾驶决策。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:210096 江苏省南京市玄武区四牌楼2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。