恭喜浙江中控信息产业股份有限公司周俊杰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜浙江中控信息产业股份有限公司申请的专利一种基于模仿学习的车辆轨迹优化方法及相关装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119252066B 。
龙图腾网通过国家知识产权局官网在2025-03-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411780013.5,技术领域涉及:G08G1/0968;该发明授权一种基于模仿学习的车辆轨迹优化方法及相关装置是由周俊杰;吴劲峰;吴文浩;虞霄璐;陈瑞生设计研发完成,并于2024-12-05向国家知识产权局提交的专利申请。
本一种基于模仿学习的车辆轨迹优化方法及相关装置在说明书摘要公布了:本申请公开了一种基于模仿学习的车辆轨迹优化方法及相关装置,该方法包括:获得目标车辆的初始轨迹数据;确定目标车辆的目标流向;基于初始轨迹数据,从目标流向对应的至少一个车道中筛选目标车道;如果初始轨迹数据满足修正条件,从路口的配置信息中提取目标车道的车道信息,并基于初始轨迹数据,获得目标车辆及其周围车辆的当前位置信息和当前运动信息;将目标车辆及其周围车辆的当前位置信息、当前运动信息及目标车道的车道信息输入至生成对抗模仿学习模型,得到生成对抗模仿学习模型确定的目标轨迹数据;基于目标轨迹数据,对初始轨迹数据进行修正。
本发明授权一种基于模仿学习的车辆轨迹优化方法及相关装置在权利要求书中公布了:1.一种基于模仿学习的车辆轨迹优化方法,其特征在于,包括:获得目标车辆的初始轨迹数据;确定所述目标车辆的目标流向;基于所述初始轨迹数据,从所述目标流向对应的至少一个车道中筛选目标车道;如果所述初始轨迹数据满足修正条件,从路口的配置信息中提取所述目标车道的车道信息,并基于所述初始轨迹数据,获得所述目标车辆及其周围车辆的当前位置信息和当前运动信息;将所述目标车辆及其周围车辆的当前位置信息、当前运动信息及所述目标车道的车道信息输入至生成对抗模仿学习模型,得到所述生成对抗模仿学习模型确定的目标轨迹数据;所述生成对抗模仿学习模型基于路口的实际车辆行驶轨迹训练得到,所述生成对抗模仿学习模型用于模仿专家策略,生成与实际的车辆行为相似的动作参数,得到目标轨迹数据;所述生成对抗模仿学习模型基于对抗网络训练得到,所述对抗网络包括生成器和评判器;所述生成对抗模仿学习模型基于所述对抗网络进行训练的过程,包括:获取路口的车辆行驶轨迹,并基于所述路口的车辆行驶轨迹确定专家的状态动作对;在当前时刻,按照课程分布集的设定采样出个车辆,作为多个样本车辆;获取所述多个样本车辆中各所述样本车辆在当前位置的样本信息;所述样本信息包括:所述样本车辆在当前位置的位置信息和运动信息及其周围样本车辆的位置信息和运动信息及目标样本车道的车道信息;根据所述生成器的当前策略对各样本车辆对应的样本信息进行处理,生成各所述样本车辆的轨迹;确定各所述样本车辆的轨迹对应的惩罚值;基于所述评判器为各所述样本车辆的轨迹中的每个状态动作对进行评分,生成各所述样本车辆的奖励值;所述奖励值通过以下方式确定得到: 其中,表示评判器在参数下根据状态动作对得出的值,表示所述样本车辆的轨迹对应的惩罚值;保持所述评判器的参数不变,基于信赖域优化方法更新所述生成器的策略参数;基于信赖域优化方法更新所述生成器的策略参数,包括:对以下约束优化问题进行求解: ;其中,表示策略的参数;表示期望;表示在时刻采取的当前策略,其根据旧参数定义的;表示新策略;表示当前策略在时刻下在观察条件下采取动作的概率;表示新策略在时刻下在观察条件下采取动作的概率;表示当前策略在观察条件下采取动作的概率分布;表示新策略在观察条件下采取动作的概率分布;表示和之间的KLKullback-Leibler散度;表示步长参数,用于控制每次优化步骤中策略的最大变化量;表示优势函数,用于衡量观察条件下采取动作的动作价值期望与观测器估计的状态价值期望之间的差异程度;动作表示所述样本车辆根据策略采取的行为;所述优势函数通过以下广义优势估计方法进行估计得到:其中,表示折扣率;是介于0和1之间的参数,用于平衡TDTemporalDifference误差的权重;表示评判器确定的奖励值;和分别表示在时刻和时刻的状态价值期望;保持所述生成器的策略参数不变,基于所述专家的状态动作对和所述生成器的新策略生成的状态动作对,更新所述评判器的评判参数;所述评判器的评判参数通过以下目标函数进行更新:其中,表示专家策略,表示所述新策略,表示在执行策略时状态动作对被访问到的概率;表示在策略下时间处于状态的概率;表示基于当前策略在状态下采取动作的概率;表示在执行策略时状态动作对被访问到的概率;表示在策略下时间处于状态的概率;表示基于专家策略在状态下采取动作的概率;是的简化表达,表示评判器在参数下根据状态动作对得出的值;基于所述目标轨迹数据,对所述初始轨迹数据进行修正。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江中控信息产业股份有限公司,其通讯地址为:310051 浙江省杭州市滨江区滨康路352号2号楼23-25层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。