首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于强化学习的分层式区域协调信号控制方法 

申请/专利权人:东南大学

申请日:2024-03-27

公开(公告)日:2024-06-28

公开(公告)号:CN118262519A

主分类号:G08G1/01

分类号:G08G1/01;G08G1/017;G08G1/048

优先权:

专利状态码:在审-公开

法律状态:2024.06.28#公开

摘要:一种基于强化学习的分层式区域协调信号控制方法,本发明涉及智能交通技术领域,所述控制方法包含以下步骤:确定路口终端的收集和计算周期,路口终端通过摄像头收集t1时刻距离路口X米的车辆数据和信号状态l,并计算得到车道的混合状态slane和路口的混合状态sintersection,其中车辆数据包括车辆位置xi和车辆速度vi,本发明的优点在于:通过摄像头收集的单车级数据进行合理的状态表示作为路口端决策的依据,调高了决策的科学性。通过区域层使用GCN预测全局交通状态,向区域端发生目标,进一步丰富路口决策信息内容。

主权项:1.一种基于强化学习的分层式区域协调信号控制方法,其特征在于,所述控制方法包含以下步骤:步骤一、确定路口终端的收集和计算周期,选取时间为5s、10s以及20s其中之一,路口终端通过摄像头收集t1时刻距离路口X米的车辆数据、计数信息和信号状态l,并计算得到车道的混合状态slane和路口的混合状态sintersection,其中车辆数据包括车辆位置xi和车辆速度vi,计数信息包括车辆总数ncar和停车总数nstop,路口的混合状态sintersection包括8个进口车道的车道的混合状态slane;步骤二、区域终端通过接收路口终端t1时刻的混合状态,生成区域交通的当前交通图G1A,H,其中A是交叉口的邻接关系矩阵,H是包含各路口的混合状态的混合交通状态矩阵,结合路网状态计算自邻接矩阵并预测1T时间后混合状态生成预测交通图G2和这个路口的信号持续时间L;步骤三、路口终端通过接收t1时刻的预测交通图G2中预测路口的混合状态sintersection_predict,利用路口端的强化学习控制器生成控制策略数据,并将交互策略存入经验池;步骤四、测算区域终端用于预测损失值,其中包括1T时间后的实际交通图G3和预测交通图G2之间的差距,以及预测信号的持续时间L和路口断相位保持不变的累计持续时间之间的差距;步骤五、采用路口端强化学习运用DQN算法,奖励设置保持和路口端混合状态的高度一致性;步骤六、基于路口的信号持续时间L,对车速进行合理的引导。

全文数据:

权利要求:

百度查询: 东南大学 一种基于强化学习的分层式区域协调信号控制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。