恭喜北京邮电大学左兴权获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京邮电大学申请的专利一种基于强化学习的公交车辆排班方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114819617B 。
龙图腾网通过国家知识产权局官网在2025-03-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210431112.7,技术领域涉及:G06Q10/0631;该发明授权一种基于强化学习的公交车辆排班方法是由左兴权;刘英卓;黄海;艾冠群设计研发完成,并于2022-04-22向国家知识产权局提交的专利申请。
本一种基于强化学习的公交车辆排班方法在说明书摘要公布了:本发明公开了一种基于强化学习的公交车辆排班方法,属于公交车辆排班领域,具体为:首先、将某条公交线路的车辆排班问题建模为马尔可夫决策过程,其中包括状态,动作、奖励三个要素。将发车时刻表中每个时刻点作为一个决策点,利用强化学习智能体选取当前可用车辆从该时刻点发出,从而覆盖该时刻点。构建公交车辆排班的仿真环境,通过智能体与仿真环境的交互,利用强化学习算法获得智能体的最优策略。然后,利用智能体对发车时刻表中每个时刻点按时间顺序逐点决策,由此得到公交车排班方案。本发明提供了一种公交车辆的在线调度方法,在发生交通拥堵,交通事故等不确定事件的情况下,能保证全部覆盖发车时刻表,且所用车辆数目少。
本发明授权一种基于强化学习的公交车辆排班方法在权利要求书中公布了:1.一种基于强化学习的公交车辆排班方法,其特征在于:1对于给定的公交线路的发车时刻表,利用强化学习进行车辆排班;将公交车辆排班问题建模为马尔可夫决策过程,发车时刻表中每个时刻点作为决策点;对于每个时刻点,由智能体根据控制点中车辆的信息,选取一个车辆在该时刻点从该控制点发出,从而覆盖该时刻点;利用智能体对发车时刻表中的所有时刻点进行逐点决策,使得时刻表中每个时刻都有车辆发出,最终形成车辆排班方案;2车辆排班问题的马尔可夫决策过程模型包括状态、动作和奖励;状态为智能体的输入,包括:当前时刻点所有可选车辆的信息;动作为智能体的输出,即:选取控制点中的某一车辆在该时刻点发出;奖励包括:车辆数目和车辆等待时间;所述的奖励,采用主线奖励和支线奖励相结合的奖励方法,支线奖励在每步决策后给出,主线奖励在决策的最后一步给出;主线奖励包括:1.未使用车辆数目的奖励Nu;2.车辆运行时间方差的惩罚σh;3.具有奇数行程的车辆数目惩罚No;4.短班车数目的惩罚Ns;5.执行满行程的车辆数目奖励Nf;主线奖励为这五项的加权和:rm=w1×Nu-w2×σh-w3×No-w4×Ns+w5×Nf其中w1、w2、w3、w4、w5分别正实数权值;支线奖励包括:1.所选车是否为新车rn;2.所选车的空闲时间在所有可选车辆中的排名rk;3.车辆包含的行程数为偶数,则奖励ro;4.所选车是否为长班车rl;5.存在可用车辆时仍选择发新车,则惩罚re;6.车辆执行完行程后的等待时间rw;支线奖励为这六项的加权和:rs=-w‘1×rn-w‘2×rk+w‘3×ro+w‘4×rl-w‘5×re-w‘6×rw其中w‘1、w‘2、w‘3、w‘4、w‘5、w‘6为正实数权值;3构建公交车辆排班仿真环境,智能体通过与仿真环境的交互,借助强化学习算法来获取最优策略。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京邮电大学,其通讯地址为:100876 北京市海淀区西土城路10号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。