买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明提供的融合城内车辆重定位的城际动态拼车调度优化方法及装置,涉及车辆调度技术领域。本发明通过获取城际网约车某条运营线路上的两城市的道路网络数据后,分别划分若干区域,并实时获取各区域内的往返乘客拼车出行数据;在每个重定位调度时刻,通过深度学习算法预测出乘客出行需求量,计算出空闲车辆数、供需平衡差和盈利路径总人数,构建双层优化模型;然后构建独立的智能体,并采用多智能体图深度Q学习网络算法进行训练学习;通过遍历每个调度时刻,判断是否达到重定位间隔,若达到,则进行乘客出行需求量预测、重定位决策与动态拼车调度;若否,则直接进行动态拼车调度。本发明能提高城际拼车的总利润,有效缓解车辆供需不平衡的问题。
主权项:1.一种融合城内车辆重定位的城际动态拼车调度优化方法,其特征在于,包括:S1,获取城际网约车某条运营线路上的城市A和城市B的道路网络数据后,分别划分若干区域,并实时获取各区域内的往返乘客拼车出行数据;S2,给定调度时刻集合和重定位调度时刻集合,在所述重定位调度时刻集合的每个重定位调度时刻,通过深度学习算法预测出未来一段时间内城市A和城市B各区域的乘客出行需求量;S3,根据预测的乘客出行需求量,分别计算城市A和城市B各区域的空闲车辆数、供需平衡差和盈利路径总人数;S4,根据计算出的空闲车辆数、供需差、盈利路径总人数与所述往返乘客拼车出行数据,构建双层优化模型;其中,所述双层优化模型包括上层模型与下层模型;所述上层模型以最大化所有调度时间点的利润的总和为目标;所述下层模型以最大化重定位后的潜在利润为目标;所述上层模型包含上层目标函数、上层决策变量与上层约束条件;其中,所述上层目标函数为: ; ;所述上层决策变量为: 表示0-1决策变量,若值为1,表示拼车请求由车辆服务;否则值为0;其中,;,为两城道路网络的所有点集合; 表示0-1决策变量,若当值为1,表示车辆从点到点;否则值为0;其中,;为乘客数据中的同行人数;其中,调度时间集合,t为每个调度时刻,共有个调度时间; 为调度时刻t的利润,即以拼车服务请求所带来的收益减去车辆行驶路径所产生的成本;为所有调度时间点的利润的总和; 为一组待匹配的请求,为一组已匹配的请求,为一组在道路网络上当前可用的车辆;为在调度时间时,所有点的集合; 表示单人票价,表示每公里距离成本;表示点之间的道路最短行驶时间,表示点之间的道路最短行驶距离;将中所有拼车请求的上车点和下车点集合设为;中所有拼车请求的上车点和下车点集合设为,点所匹配的车辆用表示;为所述乘客数据中的上车点、为所述乘客数据中的下车点;令,在调度时间时,所有点集合为: ;其中,为出发城市的出口点;为目的城市的入口点;为当前起点、为当前终点;为当前所在位置、为下一行程所在位置;所述下层模型包含下层目标函数、下层决策变量与下层约束条件;其中,所述下层目标函数的表达式为: ;其中,为重定位调度时间集合,为每个重定位调度时刻;为城市A的区域节点集合,为城市A的每个区域;为城市B的区域节点集合,b为城市B的每个区域;重定位后的潜在利润函数由三个因素组成:各区域的供需差绝对值的降低量、可匹配需求数的增长量及重定位的移动距离成本,将前两个因素乘以单人票价,得到潜在收益,并从中减去第三个因素的移动成本,从而得到重定位后的潜在利润;以城市A为例,城市A的函数的计算公式具体如下: ;其中,为区域a的供需差绝对值的降低量乘以单人票价得到的潜在收益;为区域a的可匹配需求数的增长量乘以单人票价得到的潜在收益;为区域a的重定位的移动距离成本;同理,得到城市B重定位后的潜在利润: ; 为区域b的供需差绝对值的降低量乘以单人票价得到的潜在收益;为区域b的可匹配需求数的增长量乘以单人票价得到的潜在收益;为区域b的重定位的移动距离成本;所述下层决策变量为: 表示0-1决策变量,若值为1,表示区域的空闲车辆从当前起点重定位调度至目标移动区域的道路网络质心点;否则值为0,; 表示0-1决策变量,若值为1,表示区域的空闲车辆从当前起点重定位调度至目标区域的道路网络质心点;否则值为0,;其中,为区域的空闲车辆集合;为区域的空闲车辆集合;城市A各区域供需差绝对值的降低量收益的计算公式如下: ;其中,为城市A的供需平衡差;为车辆的空位数;可匹配需求数的增长量收益的计算公式如下: ;其中,为区域的盈利路径总人数;为区域的盈利路径总人数;重定位的移动距离成本的计算公式如下: ;S5,对城市A和城市B中的每个区域分别构建独立的智能体;其中,所述智能体包括状态空间、动作空间和奖励函数;所述智能体的状态空间包括:区域内可调空闲车辆数、供需差、盈利路径总人数与移动成本;所述智能体的动作任务是将空闲车辆移动到适当的其他区域或者不移动,且将所有区域的编号作为智能体的动作空间;所述智能体的奖励函数从供需平衡、匹配路径可行性和移动成本三个方面设计而成;其中,构建城市A的智能体的步骤为:步骤一,在状态空间方面,设城市A区域的智能体表示为;智能体在重定位调度时刻的状态空间表示为;则,区域的状态表示为: ;其中,区域的可调空闲车辆数,等于该区域的空闲车辆集合的基数;则,任一区域的状态空间包含了所有区域的状态,可表示为,表示第|个区域的状态;步骤二,在动作空间方面,设城市A所有区域的编号集合为: ,其中,表示城市A所有区域的节点总数;智能体的动作空间表示为: ; 的值表示为从当前区域移动到箭头所指编号的区域;若所指编号的区域和当前区域是同一个区域,表示不移动;步骤三,在奖励函数方面,智能体的奖励函数与供需平衡奖励和匹配路径可行性奖励呈正相关关系,与移动成本奖励呈负相关关系,表达式如下: ;其中,表示在时刻智能体的奖励为智能体的供需平衡奖励;为智能体的匹配路径可行性奖励;为智能体的移动成本奖励;所述供需平衡奖励指:每次重定位后,计算当前区域和目标移动区域的供需差的绝对值降低量,以评估重定位后两个区域之间的供需情况;再根据降低量乘以单位票价,得到供需平衡奖励,具体计算公式如下: ; ; ;其中,为当前区域的供需差的绝对值降低量,为目标移动区域的供需差的绝对值降低量,降低量的单位为人数;为单人票价;所述匹配路径可行性奖励指计算移动到新区域后的区域盈利路径总人数的变化值,以有效指导智能体学习重定位策略;再根据变化值乘以单位票价,得到匹配路径可行性奖励,其计算公式为: ;所述移动成本奖励指重定位的目标移动区域相对于当前区域,行驶至城际出口点的路线成本,其计算公式如下: ; ;其中,表示从点到点的每公里距离成本;K为目标移动区域离城际出口点的行程与当前区域离城际出口点的行程比;同理,构建城市B的智能体;S6,采用多智能体图深度Q学习网络算法对每个区域的智能体进行差异性学习,以捕获各区域的空间关系,得到近似最优Q值函数;根据所述近似最优Q值函数,得到空闲车辆的重定位决策;S7,遍历所述调度时刻集合的每个调度时刻,判断当前时刻是否达到重定位调度时刻集合的重定位调度间隔;若达到,则预测得到乘客出行需求量,根据对应智能体得到空闲车辆的重定位决策后,使用多轮二分图匹配方法进行城际动态拼车调度;否则,直接使用多轮二分图匹配算法进行动态拼车调度,迭代直到完成所有调度时刻,得到融合城内车辆重定位的城际动态拼车调度优化方案。
全文数据:
权利要求:
百度查询: 华侨大学 厦门金龙联合汽车工业有限公司 融合城内车辆重定位的城际动态拼车调度优化方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。