买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国民用航空总局第二研究所;民航成都电子技术有限责任公司
摘要:本发明涉及数字模型技术领域,具体而言,涉及一种基于仿真模型的机场特种车辆调度方法及系统,本发明通过将车队的行驶距离和成本最小化作为优化目标,建立了符合实际的特种车辆调度模型,并通过数字孪生获取的历史和实时数据,将特种车辆定义为智能体,使用多智能体强化学习算法进行离线训练和在线推理,通过数字孪生仿真模型对在线推理生成的调度方案进行验证评估以及指导算法改进策略,将最优方案发送给车队进行特种车辆服务。该方法不仅可以实现高效计算,还可以提高调度方案的健壮性。
主权项:1.一种基于仿真模型的机场特种车辆调度方法,其特征在于,包括:构建特种车辆调度模型,设定优化目标,并建立约束模型,所述优化目标包括车队的行驶路径和特种车辆的使用成本的最小化;建立数字孪生增强的机场特种车辆数字孪生仿真模型,所述数字孪生仿真模型包括物理空间、虚拟空间和调度决策空间,获取航班和特种车辆历史数据,通过特种车辆调度模型将历史数据生成训练数据集;通过深度强化学习算法和训练数据集对调度决策空间进行训练得到预训练模型;通过物理空间获取当前实时数据,将实时数据输入预训练模型得到车队调度方案,通过虚拟空间对调度方案进行仿真评估,得到评价指标,通过评价指标判断是否达到预期,若未达到预期,则修改数字孪生仿真模型的参数,重新进行训练;若达到预期,则输出当前车队调度方案;所述构建特种车辆调度模型,设定优化目标,并建立约束模型包括: 式中,为车队的行驶路径和特种车辆的使用成本的最小化,为特种车辆个数,为特种车辆总数量,为特种车辆访问机位时的时间戳集合,为花费总成本,为特种车辆的总成本,为服务机位顺序编号,为第次服务机位编号到机位编号的行驶里程,为惩罚系数,为第次服务机位编号允许的最晚到达时间,为特种车辆第次服务实际到达机位的时间戳,为第次服务机位编号允许的最早到达时间,为特种车辆违反时间窗的惩罚系数,为第一惩罚系数,为第二惩罚系数,为实际到达机位的时间,为允许最早到达机位时间,为允许最晚到达机位时间,为车队约束,为空间维度,为容量约束,为特种车辆的服务阶段,为特种车辆的容量,为航班需求,为特种车辆的最大容量;所述调度决策空间包括:将每个特种车辆在时间上的客户选择问题定义为,其中,代表当前所有特种车辆联合观察状态,表示采取的动作,表示状态转移概率,是经验池,用于存储在指定时间步动作信息,代表折扣因子,代表奖励函数,代表特种车辆的策略;当特种车辆完成当前服务时,且环境的全局时间步大于下一次客户允许开始服务时间时,特种车辆的状态发生转换,所述转换包括: 式中,为共享信息中的需求变化,为特种车辆当前容量,为特种车辆下次服务客户所处机位编号,为特种车辆所处机位的第个编号,为动作空间中计算出来下一次服务的机位编号,为动作空间,为下次服务的时间戳的计算,为特种车辆下次服务的时间戳,为特种车辆完成当前服务的时间步,为机位编号到机位编号的路程,为服务时间,为机位编号到仓库的距离,为回到仓库的休整时间,为下一次的特种车辆当前容量的计算,为下一次的特种车辆的当前容量,为特种车辆下个客户位置和其它客户位置的关系,为计算动作空间中数值1的索引,为到下一次服务机位的距离,为动作空间中计算出来的距离;还包括:获取特种车辆的确定性策略,将特种车辆的观察信息映射为一组动作的分布,并通过重参数化进行计算;得到每个特种车辆的目标为学习预期化最大收益的策略: 式中,为价值函数,为特种车辆的策略,为所有特种车辆按照自己策略的期望,为时刻的折扣因子,为时间步的即时奖励,为时间步的环境状态,为特种车辆1在时间步采取的动作,为特种车辆N在时间步采取的动作;利用策略梯度下降来更新策略: 式中,为策略相对于的梯度,为相对于的策略,为模型参数,为时间步的选择动作,为客户节点访问时间步,为折扣因子,为时间步的即时奖励,为时间步的状态,为时间步的选择动作;所述深度强化学习算法包括: 式中,为注意力权重,为双线性模型打分函数,为查询向量,为特种车辆的状态,为特种车辆的加权贡献,为特种车辆的注意力权重,为特种车辆的状态,为的嵌入编码,为共享矩阵的变换,为单层感知器,为非线性激活函数,为特种车辆的Q值函数定义,为动作,为特种车辆的状态,为自然数。
全文数据:
权利要求:
百度查询: 中国民用航空总局第二研究所 民航成都电子技术有限责任公司 一种基于仿真模型的机场特种车辆调度方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。