一种基于合作竞争博弈的列车运行实时调整方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：北京交通大学

摘要：本发明涉及一种基于合作竞争博弈的列车运行实时调整方法，方法包括：基于指定线路的线路静态数据、初始时刻的动态数据；约束条件，建立训练目标网络过程中的即时奖励函数和延时奖励函数；即时奖励函数是在各列车未到达终点站时基于竞争博弈策略和列车自身的延误时间获得的；延时奖励函数是各列车到达终点站后基于合作博弈策略和所有列车总的延误时间获得的；训练更新的策略网络，并实时获取策略网络的损失函数；在损失函数和奖励函数满足收敛条件时，获得训练后的策略网络，用于实现对列车运行图的实时调整。上述方法使用多列车博弈深度强化学习不断与环境进行学习和交互，解决了复杂多变的列车运行环境造成建模难的问题。

主权项：1.一种基于合作竞争博弈的列车运行实时调整方法，其特征在于，包括：S10、获取指定线路的线路静态数据和与指定线路关联的所有列车初始时刻的动态数据；S20、基于预先定义的约束条件、指定线路内各列车初始时刻状态，建立训练策略网络过程中的即时奖励函数和延时奖励函数；所述即时奖励函数是在各列车未到达终点站时基于竞争博弈策略和列车自身的延误时间获得的；所述延时奖励函数是各列车到达终点站后基于合作博弈策略和所有列车总的延误时间获得的；S30、所有列车未到达终点站时，基于列车和强化学习环境进行交互的随机性和纳什均衡策略，判断是否满足预先定义的约束条件及即时奖励函数满足的第一条件，来选择列车动作，更新列车状态，获取更新的策略网络；S40、所有列车到达终点站之后，根据合作博弈策略的延时奖励函数，训练更新的策略网络，并实时获取策略网络的损失函数；在损失函数和奖励函数满足收敛条件时，获得训练后的策略网络，用于实现对列车运行图进行实时调整。

全文数据：

权利要求：

百度查询：北京交通大学一种基于合作竞争博弈的列车运行实时调整方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种近根施肥的玉米专用肥料及其制备方法

下一篇：提升料理机

相关技术

一种近根施肥的玉米专用肥料及其制备方法

提升料理机

一种曲面光波导及其制备方法

一种融合多种加密的超级U盘安全登录互联网云盘方法

一种套筒式环形阴极开放式空冷燃料电池堆结构

一种多车型前悬拧紧机构自动切换机构

一种防爆型两位三通空气电磁阀

灵芝谷蜂蜜醋

管体、内窥镜及装配方法、约束结构的成型方法、治具

伽玛参考电压发生电路、伽玛参考电压发生方法及芯片

一种毛刷滚筒及配置该毛刷滚筒的洗地机

基于分形理论评定表面改性对材料微观组织影响的方法

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于合作竞争博弈的列车运行实时调整方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务