首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

训练方法、发车时刻确定方法、设备和介质 

申请/专利权人:深圳云天励飞技术股份有限公司

申请日:2022-12-30

公开(公告)日:2024-07-05

公开(公告)号:CN118296924A

主分类号:G06F30/27

分类号:G06F30/27;G06Q50/40;G06Q10/047;G06Q10/0631;G06F17/18;G06N3/04;G06N3/092

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.07.23#实质审查的生效;2024.07.05#公开

摘要:本申请涉及人工智能技术领域,公开了一种训练方法、发车时刻确定方法、设备和介质,用得到发车时刻最优解,减少发车成本。方法部分包括:确定强化学习模型的状态空间、动作空间和奖励函数,所述奖励函数包含智能体每一次发车所带来的新增等车时长参数和新增里程数参数,所述新增等车时长参数和新增里程数参数分别通过相应的动态权重进行控制;基于所述状态空间、动作空间、奖励函数和交通仿真系统的环境信息,确定所述强化学习模型的状态转移过程;基于所述状态转移过程,使用强化学习方法对所述强化学习模型进行训练,以获取符合预设条件的所述强化学习模型的目标发车策略信息,所述目标发车策略信息表征了每个决策时刻点下的发车动作。

主权项:1.一种发车时刻优化策略的训练方法,其特征在于,所述方法包括:确定强化学习模型的状态空间、动作空间和奖励函数,所述奖励函数包含智能体每一次发车所带来的新增等车时长参数和新增里程数参数,所述新增等车时长参数和新增里程数参数分别通过相应的动态权重进行控制;基于所述状态空间、动作空间、奖励函数和交通仿真系统的环境信息,确定所述强化学习模型的状态转移过程;基于所述状态转移过程,使用强化学习方法对所述强化学习模型进行训练,以获取符合预设条件的所述强化学习模型的目标发车策略信息,所述目标发车策略信息表征了每个决策时刻点下的发车动作。

全文数据:

权利要求:

百度查询: 深圳云天励飞技术股份有限公司 训练方法、发车时刻确定方法、设备和介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。