买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:同济大学
摘要:本发明涉及一种基于安全课程强化学习的自动驾驶决策方法、系统及介质,其中方法包括以下步骤:感知周车和本车信息,作为环境信息;采用课程强化学习框架将自动驾驶任务划分为安全阶段和性能阶段,其中,安全阶段基于安全阶段的奖励函数进行安全智能体训练;在性能阶段部署安全智能体和性能智能体,固定安全阶段训练完成的安全智能体,基于性能阶段的奖励函数进行性能智能体训练,并使用切换函数实现安全智能体和性能智能体之间的切换;智能体与环境进行交互,根据损失函数更新网络参数,基于性能阶段网络输出的安全动作对车辆进行控制,实现自动驾驶安全决策。与现有技术相比,本发明具有训练高效、交互安全等优点。
主权项:1.一种基于安全课程强化学习的自动驾驶决策方法,其特征在于,该方法包括以下步骤:感知周车和本车信息,作为环境信息;采用课程强化学习框架将自动驾驶任务划分为安全阶段和性能阶段,其中,安全阶段基于安全阶段的奖励函数进行安全智能体训练;在性能阶段部署安全智能体和性能智能体,固定安全阶段训练完成的安全智能体,基于性能阶段的奖励函数进行性能智能体训练,并使用切换函数实现安全智能体和性能智能体之间的切换;智能体与环境进行交互,分别根据安全阶段的损失函数和性能阶段的损失函数更新各自的网络参数,基于性能阶段网络输出的安全动作对车辆进行控制,实现自动驾驶安全决策。
全文数据:
权利要求:
百度查询: 同济大学 基于安全课程强化学习的自动驾驶决策方法、系统及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。