首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种无人车目标搜索方法、装置、介质及产品 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:上海大学

摘要:本发明公开一种无人车目标搜索方法、装置、介质及产品,涉及强化学习和多任务学习技术领域,根据功能将无人车目标搜索任务分解为若干个基础任务;构建交互式仿真环境,获取观测数据并转化为无人车观测特征向量,预测当前正在执行的任务;将观测特征向量输入到门控循环单元网络中,获得观测时序特征向量;将观测时序特征向量输入至每个策略网络中,得到一组动作;将任务预测结果与动作做内积,得到最佳动作并执行,获取观测数据、环境奖励和任务完成状态,计算损失并更新网络参数。本发明使无人车在基础任务中进行联合训练,学习到可重用的策略表示,跳过复杂目标任务的从零开始学习过程,从而提高强化学习算法在复杂控制和决策任务上的性能。

主权项:1.一种无人车目标搜索方法,其特征在于,所述方法包括:获取无人车目标搜索任务;根据功能将所述无人车目标搜索任务分解为若干个基础任务;为每个基础任务构建交互式仿真环境;所述交互式仿真环境支持无人车执行决策动作以及接收相应的观测数据反馈;从所述交互式仿真环境中获取图像和雷达观测数据,并将所述图像和雷达观测数据转化为特征向量,得到无人车观测特征向量;利用任务预测网络根据所述无人车观测特征向量预测当前正在执行的任务,得到任务预测结果;将所述无人车观测特征向量输入到门控循环单元网络中,获得观测时序特征向量;利用多层感知器分别学习每个基础任务,得到若干个策略网络;将所述观测时序特征向量输入至每个策略网络中,得到一组动作;将所述任务预测结果与所述动作做内积,得到当前最佳动作;在所述交互式仿真环境中执行所述当前最佳动作,并获取观测数据、环境奖励和任务完成状态;计算策略网络和任务预测网络的损失,并更新网络参数,直至所述无人车完成所有基础任务。

全文数据:

权利要求:

百度查询: 上海大学 一种无人车目标搜索方法、装置、介质及产品

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。