买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:安徽大学
摘要:本发明公开一种基于改进TD3算法的无人机自主导航方法,包括:设计改进TD3算法的状态空间、动作空间、奖励函数、策略网络、价值网络、成功经验池及失败经验池;初始化状态和临时经验池,策略网络收集数据添加到临时经验池,临时经验池数据溢出则将溢出数据添加到成功经验池;判断是否达到更新条件,达到更新条件,从成功经验池和失败经验池中按照比例随机采样数据,用采样数据更新价值网络和策略网络;未达到更新条件,判断无人机是否达到终止状态,达到成功的终止状态时,将临时经验池的数据全部放到成功经验池,若是失败的终止状态,将临时经验池的数据全部放到失败经验池。本发明提高了采样数据的质量,从而提升无人机自主导航的效率。
主权项:1.基于改进TD3算法的无人机自主导航方法,其特征在于,包括:S1、建立基于改进TD3算法的无人机路自主导航模型,将无人机自主导航问题描述为马尔科夫决策过程,设计具有两个策略网络和多个经验池的改进TD3算法:DAMEP-TD3算法;定义DAMEP-TD3算法的状态空间、动作空间、奖励、策略网络、价值网络、成功经验池及失败经验池;S2、初始化无人机的状态,定义临时经验池;S3、根据策略网络收集无人机与环境互动过程中获得的数据,并将数据添加到临时经验池中,临时经验池数据溢出则将溢出的数据添加到成功经验池,再进行更新条件的判断;临时经验池数据不溢出,则直接进行更新条件的判断;S4、判断是否达到更新条件:达到更新条件,则分别从成功经验池和失败经验池中按照比例随机采样,利用采样数据更新价值网络和策略网络;未达到更新条件,则进行终止状态的判断;S5、判断无人机是否达到终止状态:未达到终止状态,则重新进行步骤S3;达到终止状态,则根据奖励值判断是成功的终止状态还是失败的终止状态;判断为成功的终止状态,将临时经验池清空,其数据全部放到成功经验池,判断为失败的终止状态,将临时经验池清空,其数据全部放到失败经验池;S6、清空临时经验池后,重新回到步骤S2,重复步骤S2-S5,进行多次迭代,验证所述改进TD3算法整体模型的效果。
全文数据:
权利要求:
百度查询: 安徽大学 基于改进TD3算法的无人机自主导航方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。