恭喜南京航空航天大学朱琨获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜南京航空航天大学申请的专利一种充电无人机为任务无人机空中充电的调度方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114548663B 。
龙图腾网通过国家知识产权局官网在2025-03-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210019884.X,技术领域涉及:G06Q10/0631;该发明授权一种充电无人机为任务无人机空中充电的调度方法是由朱琨;杨佳设计研发完成,并于2022-01-10向国家知识产权局提交的专利申请。
本一种充电无人机为任务无人机空中充电的调度方法在说明书摘要公布了:本发明公开了一种充电无人机为任务无人机空中充电的调度方法,用于调度充电无人机为正在空中执行任务的任务无人机进行充电。该方法根据任务无人机的充电需求确定远程充电或近场充电方式,然后根据充电无人机的参与数量进行分类建模计算,包括建立单个充电无人机进行充电调度问题的模型和建立多个充电无人机进行充电调度问题的模型进行求解;最后基于深度强化学习或多智能体强化学习的算法优化充电无人机的充电调度策略,充电无人机根据优化的策略和当前环境的状态以进行决策,根据充电调度指令完成任务无人机的充电。本发明实现了任务无人机任务完成时间最短,对任务无人机的公平充电和充电无人机的充电调度策略优化。
本发明授权一种充电无人机为任务无人机空中充电的调度方法在权利要求书中公布了:1.一种充电无人机为任务无人机空中充电的调度方法,该方法用于调度充电无人机为执行任务中的任务无人机进行充电,其特征在于:所述调度方法包括如下步骤:1根据任务无人机的充电需求信息确定充电方式,充电需求信息包括充电无人机执行任务的环境障碍、地点、动作及飞行数据,充电方式包括近场充电和远场充电,近场充电中充电无人机基于任务无人机搭载的无线充电平台进行电感耦合或磁共振耦合无线充电,远场充电是由充电无人机通过RF射频或激光实现能量转化充电;该步骤对于存在有n个任务无人机执行任务时,则表示为M={Mi|t=1,2,...,n},任务无人机执行任务的环境中障碍物表示为B={Bi|i=1,2,...,n},无人机的执行任务的地点表示为P={Pi|i=1,2,...,n},任务无人机Mi在t时刻的动作为动作包括悬停状态或飞行状态,其飞行过程中飞行方向为飞行速度为v;执行充电任务的充电无人机表示为C={Ci|i=1,2,...,m},充电无人机Ci在t时刻的动作为动作包括悬停状态或飞行状态,其飞行过程中飞行方向为飞行速度为v;2根据任务无人机的充电需求和任务类型建立单个充电无人机进行充电调度间题的模型,并基于DDPG算法优化单个充电无人机的充电调度策略;单个充电无人机给任务无人机的充电决策过程可建模成马尔可夫决策过程,其模型表述为M=S,A,P,R,γ,其表达式与参数含义如下:S表示环境的状态空间,所述状态空间为充电无人机根据观察到的状态采取行动集合,为无限集,包括充电任务过程中所有可能的状态,时刻t的状态空间表示为St,每个状态由充电无人机当前的位置坐标、任务无人机的剩余能量、充电无人机累积被能量以及任务无人机的工作状态组成,包括充电状态和移动状态;A表示任务无人机的动作空间,包含充电无人机在执行充电任务过程中可能采取的所有动作,充电无人机在时刻t采取的行动由表示,充电无人机的每个动作都包含移动方向和充电目标,移动方向的动作空间是连续的,充电目标是充电无人机正在或者将来提供充电的对象;P表示状态转移概率,所述的状态转移概率定义为在时刻t,给定充电无人机在当前状态St采取特定动作At,充电无人机到达下一个可能状态St+1的概率,P:St×At→St+1,且充电无人机做出的不同动作会以不同方式改变充电无人机的状态;R表示奖励函数,奖励函数St×At→Rt+1,计算的是充电执行动作At后它的状态从St转换为St+1所获得的奖励值;γ表示折扣因子,γ∈[0,1],决定未来奖励对当前即时奖励的影响程度;该步骤中,对于单个充电无人机进行充电调度问题的模型,当任务无人机完成任务并返回出发点时表示任务完成,任务无人机Mi的任务完成时间为Ti,Ti=Tmi+Tci+Twi,其中Tmi表示移动所花费的总时间,Tci是执行任务所花费的时间,Twi表示任务无人机等待充电无人机充电所花费的总时间;充电无人机采取行动At后它的状态从St转换为St+1所获得的奖励值的计算方式包括如下过程:根据任务无人机预先规划的行进路径和任务,设定任务无人机可以被充电无人机按时充电则持续保持工作,定义奖励函数使充电无人机选择合理的充电目标和移动方向;充电无人机在t时刻的执行动作获得的奖励值设计如下:rt=Rct+Rmt-Pl-PbRct表示在t时段内成功给任务无人机充电所获得的奖励,定义如下: 如果充电无人机未给任务无人机充电,则奖励为零,若进行了充电,将产生正奖励;如果充电无人机在大于Emi的情况下给任务无人机Mi充电,则奖励Rct为零;Rct中的Et是表示t时刻的充电量,Rc是一个正偏移量,用于鼓励充电无人机花费更多时间用于充电,ft表示充电无人机对每个任务无人机充电的公平性; 为任务无人机在t时刻的剩余能量,Em={Em1,Em2...Emn}表示任务无人机完成任务所需的估计最小充电量的集合,表示任务无人机从时刻1到t的累积充电量,公平性因子ft由Jain公平指数计算,其计算表达式如下:ft=wffct+1-wffrt wf为权重值,Rct中的Rmt用于鼓励充电无人机朝向任务无人机的位置移动;因Rmt与目标任务无人机的剩余能量水平呈负相关,约定剩余电量较少的任务无人机具有高优先级充电,wd和we为负值;充电无人机与任务无人机之间的相对距离变小时或者充电目标的电量越小,Rmt越大,以此来引导充电无人机靠近任务无人机,其中Rmt的计算公式如下: 其中Dit是充电无人机和任务无人机之间的欧几里得距离Mi,而是Mi在t时刻的剩余能量,当充电无人机为任务无人机充电时,Rmt设置为零;Pl表示如果充电无人机未能将任何任务无人机的剩余能量保持在安全阈值Eth以上,则对充电无人机的惩罚,Eat为任务无人机平均剩余电量,p为固定正值,其表达式如下: Pb是充电无人机飞出边界或撞到环境中的障碍时对充电无人机的惩罚;3根据任务无人机的充电需求和任务类型建立多个充电无人机进行充电调度问题的模型,并基于MADDPG算法优化多个充电无人机的充电调度策略;该步骤在建立多个充电无人机进行充电调度问题的模型中,对于同时调度多个充电无人机的过程建模成一个马尔可夫博弈M=S,A,T,R,O,γ;S表示状态空间,时刻t的状态是St,包括了所有无人机在环境中的状态;A表示动作空间,多个充电无人机在时刻t采取的行动由表示;T表示状态转移函数,状态转移函数T:环境中,所有的充电无人机同时采取动作,对环境产生影响;R表示奖励函数,奖励函数计算的是充电无人机Ci执行动作后它的状态从转换为所获得的奖励值;O表示观察集合:观察是指充电无人机从自己的角度对环境的感知,充电无人机根据自己对环境的观察进行决策,表示所有充电无人机在时间t的观测集合;γ为折扣因子,γ∈[0,1],决定未来奖励对当前即时奖励的影响程度;该步骤中,对于多个充电无人机进行充电调度问题的模型中,充电无人机Ci在t时刻的奖励设计如下: 定义如下: ft表示公平性因子; 的计算公式如下: 其中Di,jt是充电无人机Ci和任务无人机Mj之间的欧几里得距离,是任务无人机Mj在时间t的剩余电量,wd和we是调整的负系数;Pl表示如果充电无人机未能将任何任务无人机的剩余能量保持在安全阈值Eth以上,则对充电无人机的惩罚;Pb是充电无人机飞出边界或撞到环境中的障碍时的惩罚;4以任务无人机完成任务的时间最短为目标,基于深度强化学习或多智能体强化学习优化充电无人机的充电调度策略,充电无人机向通过训练得到的actor网络输入当前状态进行决策,根据actor网络输出的充电调度指令完成对任务无人机的充电。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京航空航天大学,其通讯地址为:210016 江苏省南京市秦淮区御道街29号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。