一种基于混合专家经验回放的星群协同任务规划方法

导航：龙图腾网> 最新专利技术> 一种基于混合专家经验回放的星群协同任务规划方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：天津大学

摘要：本发明公开了一种基于混合专家经验回放的星群协同任务规划方法，涉及强化学习、卫星调度和多智能体技术领域，包括以下步骤：S1：建立面向星座紧急任务规划的优化模型；S2：建立面向星座任务规划的马尔科夫决策模型，设计基于混合专家经验回放的深度Q‑Learning任务规划算法；S3：在线决策，利用训练好的网络进行实时任务规划。本发明采用上述的一种基于混合专家经验回放的星群协同任务规划方法，考虑用户需求、唯一性观测和星上观测资源的影响，以任务完成率、任务延迟时间及星上资源均衡度为指标，建立了面向对地紧急观测的决策模型，利用专家经验数据，设计基于专家经验的深度Q‑Learning星座任务规划算法，获得最优在线任务规划策略，规划卫星对目标的观测窗口。

主权项：1.一种基于混合专家经验回放的星群协同任务规划方法，其特征在于：包括以下步骤：S1：建立面向星座紧急任务规划的优化模型；在步骤S1中，星座紧急任务规划过程中有三种约束条件与综合收益目标，具体包括用户需求约束、唯一性观测约束和存储空间容量约束；用户需求约束：；式中，表示任务的任务需求到达规划中心的时刻，表示为任务分配的时间窗口的开始执行时刻；唯一性观测约束：；式中，i,j是两个相邻的分配给卫星s的任务，其观测开始和结束时刻分别为和，且；存储空间约束：；式中，表示卫星执行任务前卫星的剩余存贮空间，表示卫星完成任务需要占用的星上存储空间；目标函数为：；其中，代表系统对第个观测任务的决策，是决策过程中采取的决策策略，是第个观测任务的综合观测收益，分别代表任务完成率和剩余存储方差，分别代表任务完成率、延迟时间、剩余资源均衡的收益权重；S2：建立面向星座任务规划的马尔科夫决策模型，设计基于混合专家经验回放的深度Q-Learning任务规划算法；在步骤S2中，建立面向对地观测任务的马尔科夫决策模型，具体步骤如下：S2A：建立状态集S，将观测任务的到达时刻，观测任务的优先级，卫星与目标的距离、卫星与目标相对运动、卫星可观测时间窗口以及星群中各个卫星的空闲存储空间记为状态s，；式中，表示星群中包含的卫星总数，分别表示目标与卫星的距离以及相对运动关系，表示对目标的可视时间窗口，表示所有卫星的剩余存储容量；S2B：建立动作集A，规划决策中心为观测任务分配的可视时间窗口种类作为动作，，动作集A表示为：；S2C：计算立即收益值，；其中，为执行任务获得的任务收益；S2D：表示未来收益值相对于当前收益值的重要程度，；，只考虑当前收益不考虑未来收益；，表示将未来收益和当前收益同等重要；在步骤S2中，基于混合专家经验回放的深度Q-Learning任务规划算法设计，包括以下步骤：S21：建立规划网络与混合专家经验数据库；基于深度Q-Learning任务规划网络主要包括当前值网络与目标值网络，其中目标值网络与当前值网络的网络结构与初始参数完全相同，当前值网络由全连接神经网络组成，神经网络包括1个输入层，2个隐藏层和1个输出层，输入节点数为所有卫星的状态集组合后的维度，输出为64维，分别对应星座32个卫星的2个可行时间窗口获得的期望累计收益；S22：基于混合专家经验回放的深度Q-Learning任务规划网络参数更新；当前值网络与目标值网络分别用Q-eval网络和Q-target网络表示，参数分别为，采用Adam优化器对当前值网络进行优化，基于Bellman方程构建损失函数如下：；式中，是分别是自身经验回放池与专家经验回放池，表示当前状态，表示立即奖励，表示动作，表示下一步状态数据，表示目标值网络累计收益权值，表示当前值网络累计收益权值；S3：在线决策。

全文数据：

权利要求：

百度查询：天津大学一种基于混合专家经验回放的星群协同任务规划方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：降噪构件和具有降噪构件的用于制动系统的电磁阀

下一篇：激光线光源检测方法、系统及计算机可读存储装置

相关技术

降噪构件和具有降噪构件的用于制动系统的电磁阀

激光线光源检测方法、系统及计算机可读存储装置

增透膜、光学透镜及光纤激光设备

一种波纹状纸托折叠装置

卡接式注射器固定装置

一种可调的上料装置

一种新型卷边手推车塑料车斗

光隔离单元和共轴收发模块及激光雷达

一种显示面板及显示装置

一种基于统计-动力相结合的传染病预测方法及系统

使用双像素阵列的像素传感器

晶硅材料表面处理生产及检测装置

星群相关技术

一种用于诱导太阳长棘海星群体聚集的信息物质缓释剂_海南大学_202410678541.3

一种分布式星群协同超稀疏阵列设计方法_中国人民解放军军事科学院系统工程研究院_202410388426.2

大规模星群构型控制方法、系统、存储介质及电子设备_中国科学院空间应用工程与技术中心_202111560274.2

星群分组方法、装置、设备、介质和程序产品_中国科学院空天信息创新研究院_202410705128.1

一种用于星座星群辐射交叉定标筛选有效连接点的方法_西安电子科技大学_202410633526.7

一种面向群用户的星群信息星端协同应用服务方法及系统_北京市遥感信息研究所_202410348416.6

针对星群的任务规划方法、电子设备及存储介质_航天恒星科技有限公司_202410656539.6

基于任务链的遥感星群复杂任务调度方法及系统_合肥工业大学_202310487314.8

一种基于Transformer的星群遥感图像场景智能识别方法_中国人民解放军军事科学院国防科技创新研究院_202410905292.7

一种基于兰伯特转移的卫星群在轨加注任务规划方法_北京航空航天大学_202410424447.5

回放相关技术

爬虫数据回放验证方法、装置及电子设备_南京冰鉴信息科技有限公司_202410353990.0

内容分发方法、图像捕获和处理系统、回放系统、操作回放系统的方法及计算机可读介质_内维尔明德资本有限责任公司_202080046243.2

一种视频数据的存储、视频回放方法、装置及其设备_杭州海康威视系统技术有限公司_202410841297.8

多类型飞参数据分布式回放控制方法_陕西千山航空电子有限责任公司_202410721849.1

一种基于视频联网共享的视频预览回放系统_深圳市佰慧智能科技有限公司_202111456373.6

车辆信息录制回放方法、装置、计算机设备及存储介质_镁佳(北京)科技有限公司_202410070627.8

一种热连轧过程的实时数据回放方法及系统_北京科技大学_202311101190.1

一种多类型数据同步回放展示方法与装置_北京图安世纪科技股份有限公司_202111190744.0

基于RTSP协议的飞行数据采集回放方法、系统、设备及介质_陕西千山航空电子有限责任公司_202410721810.X

基于电流回放的电控悬架整车台架耐久测试方法及系统_中国汽车工程研究院股份有限公司_202410632939.3

协同相关技术

协同的行车影像收集方法及系统_神达数位股份有限公司_202010553073.9

多人协同的光学监测任务数字孪生系统_中国科学院长春光学精密机械与物理研究所_202410721564.8

一种灵芝多菌种协同发酵方法_杭州玥洋生物科技有限公司_202410824524.6

一种云边协同数据采集处理装置_阿斯通(山东)开关有限公司_202420047520.7

基于信息流的资源冲突协同方法_重庆大学_202410729207.6

一种人机博弈横纵向协同控制方法_南京航空航天大学_202410079675.3

基于CAD的协同设计平台及其使用方法_无锡图智科技有限公司_202111273117.3

在协同创作社区中发起通信、发布协同创作任务的方法、装置、电子设备以及计算机可读存储介质_北京奇燧科技有限公司_202410745882.8

一种高速公路车路协同云收费系统及方法_重庆元龙科技有限责任公司_202410883847.2

废弃矿山采空区地下水原位协同处理方法_中国科学院南京土壤研究所_202410628771.9

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于混合专家经验回放的星群协同任务规划方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务