首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于高阶动态抑制控制器的多智能体协同控制方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:山东工商学院

摘要:本发明属于多智能体协同控制技术领域,具体涉及基于高阶动态抑制控制器的多智能体协同控制方法,步骤包括对于由N个智能体组成的多智能体系统MAS,构建高阶动态抑制控制器;在高阶动态抑制控制器的基础上,构建动态自适应分层架构,用以满足动态行为下的控制激励条件;基于高阶动态抑制控制器和动态自适应分层架构,实现MAS中多智能体的协同控制。本发明旨在解决多智能体系统MAS中的外部干扰和输出约束问题,通过设计具有高阶任意动态性的加权控制律,确保了多智能体系统的全局稳定性;采用动态自适应分层架构,结合正逆向异步反馈机制,实现了智能体的协同工作和全局优化,且为脑机接口在多智能体环境中的应用提供了新的解决方案。

主权项:1.基于高阶动态抑制控制器的多智能体协同控制方法,其特征在于包括以下步骤:S1、对于由N个智能体组成的多智能体系统MAS,构建高阶动态抑制控制器,步骤为:S11、将每个智能体的动态行为表示为高阶随机非线性系统;S12、设定关于非线性函数的假设和关于外部干扰的假设,用以描述MAS的高阶随机非线性特性;S13、定义MAS的全局状态向量,并建立关于MAS的动态系统;S14、定义MAS的控制目标,并基于控制目标设定高阶动态抑制控制定理;S15、在高阶动态抑制控制定理中引入高阶任意动态性,获得高阶任意动态性加权控制律,完成高阶动态抑制控制器的构建;S2、在高阶动态抑制控制器的基础上,构建动态自适应分层架构,用以满足动态行为下的控制激励条件,构建步骤为:S21、在多智能体协同控制中,引入脑电信号EEG和脑机接口BCI,建立正逆向反馈控制函数;S22、对于包含BCI在内的N个智能体,动态调整智能体所受到多重初始输入的干扰;S23、设立正逆向反馈控制的更新规则,完成动态自适应分层架构的构建;S3、基于高阶动态抑制控制器和动态自适应分层架构,实现MAS中多智能体的协同控制;所述的S11中,对于第i个智能体,其在t时刻的动态行为的高阶随机非线性系统表示为: (1);式中,是第i个智能体在t时刻的状态向量,是智能体的状态向量集合,即为第j个智能体在t时刻的状态向量;和分别是第i个智能体和第j个智能体的非线性函数;是第i个智能体在t时刻的外部干扰;是第i个智能体在t时刻的控制输入;aij是邻接矩阵的元素,表示第i个智能体和第j个智能体之间的连接权重;t代表时刻;所述的S13中,定义MAS的全局状态向量为: (2);则关于MAS的动态系统表示为: (3); (4); (5); (6); (7);式中,A是邻接矩阵;是在t时刻的外部干扰;是在t时刻的控制输入;所述的S14中,MAS的控制目标为:全局稳定性,使得MAS的收敛到期望轨迹;输出约束,在控制过程中,每个智能体的输出满足预先定义的约束条件,即为,其中是第i个智能体的输出约束集合;协同工作性能,确保所有智能体在满足约束条件的同时,实现协同工作和全局优化;由此,设定高阶动态抑制控制定理,具体为,考虑的动态行为,如果的设计满足式(8),则MAS在有界的条件下是全局渐进稳定的,并且满足输出约束,式(8)为: (8);式中,是在t时刻的误差向量,是第i个智能体在t时刻的期望向量;ki是正定增益矩阵;是非线性反馈函数;是在t时刻的补偿项,且满足: (9);式中,是第j个智能体在t时刻的状态;所述的S15中,在高阶动态抑制控制定理中引入高阶任意动态性,获得高阶任意动态性加权控制律,完成高阶动态抑制控制器的构建的过程为:S151、考虑的n阶导数,引入高阶任意动态性后的控制律表示为: (10);式中,m是常数,是的m阶导数,m≤n;是高阶导数项的加权系数;S152、进一步展开高阶导数项,假设表示为以下形式: (11);式中,是m阶导数的系数,用于表示每个智能体的权重;即为t的m阶次幂;则表示为: (12);S153、整合式(10)、式(11)和式(12),获得最终的高阶任意动态性加权控制律,表示为: (13);所述的S21中,建立正逆向反馈控制函数的过程为:S211、对于预处理后的EEG信号矩阵,存在优化策略,使得在时间区间内,MAS在t时刻的任务识别和执行的误差满足: (14);式中,t0表示起始时刻;tf表示结束时刻;为在t时刻的任务标签向量;为在t时刻的任务分配矩阵;为期望的任务标签;为期望的任务分配矩阵;其中,预处理方法为,利用带通滤波器去除EEG信号中的噪声和伪影,得到,表示为: (15);式中,为原始EEG信号矩阵,是滤波器矩阵;S212、利用小波变换,对进行时频域转换,得到时频矩阵,其中CWT表示小波变换;S213、利用主成分分析法PCA进行降维,特征向量,其中是PCA变换矩阵;S214、通过独立成分分析法ICA将混合信号分离,得到独立成分矩阵,其中是ICA变换矩阵;S215、在正向反馈中,通过第k个智能体在t时刻的误差函数实时调整任务标签向量和任务分配矩阵,使误差最小化,即,根据式(14),得到在t时刻的优化反馈控制: (16);式中,f是正逆向反馈控制函数,设定f1为正向反馈控制函数,f2为逆向反馈控制函数,则存在和,使得正向反馈表示为: (17);式中,α是学习率,β折扣因子;逆向反馈表示为: (18);式中,、、分别是t时刻的滤波器矩阵、PCA变换矩阵和ICA变换矩阵;、和分别代表智能体1、智能体2和智能体3在t时刻的具有激励性的误差函数,,和;、和分别是第k个智能体对三类不同的综合智能体的干扰误差函数;其中,将外界环境等效为智能体1,将被控制的智能体等效为智能体2,将BCI等效为智能体3,三类不同的综合智能体即为智能体1、智能体2和智能体3代表的智能体类别;所述的S22中,动态调整智能体所受到多重初始输入的干扰的过程为:S221、对于包含BCI在内的N个智能体,智能体状态表示为: (19); 中的元素表示各个智能体在t时刻的状态;智能体的动作选择表示为: (20); 中的元素表示各个智能体在t时刻的动作选择;S222、设定表示第k个智能体的状态和动作值函数,代表中的元素,代表中的元素,在满足高阶动态抑制控制定理的前提下: (21);式中,表示迭代后的,表示迭代后的;ri是奖励函数;表示为: (22);S223、第k个智能体所受到多重初始输入的干扰表示为,根据动态调整,表示为: (23);式中,是调整步长;是关于的梯度;表示第k个智能体在t时刻所受到多重初始输入的干扰;所述的S23中,设立正逆向反馈控制的更新规则的过程为:S231、定义增益矩阵x1和x2,令: (24);S232、定义在t时刻的控制策略为: (25);式中,和分别是BCI和外界干扰的控制增益矩阵;S233、结合式(17)和式(18),设定规则: (26); (27);由式(26)和式(27)组成的规则即为双向控制理论;S234、对于每个时刻t: (28);S235、智能体执行并观测和下一时刻的状态,x1和x2调整为: (29); (30);至此,完成在高阶动态抑制控制器的基础上构建动态自适应分层架构。

全文数据:

权利要求:

百度查询: 山东工商学院 基于高阶动态抑制控制器的多智能体协同控制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。