论文复现:Predictive Control of Networked Multiagent Systems via Cloud Computing

Predictive Control of Networked Multiagent Systems via Cloud Computing论文复现

文章目录

论文摘要

翻译版本见:论文翻译:通过云计算对联网多智能体系统进行预测控制-CSDN博客

本文研究了基于云计算的网络化多智能体预测控制系统的设计与分析。该文提出一种网络化多智能体系统(NMAS)云预测控制方案,以同时实现一致性和稳定性,并主动补偿网络时延。详细介绍了NMAS云预测控制器的设计。对云预测控制方案的分析给出了闭环网络化多智能体控制系统稳定性和一致性的必要和充分条件。通过仿真验证了所提方案表征NMAS的动力学行为和控制性能。研究结果为NMAS及其应用的合作和协调控制的发展奠定了基础。

论文链接:Predictive Control of Networked Multiagent Systems via Cloud Computing | IEEE Journals & Magazine | IEEE Xplore

期刊:IEEE Transactions on Cybernetics

分区:Q1

论文引用:G. -P. Liu, "Predictive Control of Networked Multiagent Systems via Cloud Computing," in IEEE Transactions on Cybernetics, vol. 47, no. 8, pp. 1852-1859, Aug. 2017, doi: 10.1109/TCYB.2017.2647820.

项目地址:

CSDN资源 论文复现:PredictiveControlofNetworkedMultiagentSystemsviaClou资源-CSDN文库
github longchentian/Predictive-Control-of-Networked-Multiagent-Systems-via-Cloud-Computing: Predictive Control of Networked Multiagent Systems via Cloud Computing 论文复现 (github.com)

系统参数初始化

matlab 复制代码
clc;
clear all;
close all;
A1 = [1.7,-1.3;
     1.6, -1.8
     ];
B1 = [1.0;
      2.0
      ];
C1 = [1.0,0.3];
A2 = [1.8,-1.4;
      1.8,-1.9
      ];
B2 = [1.7;
      3.4
      ];
C2 = [0.7,0.2];
A3 = [1.4,-1.1;
      1.3,-1.5
      ];
B3 = [0.8;
      1.6
      ];
C3 = [1.1,0.4];
G1 = -0.16;
G2 = -0.18;
G3 = -0.14;
H1 = -0.12;
H2 = -0.10;
H3= -0.14;
F1 = [-0.4483;
      -1.1724
      ];
F2 = [-0.6803;
      -1.6191
      ];
F3 = [-0.3908;
      -0.9254
      ];
M = [1,0,1;
    1,1,1;
    1,0,1 
];
X1 =[0.1;
    0.2];
X2 =[0.1;
    0.7];
X3 =[0.1;
    0.8];
samp_t = 0.2
a1 = int8(3);
a2 = int8(2);
a3 = int8(3);
s1 = int8(2);
s2 = int8(3);
s3 = int8(1);

系统模型

为了说明如何轻松地设计、分析和执行云预测控制方案,下面考虑了线性非同一多智能体。实际上,该方案可以扩展到更一般的 NMAS,例如具有不确定性和干扰的非线性 NMAS
x i ( t + 1 ) = A i x i ( t ) + B i u i ( t ) y i ( t ) = C i x i ( t ) \begin{align} x_{i} (t+1)=&A_{i} x_{i} (t)+B_{i} u_{i} (t) \notag \\ y_{i} (t)=&C_{i} x_{i} (t) \end{align} xi(t+1)=yi(t)=Aixi(t)+Biui(t)Cixi(t)

∀i ∈ N,其中 x i ∈ R n i x_i∈R^{n_i} xi∈Rni, y i ∈ l y_i∈l yi∈l, u i ∈ m i u_i∈m_i ui∈mi 分别是第 i i i 个智能体的状态、输出和输入向量, A i ∈ R n i × n i A_i∈R^{n_i×n_i} Ai∈Rni×ni , B i ∈ R n i × m i B_i ∈R^{n_i×m_i} Bi∈Rni×mi , C i ∈ R l × n i C_i ∈R^{l×n_i} Ci∈Rl×ni 是第 i 个智能体的矩阵。

观测器

假设所有智能体都是可观察的,但它们的状态是不可测量的。然后,基于输出 y i ( t − s i ) y_i(t − s_i) yi(t−si) 和控制输入 u i ( t − s i ) u_i(t − s_i) ui(t−si),第 i 个智能体的状态观察器设计如下:
x ^ i ( t − s i + 1 ∣ t − s i ) = A i x ^ i ( t − s i ∣ t − s i − 1 ) + B i u i ( t − s i ) +    F i ( y i ( t − s i ) − y ^ i ( t − s i ∣ t − s i − 1 ) ) y ^ i ( t − s i ∣ t − s i − 1 ) = C i x ^ i ( t − s i ∣ t − s i − 1 ) \begin{align} \hat {x}{i} \left ({t-s{i} +1 | t-s_{i} }\right )=&A_{i} \hat {x}{i} \left ({t-s{i} | t-s_{i} -1}\right )+B_{i} u_{i} \left ({t-s_{i} }\right )\notag \\&+ \,\, F_{i} \left ({y_{i} \left ({t-s_{i} }\right )-\hat {y}{i} \left ({t-s{i} | t-s_{i} -1}\right )}\right ) \notag \\ \hat {y}{i} \left ({t-s{i} | t-s_{i} -1}\right )=&C_{i} \hat {x}{i} \left ({t-s{i} | t-s_{i} -1}\right ) \end{align} x^i(t−si+1∣t−si)=y^i(t−si∣t−si−1)=Aix^i(t−si∣t−si−1)+Biui(t−si)+Fi(yi(t−si)−y^i(t−si∣t−si−1))Cix^i(t−si∣t−si−1)

其中 x ^ i ( t − k ∣ t − j ) ∈ ℜ n i ( k < j ) \hat {x}{i} (t-k|t-j)\in \Re ^{n{i}} (k<j) x^i(t−k∣t−j)∈ℜni(k<j)表示第 i 个智能体根据时间 t − j t − j t−j 之前的可用信息对时间 t − k t − k t−k 的状态预测, y ^ i ( . ∣ . ) ∈ ℜ l i \hat {y}{i} (.|.)\in \Re ^{l{i}} y^i(.∣.)∈ℜli是输出预测, F i ∈ ℜ n i × l i F_{i} \in \Re ^{n_{i} \times l_{i}} Fi∈ℜni×li是观察者增益矩阵。

预测过程

要使用直到时间 t − s i t − s_i t−si 的可用信息来预测第 i 个智能体的状态,可以使用从 t − s i + 2 t − s_i + 2 t−si+2到 t + a i t + a_i t+ai 开始的以下时间状态估计:
x ^ i ( t − s i + k ∣ t − s i ) = A i x ^ i ( t − s i + k − 1 ∣ t − s i ) +    B i u i ( t − s i + k − 1 ) y ^ i ( t − s i + k ∣ t − s i ) = C i x ^ i ( t − s i + k ∣ t − s i ) \begin{align} \hat {x}{i} \left ({t-s{i} +k | t-s_{i} }\right )=&A_{i} \hat {x}{i} \left ({t-s{i} +k-1 | t-s_{i} }\right )\notag \\&+ \,\, B_{i} u_{i} \left ({t-s_{i} +k-1}\right ) \\ \hat {y}{i} \left ({t-s{i} +k | t-s_{i} }\right )=&C_{i} \hat {x}{i} \left ({t-s{i} +k | t-s_{i} }\right ) \end{align} x^i(t−si+k∣t−si)=y^i(t−si+k∣t−si)=Aix^i(t−si+k−1∣t−si)+Biui(t−si+k−1)Cix^i(t−si+k∣t−si)

传感器时延部分的预测+执行器部分的预测:


预测部分代码:

matlab 复制代码
function [x_,y]= fcn(u10,u9,u8,u7,u6,u5,u4,u3,u2,u1,x,s,a,A,B,C)
% tau的上界是N,最多迭代N次,控制输入按照t-s_i时刻的值
tau = s + a;
temp0 = x;
if tau == 1
    temp1 = A * temp0 + B * u1;
    x_ = temp1;
elseif tau == 2
    temp1 = A * temp0 + B * u2;
    temp2 = A * temp1 + B * u1;
    x_ = temp2;
elseif tau == 3
    temp1 = A * temp0 + B * u3;
    temp2 = A * temp1 + B * u2;
    temp3 = A * temp2 + B * u1;
    x_ = temp3;
elseif tau == 4
    temp1 = A * temp0 + B * u4;
    temp2 = A * temp1 + B * u3;
    temp3 = A * temp2 + B * u2;
    temp4 = A * temp3 + B * u1;
    x_ = temp4;  
elseif tau == 5
    temp1 = A * temp0 + B * u5;
    temp2 = A * temp1 + B * u4;
    temp3 = A * temp2 + B * u3;
    temp4 = A * temp3 + B * u2;
    temp5 = A * temp4 + B * u1;
    x_ = temp5;
elseif tau == 6
    temp1 = A * temp0 + B * u6;
    temp2 = A * temp1 + B * u5;
    temp3 = A * temp2 + B * u4;
    temp4 = A * temp3 + B * u3;
    temp5 = A * temp4 + B * u2;
    temp6 = A * temp5 + B * u1;
    x_ = temp6;
elseif tau == 7
    temp1 = A * temp0 + B * u7;
    temp2 = A * temp1 + B * u6;
    temp3 = A * temp2 + B * u5;
    temp4 = A * temp3 + B * u4;
    temp5 = A * temp4 + B * u3;
    temp6 = A * temp5 + B * u2;
    temp7 = A * temp6 + B * u2;
    x_ = temp7;
elseif tau == 8
    temp1 = A * temp0 + B * u8;
    temp2 = A * temp1 + B * u7;
    temp3 = A * temp2 + B * u6;
    temp4 = A * temp3 + B * u5;
    temp5 = A * temp4 + B * u4;
    temp6 = A * temp5 + B * u3;
    temp7 = A * temp6 + B * u2;
    temp8 = A * temp7 + B * u1;
    x_ = temp8;
elseif tau == 9
    temp1 = A * temp0 + B * u9;
    temp2 = A * temp1 + B * u8;
    temp3 = A * temp2 + B * u7;
    temp4 = A * temp3 + B * u6;
    temp5 = A * temp4 + B * u5;
    temp6 = A * temp5 + B * u4;
    temp7 = A * temp6 + B * u3;
    temp8 = A * temp7 + B * u2;
    temp9 = A * temp8 + B * u1;
    x_ = temp9;
elseif tau == 10
    temp1 = A * temp0 + B * u10;
    temp2 = A * temp1 + B * u9;
    temp3 = A * temp2 + B * u8;
    temp4 = A * temp3 + B * u7;
    temp5 = A * temp4 + B * u6;
    temp6 = A * temp5 + B * u5;
    temp7 = A * temp6 + B * u4;
    temp8 = A * temp7 + B * u3;
    temp9 = A * temp8 + B * u2;
    temp10 = A * temp9 + B * u1;
    x_ = temp10;
else 
    x_ = temp0;

end
y = C * x_;

控制器设计

假设所需的参考输入由阶跃信号向量 r 0 r_0 r0 表示,并且仅应用于其中一个智能体,例如,具有 a 1 ≥ a i , ∀ i ∈ N − 1 a_1 ≥ a_i,∀i ∈ N − {1} a1≥ai,∀i∈N−1的第一个智能体。为了跟踪这个所需的参考输入,引入了一组动态变量
z 1 ( t + 1 + a 1 ) = z 1 ( t + a 1 ) + y ^ 1 ( t + a 1 ∣ t − s 1 ) − r 0 z i ( t + 1 + a i ) = z i ( t + a i ) + y ^ i ( t + a i ∣ t − s i ) −    y ^ 1 ( t + a i ∣ t − s 1 ) . \begin{align} z_{1} \left ({t+1+a_{1}}\right )=&z_{1} \left ({t+a_{1}}\right )+\hat {y}{1} \left ({t+a{1} | t-s_{1} }\right )-r_{0}\qquad \\ z_{i} \left ({t+1+a_{i} }\right )=&z_{i} \left ({t+a_{i}}\right )+\hat {y}{i} \left ({t +a{i} | t-s_{i} }\right )\notag \\&- \,\, \hat {y}{1} \left ({t +a{i} | t- s_{1} }\right ). \end{align} z1(t+1+a1)=zi(t+1+ai)=z1(t+a1)+y^1(t+a1∣t−s1)−r0zi(t+ai)+y^i(t+ai∣t−si)−y^1(t+ai∣t−s1).

(5)和(6)中动态变量的作用相当于常规控制系统中的积分作用,可以消除稳态跟踪误差。

为了主动补偿网络延迟 s i s_i si 和 a i , ∀ i ∈ N a_i,∀i ∈ N ai,∀i∈N,NMAS 的预测控制协议如下:
u ^ i ( t + a i ∣ t − s i ) = G i z i ( t + a i ) +    H i ∑ j = 1 N c i j ( y ^ j ( t + a i ∣ t − s j ) −    y ^ i ( t + a i ∣ t − s i ) ) \begin{align} \hat {u}{i} \left ({t+a{i} | t-s_{i} }\right )=&G_{i} z_{i} \left ({t+a_{i} }\right )\notag \\&+ \,\, H_{i} \sum {j=1}^{N}c{ij} \Biggl ({\hat {y}{j} \left ({t+a{i} | t-s_{j} }\right )}\notag \\&\qquad \qquad \qquad {- \,\, \hat {y}{i} \left ({t+a{i} | t-s_{i} }\right )}\Biggr )\qquad \end{align} u^i(t+ai∣t−si)=Gizi(t+ai)+Hij=1∑Ncij(y^j(t+ai∣t−sj)−y^i(t+ai∣t−si))

其中
c i j = { 1 , i f a i   ≤   a j 0 , i f a i   > a j . \begin{equation} c_{ij} =\begin{cases} {1}, & {\mathrm{ if}}~a_{i} \, \le \, a_{j}\\ {0},& {\mathrm{ if}}~a_{i} \, >a_{j}. \end{cases} \end{equation} cij={1,0,if ai≤ajif ai>aj.
G i ∈ R m i × m i G_i ∈R^{m_i×m_i} Gi∈Rmi×mi 和 H i ∈ R m i × l i H_i ∈R^{m_i×l_i} Hi∈Rmi×li 是需要设计的增益矩阵。以上暗示预测控制协议利用基于时间 t − s i , ∀ i ∈ N t − s_i,∀i ∈ N t−si,∀i∈N 可用信息的输出预测来估计时间 t + a i , ∀ i ∈ N t + a_i,∀i ∈ N t+ai,∀i∈N 的未来控制行为。实际上,所提出的预测控制协议由两部分组成。一个是让智能体 1 跟踪所需的参考,让其他智能体跟踪智能体 1 的输出,这由 (7) 中右侧的第一项表示。另一个是智能体之间的协调,由(7)中右侧的第二项表示。


然后,第 i 个智能体的预测控制输入被设计为
u i ( t + a i ) = u ^ i ( t + a i ∣ t − s i ) . \begin{equation} u_{i} \left ({t+a_{i}}\right )=\hat {u}{i} \left ({t+a{i} | t-s_{i}}\right ). \end{equation} ui(t+ai)=u^i(t+ai∣t−si).

因此,第 i 个智能体的控制输入为
u i ( t ) = u ^ i ( t ∣ t − s i − a i ) . \begin{equation} u_{i} (t)=\hat {u}{i} \left ({t | t-s{i} -a_{i}}\right ). \end{equation} ui(t)=u^i(t∣t−si−ai).

因此,云预测控制方案被提出如下。

  1. 来自传感器的所有智能体的输出数据 y i ( t ) , ∀ i ∈ N y_i(t),∀i ∈ N yi(t),∀i∈N, 在每个采样时间 t 被发送到网络。

  2. 基于从网络接收到的输出数据 y i ( t − s i ) , ∀ i ∈ N y_i(t − s_i),∀i ∈ N yi(t−si),∀i∈N,云计算系统计算预测 x ^ i ( t + a i ∣ t − s i ) , y ^ i ( t + a i ∣ t − s i ) , u ^ i ( t + a i ∣ t − s i ) , ∀ i ∈ N , \hat {x}{i} (t+a{i} |t-s_{i} ),~\hat {y}{i} (t+a{i} |t-s_{i} ),~\hat {u}{i} (t+a{i} |t-s_{i} ),~\forall i\in {\mathbb N}, x^i(t+ai∣t−si), y^i(t+ai∣t−si), u^i(t+ai∣t−si), ∀i∈N,, 分别使用(3),(4)和(7)的智能体的状态,输出和控制输入,和动态变量 z i ( t + a i ) z_{i}(t+a_{i}) zi(t+ai), ∀ i ∈ N ∀i ∈ N ∀i∈N 使用 (5) 和 (6)。

  3. 由(9)给出的控制输入预测 u i ( t + a i ) , ∀ i ∈ N u_{i} (t+a_{i}),∀i ∈ N ui(t+ai),∀i∈N通过网络从云计算系统发送到每个智能体的执行器。

  4. 所有智能体的执行器在每个采样时间 t 从网络接收由 (10) 给出的控制输入 u i ( t ) , ∀ i ∈ N u_i(t), ∀i ∈ N ui(t),∀i∈N。

仿真结果

基本符合原文结果。

原文结果:

相关推荐
远望清一色4 小时前
基于MATLAB的实现垃圾分类Matlab源码
开发语言·matlab
顶呱呱程序9 小时前
2-143 基于matlab-GUI的脉冲响应不变法实现音频滤波功能
算法·matlab·音视频·matlab-gui·音频滤波·脉冲响应不变法
简简单单做算法12 小时前
基于Retinex算法的图像去雾matlab仿真
算法·matlab·图像去雾·retinex
其实吧31 天前
基于Matlab的图像融合研究设计
人工智能·计算机视觉·matlab
Matlab程序猿小助手1 天前
【MATLAB源码-第208期】基于matlab的改进A*算法和传统A*算法对比仿真;改进点:1.无斜穿障碍物顶点2.删除中间多余节点,减少转折。
开发语言·嵌入式硬件·算法·matlab·机器人
IT猿手1 天前
基于卷积神经网络(CNN)的时间序列预测,15个输入1个输出,可以更改数据集,MATLAB代码
人工智能·深度学习·神经网络·算法·matlab·cnn
其实吧32 天前
基于MATLAB的运动车辆跟踪检测系统
开发语言·matlab
梦里水乡8572 天前
基于MATLAB的农业病虫害识别研究
开发语言·matlab
墨痕_7772 天前
论文阅读笔记Dense Passage Retrieval for Open-Domain Question Answering
matlab
真的是我22 天前
基于MATLAB课程设计-图像处理完整版
图像处理·人工智能·计算机视觉·matlab