论文复现:Predictive Control of Networked Multiagent Systems via Cloud Computing

Predictive Control of Networked Multiagent Systems via Cloud Computing论文复现

文章目录

论文摘要

翻译版本见:论文翻译:通过云计算对联网多智能体系统进行预测控制-CSDN博客

本文研究了基于云计算的网络化多智能体预测控制系统的设计与分析。该文提出一种网络化多智能体系统(NMAS)云预测控制方案,以同时实现一致性和稳定性,并主动补偿网络时延。详细介绍了NMAS云预测控制器的设计。对云预测控制方案的分析给出了闭环网络化多智能体控制系统稳定性和一致性的必要和充分条件。通过仿真验证了所提方案表征NMAS的动力学行为和控制性能。研究结果为NMAS及其应用的合作和协调控制的发展奠定了基础。

论文链接:Predictive Control of Networked Multiagent Systems via Cloud Computing | IEEE Journals & Magazine | IEEE Xplore

期刊:IEEE Transactions on Cybernetics

分区:Q1

论文引用:G. -P. Liu, "Predictive Control of Networked Multiagent Systems via Cloud Computing," in IEEE Transactions on Cybernetics, vol. 47, no. 8, pp. 1852-1859, Aug. 2017, doi: 10.1109/TCYB.2017.2647820.

项目地址:

CSDN资源 论文复现:PredictiveControlofNetworkedMultiagentSystemsviaClou资源-CSDN文库
github longchentian/Predictive-Control-of-Networked-Multiagent-Systems-via-Cloud-Computing: Predictive Control of Networked Multiagent Systems via Cloud Computing 论文复现 (github.com)

系统参数初始化

matlab 复制代码
clc;
clear all;
close all;
A1 = [1.7,-1.3;
     1.6, -1.8
     ];
B1 = [1.0;
      2.0
      ];
C1 = [1.0,0.3];
A2 = [1.8,-1.4;
      1.8,-1.9
      ];
B2 = [1.7;
      3.4
      ];
C2 = [0.7,0.2];
A3 = [1.4,-1.1;
      1.3,-1.5
      ];
B3 = [0.8;
      1.6
      ];
C3 = [1.1,0.4];
G1 = -0.16;
G2 = -0.18;
G3 = -0.14;
H1 = -0.12;
H2 = -0.10;
H3= -0.14;
F1 = [-0.4483;
      -1.1724
      ];
F2 = [-0.6803;
      -1.6191
      ];
F3 = [-0.3908;
      -0.9254
      ];
M = [1,0,1;
    1,1,1;
    1,0,1 
];
X1 =[0.1;
    0.2];
X2 =[0.1;
    0.7];
X3 =[0.1;
    0.8];
samp_t = 0.2
a1 = int8(3);
a2 = int8(2);
a3 = int8(3);
s1 = int8(2);
s2 = int8(3);
s3 = int8(1);

系统模型

为了说明如何轻松地设计、分析和执行云预测控制方案,下面考虑了线性非同一多智能体。实际上,该方案可以扩展到更一般的 NMAS,例如具有不确定性和干扰的非线性 NMAS
x i ( t + 1 ) = A i x i ( t ) + B i u i ( t ) y i ( t ) = C i x i ( t ) \begin{align} x_{i} (t+1)=&A_{i} x_{i} (t)+B_{i} u_{i} (t) \notag \\ y_{i} (t)=&C_{i} x_{i} (t) \end{align} xi(t+1)=yi(t)=Aixi(t)+Biui(t)Cixi(t)

∀i ∈ N,其中 x i ∈ R n i x_i∈R^{n_i} xi∈Rni, y i ∈ l y_i∈l yi∈l, u i ∈ m i u_i∈m_i ui∈mi 分别是第 i i i 个智能体的状态、输出和输入向量, A i ∈ R n i × n i A_i∈R^{n_i×n_i} Ai∈Rni×ni , B i ∈ R n i × m i B_i ∈R^{n_i×m_i} Bi∈Rni×mi , C i ∈ R l × n i C_i ∈R^{l×n_i} Ci∈Rl×ni 是第 i 个智能体的矩阵。

观测器

假设所有智能体都是可观察的,但它们的状态是不可测量的。然后,基于输出 y i ( t − s i ) y_i(t − s_i) yi(t−si) 和控制输入 u i ( t − s i ) u_i(t − s_i) ui(t−si),第 i 个智能体的状态观察器设计如下:
x ^ i ( t − s i + 1 ∣ t − s i ) = A i x ^ i ( t − s i ∣ t − s i − 1 ) + B i u i ( t − s i ) +    F i ( y i ( t − s i ) − y ^ i ( t − s i ∣ t − s i − 1 ) ) y ^ i ( t − s i ∣ t − s i − 1 ) = C i x ^ i ( t − s i ∣ t − s i − 1 ) \begin{align} \hat {x}{i} \left ({t-s{i} +1 | t-s_{i} }\right )=&A_{i} \hat {x}{i} \left ({t-s{i} | t-s_{i} -1}\right )+B_{i} u_{i} \left ({t-s_{i} }\right )\notag \\&+ \,\, F_{i} \left ({y_{i} \left ({t-s_{i} }\right )-\hat {y}{i} \left ({t-s{i} | t-s_{i} -1}\right )}\right ) \notag \\ \hat {y}{i} \left ({t-s{i} | t-s_{i} -1}\right )=&C_{i} \hat {x}{i} \left ({t-s{i} | t-s_{i} -1}\right ) \end{align} x^i(t−si+1∣t−si)=y^i(t−si∣t−si−1)=Aix^i(t−si∣t−si−1)+Biui(t−si)+Fi(yi(t−si)−y^i(t−si∣t−si−1))Cix^i(t−si∣t−si−1)

其中 x ^ i ( t − k ∣ t − j ) ∈ ℜ n i ( k < j ) \hat {x}{i} (t-k|t-j)\in \Re ^{n{i}} (k<j) x^i(t−k∣t−j)∈ℜni(k<j)表示第 i 个智能体根据时间 t − j t − j t−j 之前的可用信息对时间 t − k t − k t−k 的状态预测, y ^ i ( . ∣ . ) ∈ ℜ l i \hat {y}{i} (.|.)\in \Re ^{l{i}} y^i(.∣.)∈ℜli是输出预测, F i ∈ ℜ n i × l i F_{i} \in \Re ^{n_{i} \times l_{i}} Fi∈ℜni×li是观察者增益矩阵。

预测过程

要使用直到时间 t − s i t − s_i t−si 的可用信息来预测第 i 个智能体的状态,可以使用从 t − s i + 2 t − s_i + 2 t−si+2到 t + a i t + a_i t+ai 开始的以下时间状态估计:
x ^ i ( t − s i + k ∣ t − s i ) = A i x ^ i ( t − s i + k − 1 ∣ t − s i ) +    B i u i ( t − s i + k − 1 ) y ^ i ( t − s i + k ∣ t − s i ) = C i x ^ i ( t − s i + k ∣ t − s i ) \begin{align} \hat {x}{i} \left ({t-s{i} +k | t-s_{i} }\right )=&A_{i} \hat {x}{i} \left ({t-s{i} +k-1 | t-s_{i} }\right )\notag \\&+ \,\, B_{i} u_{i} \left ({t-s_{i} +k-1}\right ) \\ \hat {y}{i} \left ({t-s{i} +k | t-s_{i} }\right )=&C_{i} \hat {x}{i} \left ({t-s{i} +k | t-s_{i} }\right ) \end{align} x^i(t−si+k∣t−si)=y^i(t−si+k∣t−si)=Aix^i(t−si+k−1∣t−si)+Biui(t−si+k−1)Cix^i(t−si+k∣t−si)

传感器时延部分的预测+执行器部分的预测:


预测部分代码:

matlab 复制代码
function [x_,y]= fcn(u10,u9,u8,u7,u6,u5,u4,u3,u2,u1,x,s,a,A,B,C)
% tau的上界是N,最多迭代N次,控制输入按照t-s_i时刻的值
tau = s + a;
temp0 = x;
if tau == 1
    temp1 = A * temp0 + B * u1;
    x_ = temp1;
elseif tau == 2
    temp1 = A * temp0 + B * u2;
    temp2 = A * temp1 + B * u1;
    x_ = temp2;
elseif tau == 3
    temp1 = A * temp0 + B * u3;
    temp2 = A * temp1 + B * u2;
    temp3 = A * temp2 + B * u1;
    x_ = temp3;
elseif tau == 4
    temp1 = A * temp0 + B * u4;
    temp2 = A * temp1 + B * u3;
    temp3 = A * temp2 + B * u2;
    temp4 = A * temp3 + B * u1;
    x_ = temp4;  
elseif tau == 5
    temp1 = A * temp0 + B * u5;
    temp2 = A * temp1 + B * u4;
    temp3 = A * temp2 + B * u3;
    temp4 = A * temp3 + B * u2;
    temp5 = A * temp4 + B * u1;
    x_ = temp5;
elseif tau == 6
    temp1 = A * temp0 + B * u6;
    temp2 = A * temp1 + B * u5;
    temp3 = A * temp2 + B * u4;
    temp4 = A * temp3 + B * u3;
    temp5 = A * temp4 + B * u2;
    temp6 = A * temp5 + B * u1;
    x_ = temp6;
elseif tau == 7
    temp1 = A * temp0 + B * u7;
    temp2 = A * temp1 + B * u6;
    temp3 = A * temp2 + B * u5;
    temp4 = A * temp3 + B * u4;
    temp5 = A * temp4 + B * u3;
    temp6 = A * temp5 + B * u2;
    temp7 = A * temp6 + B * u2;
    x_ = temp7;
elseif tau == 8
    temp1 = A * temp0 + B * u8;
    temp2 = A * temp1 + B * u7;
    temp3 = A * temp2 + B * u6;
    temp4 = A * temp3 + B * u5;
    temp5 = A * temp4 + B * u4;
    temp6 = A * temp5 + B * u3;
    temp7 = A * temp6 + B * u2;
    temp8 = A * temp7 + B * u1;
    x_ = temp8;
elseif tau == 9
    temp1 = A * temp0 + B * u9;
    temp2 = A * temp1 + B * u8;
    temp3 = A * temp2 + B * u7;
    temp4 = A * temp3 + B * u6;
    temp5 = A * temp4 + B * u5;
    temp6 = A * temp5 + B * u4;
    temp7 = A * temp6 + B * u3;
    temp8 = A * temp7 + B * u2;
    temp9 = A * temp8 + B * u1;
    x_ = temp9;
elseif tau == 10
    temp1 = A * temp0 + B * u10;
    temp2 = A * temp1 + B * u9;
    temp3 = A * temp2 + B * u8;
    temp4 = A * temp3 + B * u7;
    temp5 = A * temp4 + B * u6;
    temp6 = A * temp5 + B * u5;
    temp7 = A * temp6 + B * u4;
    temp8 = A * temp7 + B * u3;
    temp9 = A * temp8 + B * u2;
    temp10 = A * temp9 + B * u1;
    x_ = temp10;
else 
    x_ = temp0;

end
y = C * x_;

控制器设计

假设所需的参考输入由阶跃信号向量 r 0 r_0 r0 表示,并且仅应用于其中一个智能体,例如,具有 a 1 ≥ a i , ∀ i ∈ N − 1 a_1 ≥ a_i,∀i ∈ N − {1} a1≥ai,∀i∈N−1的第一个智能体。为了跟踪这个所需的参考输入,引入了一组动态变量
z 1 ( t + 1 + a 1 ) = z 1 ( t + a 1 ) + y ^ 1 ( t + a 1 ∣ t − s 1 ) − r 0 z i ( t + 1 + a i ) = z i ( t + a i ) + y ^ i ( t + a i ∣ t − s i ) −    y ^ 1 ( t + a i ∣ t − s 1 ) . \begin{align} z_{1} \left ({t+1+a_{1}}\right )=&z_{1} \left ({t+a_{1}}\right )+\hat {y}{1} \left ({t+a{1} | t-s_{1} }\right )-r_{0}\qquad \\ z_{i} \left ({t+1+a_{i} }\right )=&z_{i} \left ({t+a_{i}}\right )+\hat {y}{i} \left ({t +a{i} | t-s_{i} }\right )\notag \\&- \,\, \hat {y}{1} \left ({t +a{i} | t- s_{1} }\right ). \end{align} z1(t+1+a1)=zi(t+1+ai)=z1(t+a1)+y^1(t+a1∣t−s1)−r0zi(t+ai)+y^i(t+ai∣t−si)−y^1(t+ai∣t−s1).

(5)和(6)中动态变量的作用相当于常规控制系统中的积分作用,可以消除稳态跟踪误差。

为了主动补偿网络延迟 s i s_i si 和 a i , ∀ i ∈ N a_i,∀i ∈ N ai,∀i∈N,NMAS 的预测控制协议如下:
u ^ i ( t + a i ∣ t − s i ) = G i z i ( t + a i ) +    H i ∑ j = 1 N c i j ( y ^ j ( t + a i ∣ t − s j ) −    y ^ i ( t + a i ∣ t − s i ) ) \begin{align} \hat {u}{i} \left ({t+a{i} | t-s_{i} }\right )=&G_{i} z_{i} \left ({t+a_{i} }\right )\notag \\&+ \,\, H_{i} \sum {j=1}^{N}c{ij} \Biggl ({\hat {y}{j} \left ({t+a{i} | t-s_{j} }\right )}\notag \\&\qquad \qquad \qquad {- \,\, \hat {y}{i} \left ({t+a{i} | t-s_{i} }\right )}\Biggr )\qquad \end{align} u^i(t+ai∣t−si)=Gizi(t+ai)+Hij=1∑Ncij(y^j(t+ai∣t−sj)−y^i(t+ai∣t−si))

其中
c i j = { 1 , i f a i   ≤   a j 0 , i f a i   > a j . \begin{equation} c_{ij} =\begin{cases} {1}, & {\mathrm{ if}}~a_{i} \, \le \, a_{j}\\ {0},& {\mathrm{ if}}~a_{i} \, >a_{j}. \end{cases} \end{equation} cij={1,0,if ai≤ajif ai>aj.
G i ∈ R m i × m i G_i ∈R^{m_i×m_i} Gi∈Rmi×mi 和 H i ∈ R m i × l i H_i ∈R^{m_i×l_i} Hi∈Rmi×li 是需要设计的增益矩阵。以上暗示预测控制协议利用基于时间 t − s i , ∀ i ∈ N t − s_i,∀i ∈ N t−si,∀i∈N 可用信息的输出预测来估计时间 t + a i , ∀ i ∈ N t + a_i,∀i ∈ N t+ai,∀i∈N 的未来控制行为。实际上,所提出的预测控制协议由两部分组成。一个是让智能体 1 跟踪所需的参考,让其他智能体跟踪智能体 1 的输出,这由 (7) 中右侧的第一项表示。另一个是智能体之间的协调,由(7)中右侧的第二项表示。


然后,第 i 个智能体的预测控制输入被设计为
u i ( t + a i ) = u ^ i ( t + a i ∣ t − s i ) . \begin{equation} u_{i} \left ({t+a_{i}}\right )=\hat {u}{i} \left ({t+a{i} | t-s_{i}}\right ). \end{equation} ui(t+ai)=u^i(t+ai∣t−si).

因此,第 i 个智能体的控制输入为
u i ( t ) = u ^ i ( t ∣ t − s i − a i ) . \begin{equation} u_{i} (t)=\hat {u}{i} \left ({t | t-s{i} -a_{i}}\right ). \end{equation} ui(t)=u^i(t∣t−si−ai).

因此,云预测控制方案被提出如下。

  1. 来自传感器的所有智能体的输出数据 y i ( t ) , ∀ i ∈ N y_i(t),∀i ∈ N yi(t),∀i∈N, 在每个采样时间 t 被发送到网络。

  2. 基于从网络接收到的输出数据 y i ( t − s i ) , ∀ i ∈ N y_i(t − s_i),∀i ∈ N yi(t−si),∀i∈N,云计算系统计算预测 x ^ i ( t + a i ∣ t − s i ) , y ^ i ( t + a i ∣ t − s i ) , u ^ i ( t + a i ∣ t − s i ) , ∀ i ∈ N , \hat {x}{i} (t+a{i} |t-s_{i} ),~\hat {y}{i} (t+a{i} |t-s_{i} ),~\hat {u}{i} (t+a{i} |t-s_{i} ),~\forall i\in {\mathbb N}, x^i(t+ai∣t−si), y^i(t+ai∣t−si), u^i(t+ai∣t−si), ∀i∈N,, 分别使用(3),(4)和(7)的智能体的状态,输出和控制输入,和动态变量 z i ( t + a i ) z_{i}(t+a_{i}) zi(t+ai), ∀ i ∈ N ∀i ∈ N ∀i∈N 使用 (5) 和 (6)。

  3. 由(9)给出的控制输入预测 u i ( t + a i ) , ∀ i ∈ N u_{i} (t+a_{i}),∀i ∈ N ui(t+ai),∀i∈N通过网络从云计算系统发送到每个智能体的执行器。

  4. 所有智能体的执行器在每个采样时间 t 从网络接收由 (10) 给出的控制输入 u i ( t ) , ∀ i ∈ N u_i(t), ∀i ∈ N ui(t),∀i∈N。

仿真结果

基本符合原文结果。

原文结果:

相关推荐
IT猿手3 小时前
SDMTSP:粒子群优化算法PSO求解单仓库多旅行商问题,可以更改数据集和起点(MATLAB代码)
开发语言·人工智能·matlab·智能优化算法
我爱C编程12 小时前
基于Qlearning强化学习的机器人路线规划matlab仿真
matlab·机器人·强化学习·路线规划·qlearning·机器人路线规划
Evand J1 天前
LOS/NLOS环境建模与三维TOA定位,MATLAB仿真程序,可自定义锚点数量和轨迹点长度
开发语言·matlab
孤亭远见1 天前
COMSOL with Matlab
matlab
图南楠1 天前
simulink离散传递函数得到差分方程并用C语言实现
matlab
信号处理学渣1 天前
matlab画图,选择性显示legend标签
开发语言·matlab
机器学习之心2 天前
Bayes-GRU-Attention的数据多特征分类预测Matlab实现
matlab·分类·gru
叶庭云2 天前
Matlab 和 R 语言的数组索引都是从 1 开始,并且是左闭右闭的
matlab·编程语言·r·数组索引·从 1 开始
γ..2 天前
基于MATLAB的图像增强
开发语言·深度学习·神经网络·学习·机器学习·matlab·音视频
IT猿手2 天前
基于PWLCM混沌映射的麋鹿群优化算法(Elk herd optimizer,EHO)的多无人机协同路径规划,MATLAB代码
算法·elk·机器学习·matlab·无人机·聚类·强化学习