保姆级教程之SABO-VMD-SVM的西储大学轴承诊断

之前写过一篇优化核极限学习机的轴承诊断，今天再出一期基于SVM的轴承诊断。

依旧是包含了从数据处理，到减法优化器SABO算法优化VMD参数，再到支持向量机的故障诊断，实现故障诊断的全流程，其他类型的故障诊断均可参考此流程。数据替换十分简单！

友情提示：对于刚接触故障诊断的新手来说，这篇文章信息量可能有点大，大家可以收藏反复阅读。即便有些内容本篇文章没讲出来，但其中的一些跳转链接，也完全把故障诊断这个故事讲清楚了。

与上一期文章相似，先给大家看看文件夹目录，都是作者精心整理过的。

最后一个压缩包是有关VMD画图的程序。考虑到大家可能会用到VMD的相关作图，包络谱，频谱图等，作者在这里也一并附在代码中了。这部分大家需要自行更改数据！也就是作者比较火的文章之一，这里边提到的所有代码： VMD分解，matlab代码，包络线，包络谱，中心频率，峭度值，能量熵，样本熵，模糊熵，排列熵，多尺度排列熵，西储大学数据集为例

如图所示，本次内容一共做了三件事情：

一，对官方下载的西储大学数据进行处理，步骤如下：

1.一共加载10种数据，然后取每个数据的DE_time（%DE是驱动端数据 FE是风扇端数据 BA是加速度数据选择其中一个就行）

2.设置滑动窗口w，每个数据的故障样本点个数s，每个故障类型的样本量m

3.将所有的数据滑窗完毕之后，综合到一个data变量中

有关西储大学数据的处理之前有文章也讲过，大家可以看这篇文章：西储大学轴承诊断数据处理，matlab免费代码获取

图中的1750，1772，1790是西储大学轴承的转速，大家做诊断的时候，选择其中一个即可，即选同一转速下的不同故障进行诊断更有意义！

二，对第一步数据处理得到的数据进行特征提取

选取五种适应度函数进行优化，这里大家可以自行决定选哪一个！以此确定VMD的最佳k和α参数。五种适应度函数分别是：最小包络熵，最小样本熵，最小信息熵，最小排列熵， 排列熵/互信息熵 ，代码中可以一键切换。 至于应该选择哪种作为自己的适应度函数，大家可以看这篇文章。VMD为什么需要进行参数优化，最小包络熵/样本熵/排列熵/信息熵，适应度函数到底该选哪个

老粉应该知道，之前也推过一篇文章，就是关于西储大学特征提取的，但当时作者懒，没有写一个大循环，需要大家针对每种类型的数据依次提取。这次，作者把特征提取写了一个大循环，方便一键特征提取，大家也可以很简单的更换自己的数据！

至于特征提取的具体原理，也在这篇文章进行过详细介绍，大家可以跳转阅读。简单来说，就是利用包络熵最小的准则把每个样本的最佳IMF分量提取出来，然后对其9个指标进行计算，分别是：均值，方差，峰值，峭度，有效值，峰值因子，脉冲因子，波形因子，裕度因子。然后用这9个指标构建每个样本的特征向量。

另外本篇文章采用了2023年一个较新且效率较高的智能算法---减法优化器(SABO)，对VMD参数进行了优化，找到了每个故障类型的最佳IMF分量，并利用包络熵最小的准则，提取出了最佳的IMF分量。

三，采用支持向量机实现故障分类

本文所选SVM是从官网下载的libsvm-3.3版本，作者已编译好，大家可以直接运行。如果想自行编译的童鞋可以从网站下载：https://www.csie.ntu.edu.tw/\~cjlin/libsvm/index.html，编译步骤可以参考https://blog.csdn.net/qq_42457960/article/details/109275227

本文采用了网格搜索机制，并采用5折交叉验证，对SVM的惩罚因子c和gamma参数进行寻优。

结果展示

混淆矩阵图，有的文章会采用这种图：

这里不得不说一句，官方给出的libSVM包，准确率就是嘎嘎高！

部分代码

数据处理代码：

properties 复制代码

clc;
clear;
addpath(genpath(pwd));
%DE是驱动端数据 FE是风扇端数据 BA是加速度数据 选择其中一个就行
load 97.mat     %正常
load 107.mat    %直径0.007英寸，转速为1750时的  内圈故障
load 120.mat    %直径0.007，转速为1750时的  滚动体故障
load 132.mat    %直径0.007，转速为1750时的  外圈故障
load 171.mat    %直径0.014英寸，转速为1750时的  内圈故障
load 187.mat    %直径0.014英寸，转速为1750时的  滚动体故障
load 199.mat    %直径0.014英寸，转速为1750时的  外圈故障
load 211.mat   %直径0.021英寸，转速为1750时的  内圈故障
load 224.mat  %直径0.021英寸，转速为1750时的  滚动体故障
load 236.mat  %直径0.021英寸，转速为1750时的 外圈故障
w=1000;                  % w是滑动窗口的大小1000
s=2048;                  % 每个故障表示有2048个故障点
m = 10;  %每种故障有120个样本
D0=[];
for i =1:m
    D0 = [D0,X097_DE_time(1+w*(i-1):w*(i-1)+s)];
end
D0 = D0';

SABO优化VMD参数并特征提取的代码：

properties 复制代码

%%  此程序运行需要很长的时间！！
% vmddata.mat就是最终特征提取的结果！


%% 以最小包络熵、最小样本熵、最小信息熵、最小排列熵，排列熵/互信息熵，为目标函数（任选其一），采用SABO算法优化VMD，求取VMD最佳的两个参数
clear
clc
close all
addpath(genpath(pwd))
xz = 5;  %xz, 选择1，以最小包络熵为适应度函数，
% 选择2，以最小样本熵为适应度函数，
% 选择3，以最小信息熵为适应度函数，
% 选择4，以最小排列熵为适应度函数，
% 选择5，以复合指标：排列熵/互信息熵为适应度函数。
if xz == 1  
    fobj=@EnvelopeEntropyCost;          %最小包络熵
elseif xz == 2
    fobj=@SampleEntropyCost;            %最小样本熵
elseif xz == 3  
    fobj=@infoEntropyCost;              %最小信息熵
elseif xz == 4
    fobj=@PermutationEntropyCost;       %最小排列熵
elseif xz == 5
    fobj=@compositeEntropyCost;       %复合指标：排列熵/互信息熵
end
load data_total_1797.mat   %这里选取转速为1797的10种故障，大家也可以选取其他类型的数据
D=2;             % 优化变量数目
lb=[100 3];      % 下限值，分别是a,k
ub=[2500 10];        % 上限值
T=20;       % 最大迭代数目
N=15;        % 种群规模
vmddata = [];
for i=1:10   %因为有十种故障状态
    disp(['正在对第',num2str(i),'个故障类型的数据进行VMD优化......请耐心等待！'])
    every_data = data(1+120*(i-1):120*i,:);  %一种状态是120个样本，每次选120个样本进行VMD优化和特征提取
    da = every_data(1,:);  %从当前状态的数据中任选一组数据进行VMD优化即可。
    [SABOBest_score,SABOBest_pos,Bestidx,SABO_curve] = SABO(N,T,lb,ub,D,fobj,da');
    display(['第',num2str(i),'个故障类型数据的最佳VMD参数是：', num2str(fix(SABOBest_pos)),'最佳IMF分量是：IMF',num2str(Bestidx)]);  %输出最佳位置
    %% 以下为将最佳的a,k，idx回带VMD中，并进行9种时域指标特征提取
    bbh = fix(SABOBest_pos);%最佳位置取整
    new_data = tezhengtiqu(bbh(1),bbh(2),Bestidx,every_data);  %将优化得到的两个参数和最小适应度的索引值带回VMD中，提取得到当前状态的特征向量
    vmddata =  [vmddata;new_data];  %将每个状态提取得到的特征向量都放在一起
end
    save vmddata.mat vmddata  %将提取的特征向量保存为mat文件
%% 删除路径，以免被其他函数混淆
rmpath(genpath(pwd))

SVM诊断的代码：

makefile 复制代码

%% 初始化
clear
close all
clc
warning off
% 数据读取
addpath(genpath(pwd));
load vmddata.mat  %加载处理好的特征数据
data = vmddata;
% 数据载入


bv = 120;    %每种状态数据有120组
% 加标签值
hhh = size(data,2);
for i=1:size(data,1)/bv
    data(1+bv*(i-1):bv*i,hhh+1)=i;
end
input=data(:,1:hhh);
output =data(:,end);
jg = bv;   %每组120个样本
tn = 90;    %选前tn个样本进行训练
input_train = []; output_train = [];
input_test = []; output_test = [];
for i = 1:max(data(:,end))
    input_train=[input_train;input(1+jg*(i-1):jg*(i-1)+tn,:)];
    output_train=[output_train;output(1+jg*(i-1):jg*(i-1)+tn,:)];
    input_test=[input_test;input(jg*(i-1)+tn+1:i*jg,:)];
    output_test=[output_test;output(jg*(i-1)+tn+1:i*jg,:)];
end
input_train = input_train'; 
input_test = input_test';
%归一化
[inputn_train,inputps]=mapminmax(input_train);inputn_train = inputn_train';
[inputn_test,inputtestps]=mapminmax('apply',input_test,inputps); inputn_test =inputn_test';
[c,g] = meshgrid(-10:0.5:10,-10:0.5:10);  %调整间距，可以搜索的更加精细
[m,n] = size(c);
cg = zeros(m,n);
eps = 10^(-4);
v = 5;  %采用5折交叉验证
bestacc = 0;

代码获取

完整代码获取，点击下方卡片，后台回复关键词：

SVM诊断