机器学习--卷积神经网络原理及MATLAB回归实现

卷积神经网络(Convolutional Neural Networks,缩写为CNNs或ConvNets)是一类专门为处理具有网格结构数据(如图像、音频)而设计的深度学习模型,在图像识别、目标检测、语义分割等诸多领域取得了巨大成功。

理论简介

1. 卷积层(Convolutional Layer)

  • 原理:卷积层是CNN的核心组成部分,通过卷积核在数据上滑动进行卷积操作,提取数据的局部特征。卷积核中的每个元素都与输入数据的对应位置进行乘法运算,然后将结果相加,得到卷积后的一个输出值。

  • 公式 :假设输入特征图为X,大小为W*H*C(宽度、高度、通道数),卷积核为K,大小为(卷积核宽度、高度、输入通道数、输出通道数),则卷积层的输出特征图Y的计算公式为

2. 池化层(Pooling Layer)

  • 原理:池化层通常用于减少数据的空间维度,同时保留主要特征。它通过在每个不重叠的局部区域内进行某种聚合操作(如取最大值、平均值等)来实现下采样。

  • 公式

S为步长,Kw,Kh为池化核的宽、高

3. 激活函数层(Activation Layer)

  • 原理:为神经网络引入非线性特性,使模型能够学习到更复杂的函数关系。常见的激活函数有ReLU、Sigmoid、Tanh等。

  • 公式

    • ReLU

    • Sigmoid

    • Tanh

4. 全连接层(Fully Connected Layer)

  • 原理:全连接层将经过卷积层和池化层提取到的特征进行整合,将其映射到最终的输出空间,用于分类、回归等任务。

5. 反向传播算法(Backpropagation)

  • 原理:用于训练CNN,通过计算损失函数关于网络参数的梯度,然后根据梯度下降法更新参数,使得损失函数逐渐减小。

MATLAB实现代码

Matlab 复制代码
%%  清空环境变量
clc                     % 清空命令行
clear                   % 清空变量
warning off             % 关闭报警信息
close all               % 关闭开启的图窗
%%  导入数据
% res = xlsread('数据集.xlsx');
res = xlsread('Long-Term Deflection of Reinforced Concrete Beams_New.xlsx');
[Num, Dim] = size(res);  % 获取数据样本点个数Num和变量维度Dim
%%  划分训练集和测试集
rng(2048)
temp = randperm(Num);
P_train = res(temp(1: round(Num*0.8)), 1: Dim-1)';  % 80%用于训练
T_train = res(temp(1: round(Num*0.8)), Dim)';       % 80%用于训练
M = size(P_train, 2);  % 训练集样本点个数

P_test = res(temp(round(Num*0.8)+1: end), 1: Dim-1)';  % 20%用于测试
T_test = res(temp(round(Num*0.8)+1: end), Dim)';       % 20%用于测试
N = size(P_test, 2);  % 测试集样本点个数

%%  数据归一化
[p_train, ps_input] = mapminmax(P_train, 0, 1);
p_test = mapminmax('apply', P_test, ps_input);

[t_train, ps_output] = mapminmax(T_train, 0, 1);
t_test = mapminmax('apply', T_test, ps_output);

%%  数据平铺
%   将数据平铺成1维数据只是一种处理方式
%   也可以平铺成2维数据,以及3维数据,需要修改对应模型结构
%   但是应该始终和输入层数据结构保持一致
D1 = Dim-1;
D2 = 1;
D3 = 1;
p_train =  double(reshape(p_train, D1, D2, D3, M));
p_test  =  double(reshape(p_test , D1, D2, D3, N));
t_train =  double(t_train)';
t_test  =  double(t_test )';

%%  构造网络结构
layers = [
 imageInputLayer([D1, D2, D3])                         % 输入层 输入数据规模[D1, D2, D3]

 convolution2dLayer([3, 1], 16, 'Padding', 'same')  % 卷积核大小 3*1 生成16张特征图
 batchNormalizationLayer                            % 批归一化层
 reluLayer                                          % Relu激活层

 maxPooling2dLayer([2, 1], 'Stride', [1, 1])        % 最大池化层 池化窗口 [2, 1] 步长 [1, 1]

 convolution2dLayer([3, 1], 32, 'Padding', 'same')  % 卷积核大小 3*1 生成32张特征图
 batchNormalizationLayer                            % 批归一化层
 reluLayer                                          % Relu激活层

 dropoutLayer(0.1)                                  % Dropout层
 fullyConnectedLayer(1)                             % 全连接层
 regressionLayer];                                  % 回归层

%%  参数设置
options = trainingOptions('sgdm', ...      % SGDM 梯度下降算法
    'MiniBatchSize', 32, ...               % 批大小,每次训练样本个数 32
    'MaxEpochs', 1200, ...                 % 最大训练次数 1200
    'InitialLearnRate', 1e-2, ...          % 初始学习率为0.01
    'LearnRateSchedule', 'piecewise', ...  % 学习率下降
    'LearnRateDropFactor', 0.1, ...        % 学习率下降因子
    'LearnRateDropPeriod', 800, ...        % 经过 800 次训练后 学习率为 0.01 * 0.1
    'Shuffle', 'every-epoch', ...          % 每次训练打乱数据集
    'Plots', 'training-progress', ...      % 画出曲线
    'Verbose', false);

%%  训练模型
net = trainNetwork(p_train, t_train, layers, options);

%%  模型预测
t_sim1 = predict(net, p_train);
t_sim2 = predict(net, p_test );

%%  数据反归一化
T_sim1 = mapminmax('reverse', t_sim1, ps_output);
T_sim2 = mapminmax('reverse', t_sim2, ps_output);

%%  均方根误差
error1 = sqrt(sum((T_sim1' - T_train).^2) ./ M);
error2 = sqrt(sum((T_sim2' - T_test ).^2) ./ N);

%%  绘制网络分析图
analyzeNetwork(layers)

%%  绘图
figure
plot(1: M, T_train, 'r-*', 1: M, T_sim1, 'b-o', 'LineWidth', 1)
legend('真实值', '预测值')
xlabel('预测样本')
ylabel('预测结果')
string = {'训练集预测结果对比'; ['RMSE=' num2str(error1)]};
title(string)
xlim([1, M])
grid

figure
plot(1: N, T_test, 'r-*', 1: N, T_sim2, 'b-o', 'LineWidth', 1)
legend('真实值', '预测值')
xlabel('预测样本')
ylabel('预测结果')
string = {'测试集预测结果对比'; ['RMSE=' num2str(error2)]};
title(string)
xlim([1, N])
grid

%%  相关指标计算
% R2
R1 = 1 - norm(T_train - T_sim1')^2 / norm(T_train - mean(T_train))^2;
R2 = 1 - norm(T_test  - T_sim2')^2 / norm(T_test  - mean(T_test ))^2;

disp(['训练集数据的R2为:', num2str(R1)])
disp(['测试集数据的R2为:', num2str(R2)])

% MAE
mae1 = sum(abs(T_sim1' - T_train)) ./ M ;
mae2 = sum(abs(T_sim2' - T_test )) ./ N ;

disp(['训练集数据的MAE为:', num2str(mae1)])
disp(['测试集数据的MAE为:', num2str(mae2)])

% MBE
mbe1 = sum(T_sim1' - T_train) ./ M ;
mbe2 = sum(T_sim2' - T_test ) ./ N ;

disp(['训练集数据的MBE为:', num2str(mbe1)])
disp(['测试集数据的MBE为:', num2str(mbe2)])

%%  绘制散点图
sz = 25;
c = 'b';

figure
scatter(T_train, T_sim1, sz, c)
hold on
plot(xlim, ylim, '--k')
xlabel('训练集真实值');
ylabel('训练集预测值');
xlim([min(T_train) max(T_train)])
ylim([min(T_sim1) max(T_sim1)])
title('训练集预测值 vs. 训练集真实值')

figure
scatter(T_test, T_sim2, sz, c)
hold on
plot(xlim, ylim, '--k')
xlabel('测试集真实值');
ylabel('测试集预测值');
xlim([min(T_test) max(T_test)])
ylim([min(T_sim2) max(T_sim2)])
title('测试集预测值 vs. 测试集真实值')
相关推荐
Landy_Jay21 分钟前
深度学习:从零开始的DeepSeek-R1-Distill有监督微调训练实战(SFT)
人工智能·深度学习
淘小欣25 分钟前
10分钟打造专属AI助手:用ms-swift实现自我认知微调
开发语言·人工智能·ai·swift·模型微调
Y1nhl1 小时前
搜广推校招面经五十五
人工智能·python·深度学习·机器学习·广告算法·推荐算法·搜索算法
C++ 老炮儿的技术栈3 小时前
设计模式,如单例模式、观察者模式在什么场景下使用
c++·笔记·学习·算法
liufangshun4 小时前
【DeepSeekR1】怎样清除mssql的日志文件?
数据库·人工智能·sqlserver
深圳市快瞳科技有限公司4 小时前
AI鸟类识别技术革新生态监测:快瞳科技如何用“智慧之眼”守护自然?
人工智能·科技
ModelWhale4 小时前
和鲸科技受邀赴中国气象局气象干部培训学院湖南分院开展 DeepSeek 趋势下的人工智能技术应用专题培训
人工智能·科技
Fansv5875 小时前
深度学习框架PyTorch——从入门到精通(3)数据集和数据加载器
人工智能·pytorch·深度学习
CYRUS_STUDIO5 小时前
Android 自定义变形 MD5 算法
android·算法·安全
menge23337 小时前
Python递归与递推的练习(初步了解复杂度,全排列的价值,奇妙的变换,数正方形,高塔登顶方案)
算法