支持向量机SVM的MATLAB分类预测实现

支持向量机(Support Vector Machine,SVM)是一种有监督的机器学习算法,广泛应用于分类和回归问题。

理论简介

线性可分SVM

原理 :对于线性可分的数据集,SVM的目标是找到一个超平面,能将不同类别的数据点尽可能分开,使两类数据点到超平面的距离最大化。这个超平面可以用方程,w是超平面法向量,b是偏置项

线性SVM(软间隔)

  • 原理 :当数据不是完全线性可分时,引入松弛变量,允许一些数据点在一定程度上违反间隔约束,目标是在最大化间隔和最小化分类错误之间找到平衡。

非线性SVM

原理 :对于非线性可分的数据,通过一个非线性映射将原始数据映射到一个高维特征空间,使得在高维空间中数据变得线性可分,然后在这个高维空间中应用线性SVM的方法。

决策函数

  • 原理:训练得到SVM模型后,用于对新数据进行分类的函数。

  • %% 清空环境变量
    clc % 清空命令行
    clear % 清空变量
    warning off % 关闭报警信息
    close all % 关闭开启的图窗
    %% 导入数据
    % res = xlsread('数据集.xlsx');
    res = xlsread('Long-Term Deflection of Reinforced Concrete Beams_New.xlsx');
    [Num, Dim] = size(res); % 获取数据样本点个数Num和变量维度Dim
    %% 划分训练集和测试集
    rng(2048)
    temp = randperm(Num);
    P_train = res(temp(1: round(Num0.8)), 1: Dim-1)'; % 80%用于训练
    T_train = res(temp(1: round(Num
    0.8)), Dim)'; % 80%用于训练
    M = size(P_train, 2); % 训练集样本点个数

    P_test = res(temp(round(Num0.8)+1: end), 1: Dim-1)'; % 20%用于测试
    T_test = res(temp(round(Num
    0.8)+1: end), Dim)'; % 20%用于测试
    N = size(P_test, 2); % 测试集样本点个数

    %% 数据归一化
    [p_train, ps_input] = mapminmax(P_train, 0, 1); % 训练集输入数据归一化到[0 1]之间
    p_test = mapminmax('apply', P_test, ps_input); % 测试集输入数据归一化

    [t_train, ps_output] = mapminmax(T_train, 0, 1); % 训练集输出数据归一化到[0 1]之间
    t_test = mapminmax('apply', T_test, ps_output); % 测试集输出数据归一化到[0 1]之间

    %% 转置以适应模型
    p_train = p_train'; p_test = p_test';
    t_train = t_train'; t_test = t_test';

    %% 创建模型
    c = 4.0; % 惩罚因子
    g = 0.8; % 径向基函数参数
    cmd = [' -t 2',' -c ',num2str(c),' -g ',num2str(g),' -s 3 -p 0.01'];
    model = svmtrain(t_train, p_train, cmd);

    %% 仿真预测
    [t_sim1, error_1] = svmpredict(t_train, p_train, model);
    [t_sim2, error_2] = svmpredict(t_test , p_test , model);

    %% 数据反归一化
    T_sim1 = mapminmax('reverse', t_sim1, ps_output);
    T_sim2 = mapminmax('reverse', t_sim2, ps_output);

    %% 均方根误差
    error1 = sqrt(sum((T_sim1' - T_train).^2) ./ M);
    error2 = sqrt(sum((T_sim2' - T_test ).^2) ./ N);

    %% 绘图
    figure
    plot(1: M, T_train, 'r-*', 1: M, T_sim1, 'b-o', 'LineWidth', 1)
    legend('真实值', '预测值')
    xlabel('预测样本')
    ylabel('预测结果')
    string = {'训练集预测结果对比'; ['RMSE=' num2str(error1)]};
    title(string)
    xlim([1, M])
    grid

    figure
    plot(1: N, T_test, 'r-*', 1: N, T_sim2, 'b-o', 'LineWidth', 1)
    legend('真实值', '预测值')
    xlabel('预测样本')
    ylabel('预测结果')
    string = {'测试集预测结果对比'; ['RMSE=' num2str(error2)]};
    title(string)
    xlim([1, N])
    grid

    %% 相关指标计算
    % R2
    R1 = 1 - norm(T_train - T_sim1')^2 / norm(T_train - mean(T_train))^2;
    R2 = 1 - norm(T_test - T_sim2')^2 / norm(T_test - mean(T_test ))^2;

    disp(['训练集数据的R2为:', num2str(R1)])
    disp(['测试集数据的R2为:', num2str(R2)])

    % MAE
    mae1 = sum(abs(T_sim1' - T_train)) ./ M ;
    mae2 = sum(abs(T_sim2' - T_test )) ./ N ;

    disp(['训练集数据的MAE为:', num2str(mae1)])
    disp(['测试集数据的MAE为:', num2str(mae2)])

    % MBE
    mbe1 = sum(T_sim1' - T_train) ./ M ;
    mbe2 = sum(T_sim2' - T_test ) ./ N ;

    disp(['训练集数据的MBE为:', num2str(mbe1)])
    disp(['测试集数据的MBE为:', num2str(mbe2)])

    %% 绘制散点图
    sz = 25;
    c = 'b';

    figure
    scatter(T_train, T_sim1, sz, c)
    hold on
    plot(xlim, ylim, '--k')
    xlabel('训练集真实值');
    ylabel('训练集预测值');
    xlim([min(T_train) max(T_train)])
    ylim([min(T_sim1) max(T_sim1)])
    title('训练集预测值 vs. 训练集真实值')

    figure
    scatter(T_test, T_sim2, sz, c)
    hold on
    plot(xlim, ylim, '--k')
    xlabel('测试集真实值');
    ylabel('测试集预测值');
    xlim([min(T_test) max(T_test)])
    ylim([min(T_sim2) max(T_sim2)])
    title('测试集预测值 vs. 测试集真实值')

相关推荐
蹦蹦跳跳真可爱5894 分钟前
Python----计算机视觉处理(Opencv:图片颜色识别:RGB颜色空间,HSV颜色空间,掩膜)
人工智能·python·opencv·计算机视觉
RamendeusStudio39 分钟前
5-29 有趣的指令Pix2Pix(P2P)
人工智能·gpt·ai·llm·stablediffusion·controlnet·ai agent
朴拙数科1 小时前
2025年AI搜索引擎开源项目全景指南:从核心框架到生态工具
人工智能·搜索引擎·开源
交响梦2 小时前
医院信息系统平台总体架构原则
大数据·数据库·人工智能·架构·健康医疗
微臣愚钝2 小时前
深度学习-简介
人工智能
tonngw2 小时前
TensorFlow 基本原理与使用场景
人工智能·python·tensorflow
Matrix_113 小时前
论文阅读:Deep Hybrid Camera Deblurring for Smartphone Cameras
人工智能·计算摄影
jndingxin3 小时前
OpenCV计算摄影学(21)非真实感渲染之边缘保留滤波器edgePreservingFilter()
人工智能·opencv·计算机视觉
美狐美颜sdk3 小时前
跨平台直播美颜SDK开发指南:如何兼容iOS、Android与Web
人工智能·深度学习·美颜sdk·视频美颜sdk·美颜api
Sheakan3 小时前
【NeurIPS 2024】LLM-ESR:用大语言模型破解序列推荐的长尾难题
人工智能·语言模型·自然语言处理