基于CNN-SVM/LSSVM的手写数字图像识别,MNIST数据集,MALAB代码实现

今天出一期基于CNN-SVM/LSSVM的手写数字识别。流程大致如下:

①采用CNN对MNIST数据集进行分类;

②采用CNN提取MNIST手写数字图片特征,然后采用SVM对提取到的特征进行分类;

③采用CNN提取MNIST手写数字图片特征,然后采用LSSVM对提取到的特征进行分类;

一、MNIST数据集简介

关于MNIST数据集在很多图像识别的论文中都会用到,是一个很经典的数据集。MNIST手写数据集包含70000个样本,每个样本为28×28像素的灰度图片,其中训练集有60000张图片,测试集有10000张。MNIST数据集下载地址是http://yann.lecun.com/exdb/mnist/,包含了4 个部分:

训练集:train-images-idx3-ubyte.gz (9.45 MB,包含60,000个样本)。

训练集标签:train-labels-idx1-ubyte.gz(28.2 KB,包含60,000个标签)。

测试集:t10k-images-idx3-ubyte.gz(1.57 MB ,包含10,000个样本)。

测试集标签:t10k-labels-idx1-ubyte.gz(4.43 KB,包含10,000个样本的标签)。

采用matlab代码处理MNIST数据集如下:

makefile 复制代码
clear all;
close all;
clear
%% %% 原始数据有6万个训练集和1万个测试集,由于要对SVM进行优化,当数据太大时,
% 程序跑起来会很慢,因此随机抽取一些数据即可验证方法准确性
% 选取6000个训练集,和1000个测试集
N_sample = 6000;
N_test=1000;
XTrain = zeros(28,28,1,N_sample);
YTrain=zeros(N_sample,1);


fidimg1=fopen('train-images.idx3-ubyte','rb');
fidimg2=fopen('train-labels.idx1-ubyte','rb');      


[img,count]=fread(fidimg1,16);   % table head
[imgInd,count1]=fread(fidimg2,8);   %table head
for k=1:N_sample    
    [im,~]=fread(fidimg1,[28,28]);
    ind=fread(fidimg2,1);
    XTrain(:,:,1,k)=im';
    YTrain(k)=ind;
end
fclose(fidimg1);
fclose(fidimg2);
YTrain=categorical(YTrain);


XTest = zeros(28,28,1,N_test);
YTest=zeros(N_test,1);
fidimg1=fopen('t10k-images.idx3-ubyte','rb');
fidimg2=fopen('t10k-labels.idx1-ubyte','rb');


[img,count]=fread(fidimg1,16);
[imgInd,count1]=fread(fidimg2,8);
for k=1:N_test    
    [im,~]=fread(fidimg1,[28,28]);
    ind=fread(fidimg2,1);
    XTest(:,:,1,k)=im';
    YTest(k)=ind;
end
fclose(fidimg1);
fclose(fidimg2);
YTest=categorical(YTest);


%% 图片可视化
% ........................图片可视化........................
%注意,原始样本训练集有6万个,这里只取前60个
for i = 1:60
    img = XTrain(:,:,1,i);
    subplot(6,10,i)
    image(img);
    ax=gca;
    ax.XAxis.Visible='off';
    ax.YAxis.Visible='off';
end

上述代码实现了对MINIST数据集的训练集与测试集划分,并选取部分图片进行可视化,可视化结果如下:

二、CNN分类结果

三、CNN-SVM分类结果

四、CNN-LSSVM分类结果

五、代码目录

以上提到的所有图片,代码均可运行出来。

代码获取

复制链接跳转:https://mbd.pub/o/bread/ZZibmZ5t

或者点击下方阅读原文跳转链接,

相关推荐
shuououo35 分钟前
YOLOv4 核心内容笔记
人工智能·计算机视觉·目标跟踪
我搞slam4 小时前
快乐数--leetcode
算法·leetcode·哈希算法
DO_Community4 小时前
普通服务器都能跑:深入了解 Qwen3-Next-80B-A3B-Instruct
人工智能·开源·llm·大语言模型·qwen
WWZZ20254 小时前
快速上手大模型:机器学习3(多元线性回归及梯度、向量化、正规方程)
人工智能·算法·机器学习·机器人·slam·具身感知
deephub5 小时前
深入BERT内核:用数学解密掩码语言模型的工作原理
人工智能·深度学习·语言模型·bert·transformer
PKNLP5 小时前
BERT系列模型
人工智能·深度学习·bert
兰亭妙微5 小时前
ui设计公司审美积累 | 金融人工智能与用户体验 用户界面仪表盘设计
人工智能·金融·ux
东方佑5 小时前
从字符串中提取重复子串的Python算法解析
windows·python·算法
西阳未落6 小时前
LeetCode——二分(进阶)
算法·leetcode·职场和发展
通信小呆呆6 小时前
以矩阵视角统一理解:外积、Kronecker 积与 Khatri–Rao 积(含MATLAB可视化)
线性代数·算法·matlab·矩阵·信号处理