今天出一期基于CNN-SVM/LSSVM的手写数字识别。流程大致如下:
①采用CNN对MNIST数据集进行分类;
②采用CNN提取MNIST手写数字图片特征,然后采用SVM对提取到的特征进行分类;
③采用CNN提取MNIST手写数字图片特征,然后采用LSSVM对提取到的特征进行分类;
一、MNIST数据集简介
关于MNIST数据集在很多图像识别的论文中都会用到,是一个很经典的数据集。MNIST手写数据集包含70000个样本,每个样本为28×28像素的灰度图片,其中训练集有60000张图片,测试集有10000张。MNIST数据集下载地址是http://yann.lecun.com/exdb/mnist/,包含了4 个部分:
训练集:train-images-idx3-ubyte.gz (9.45 MB,包含60,000个样本)。
训练集标签:train-labels-idx1-ubyte.gz(28.2 KB,包含60,000个标签)。
测试集:t10k-images-idx3-ubyte.gz(1.57 MB ,包含10,000个样本)。
测试集标签:t10k-labels-idx1-ubyte.gz(4.43 KB,包含10,000个样本的标签)。
采用matlab代码处理MNIST数据集如下:
makefile
clear all;
close all;
clear
%% %% 原始数据有6万个训练集和1万个测试集,由于要对SVM进行优化,当数据太大时,
% 程序跑起来会很慢,因此随机抽取一些数据即可验证方法准确性
% 选取6000个训练集,和1000个测试集
N_sample = 6000;
N_test=1000;
XTrain = zeros(28,28,1,N_sample);
YTrain=zeros(N_sample,1);
fidimg1=fopen('train-images.idx3-ubyte','rb');
fidimg2=fopen('train-labels.idx1-ubyte','rb');
[img,count]=fread(fidimg1,16); % table head
[imgInd,count1]=fread(fidimg2,8); %table head
for k=1:N_sample
[im,~]=fread(fidimg1,[28,28]);
ind=fread(fidimg2,1);
XTrain(:,:,1,k)=im';
YTrain(k)=ind;
end
fclose(fidimg1);
fclose(fidimg2);
YTrain=categorical(YTrain);
XTest = zeros(28,28,1,N_test);
YTest=zeros(N_test,1);
fidimg1=fopen('t10k-images.idx3-ubyte','rb');
fidimg2=fopen('t10k-labels.idx1-ubyte','rb');
[img,count]=fread(fidimg1,16);
[imgInd,count1]=fread(fidimg2,8);
for k=1:N_test
[im,~]=fread(fidimg1,[28,28]);
ind=fread(fidimg2,1);
XTest(:,:,1,k)=im';
YTest(k)=ind;
end
fclose(fidimg1);
fclose(fidimg2);
YTest=categorical(YTest);
%% 图片可视化
% ........................图片可视化........................
%注意,原始样本训练集有6万个,这里只取前60个
for i = 1:60
img = XTrain(:,:,1,i);
subplot(6,10,i)
image(img);
ax=gca;
ax.XAxis.Visible='off';
ax.YAxis.Visible='off';
end
上述代码实现了对MINIST数据集的训练集与测试集划分,并选取部分图片进行可视化,可视化结果如下:
二、CNN分类结果
三、CNN-SVM分类结果
四、CNN-LSSVM分类结果
五、代码目录
以上提到的所有图片,代码均可运行出来。
代码获取
复制链接跳转:https://mbd.pub/o/bread/ZZibmZ5t
或者点击下方阅读原文跳转链接,