手写数字识别(KNN算法)

一、预备知识

图像灰度化

1.图像灰度化简单来说就是让图像像素点矩阵中的每一个像素点都满足下面的关系R=G=B(这3个值相等),此时的这个值叫作灰度值。这样每个像素点的颜色不需要用3个值来表示、只需用一个灰度值表示就可以了,这不仅能大大减少计算量,而且能保留相息。PI库提供了图像切片、旋转、差值、滤波和写文字等许多功能。PIL库在Python3.x中已是标准库,可以通过以下命令安装。

复制代码
pip3 install pillow

2.以数字8为例,将图片8进行图像灰度化

python 复制代码
from PIL import Image
img=Image.open(r'c:/workcode/data3/8.jpeg')
#img=img.resize((80,80),Image.ANTIALIAS)
img=img.resize((80,80),Image.LANCZOS)
img=img.convert('L')
img.show()
img.save(r'c:/workcode/data3/8.png')

二、将数字图像信息转化为TXT文件

1.导入相关的库

2.定义转换函数 imgtotext

本函数首先将含有数字的图像进行缩放和灰度化处理,然后对图像逐行扫描,按每个像素点的像素灰度值大小将其转换成0或者1,转换规则如下。

(1)大于等于128:转换成0(表示白色)。

(2)小于128:转换成1(表示黑色)。

最后将转换后的字符串数据写人 TXT 文件,完成函数的转换操作。源代码如下

3.调用函数生成TXT文件

python 复制代码
#导入相关的库
import os
from PIL import Image
#定义转换函数
def imgtotext(imgfile,txtfile,size=(32,32)):
#imgfile 待识别图像,txtfile 将图像转换为txt 文件输出,size 图像大小,默认 32*32
    image_file = Image.open(imgfile)
    image_file =image_file.resize(size,Image.LANCZOS)
    image_file=image_file.convert('L')
    width,height=image_file.size
    f =open(txtfile,'w')
    ascii_char='10'
    for i in range (height):
        pix_char='';
        for j in range(width):
            pixel=image_file.getpixel((j,i))
            pix_char+=ascii_char[int(pixel/128)]
        pix_char+='\n'
        f.write(pix_char)
    f.close()
#调用函数生成TXT文件,将图片转换成文本信息
imgtotext(r'c:/workcode/data3/8.png',r'c:/workcode/data3/8_0.txt')

三、批量生成样本数据,构建训练KNN模型并评估模型效果

总代码

python 复制代码
import numpy as np
import os
import matplotlib.pyplot as plt
from sklearn.neighbors import  KNeighborsClassifier
import pandas as pd
from sklearn.metrics import classification_report
from sklearn.metrics import confusion_matrix
#定义函数,将文本数据转换成数字形式的数组
def txt2array(filename):
    X=np.zeros((1,1024))
    f = open(filename)#
    for i in range(32):
        lineStr =f.readline()
        for j in range(32):
            X[0,32*i+j]= int(lineStr[j])
    return X
#将文件夹下所的文件转换成数组和对应的标签
def convert2dataset(file_path):
    list_file=os.listdir(file_path)
    m=len(list_file)
    datas=np.zeros((m,1024))
    labels=[]
    for i in range (m):
        num=int(list_file[i][0])
        labels.append(num)
        datas[i,:]=txt2array(file_path+'\\'+list_file[i])
        print(datas)
    return datas,labels
                            
x_train,y_train=convert2dataset(r'c:/workcode/data3/trainingDigits')
x_test,y_test=convert2dataset(r'c:/workcode/data3/testDigits')


knn= KNeighborsClassifier(n_neighbors=3,weights='distance' ,p=2)

knn.fit(x_train,y_train)
knn.score(x_train,y_train)


y_pred=knn.predict(x_test)
print(classification_report(y_test,y_pred))

i=y_test.index(8)
for j in range(1):
     if(y_test[j+i]!=y_pred[j+i]):
          print('{}[{}]->{}'.format(y_test[j+i],j,y_pred[j+i]))


y_test=np.array(y_test)
confusion_matrix(y_test,y_pred)
pd.crosstab(y_test,y_pred,rownames=['真实值'],colnames=['预测值'],margins=True)

1.定义一个样本的数据转换函数

定义函数 txt2array,将一个 TXT 文件数据转换成数值类型的数组

ini 复制代码
def txt2array(filename):
    X=np.zeros((1,1024))
    f = open(filename)#
    for i in range(32):
        lineStr =f.readline()
        for j in range(32):
            X[0,32*i+j]= int(lineStr[j])
    return X

2.生成所有样本的特征值和标签值

ini 复制代码
def convert2dataset(file_path):
    list_file=os.listdir(file_path)
    m=len(list_file)
    datas=np.zeros((m,1024))
    labels=[]
    for i in range (m):
        num=int(list_file[i][0])
        labels.append(num)
        datas[i,:]=txt2array(file_path+'\\'+list_file[i])
        print(datas)
    return datas,labels

所有的训练样本数据和测试样本数据分别保存在tainingDigits、testDigits 文件夹下因此需要定义一个函数convert2dataset,将文件夹下所有的TXT 文件转换成样本的特征值及对应的标签值。

3.生成训练样本数据和测试样本数据

python 复制代码
x_train,y_train=convert2dataset(r'c:/workcode/data3/trainingDigits')
x_test,y_test=convert2dataset(r'c:/workcode/data3/testDigits')

4.构建KNN模型

(1)导入KNN类

javascript 复制代码
from sklearn.neighbors import  KNeighborsClassifier

(2)构建分类模型

ini 复制代码
knn= KNeighborsClassifier(n_neighbors=3,weights='distance' ,p=2)

5.训练KNN模型

(1)用训练集x_train、y_train来训练模型

scss 复制代码
knn.fit(x_train,y_train)

(2)对训练后的模型进行评估

scss 复制代码
knn.score(x_train,y_train)

6.评估模型效果 (1)测试模型性能

scss 复制代码
from sklearn.metrics import classification_report
y_pred=knn.predict(x_test)
print(classification_report(y_test,y_pred))

i=y_test.index(8)
for j in range(1):
     if(y_test[j+i]!=y_pred[j+i]):
          print('{}[{}]->{}'.format(y_test[j+i],j,y_pred[j+i]))

(2)通过交叉表了解模型的错分情况

ini 复制代码
from sklearn.metrics import confusion_matrix

y_test=np.array(y_test)
confusion_matrix(y_test,y_pred)
pd.crosstab(y_test,y_pred,rownames=['真实值'],colnames=['预测值'],margins=True)
相关推荐
三道杠卷胡几秒前
【AI News | 20250411】每日AI进展
人工智能·python·计算机视觉·语言模型·aigc
汪子熙3 分钟前
利用 Trae 开发平面直角坐标系的教学动画
人工智能·trae
区块链蓝海6 分钟前
Cables 现已正式启动积分计划 Alpha 阶段,开放早期白名单申请
人工智能·区块链
新加坡内哥谈技术27 分钟前
OpenAI即将上线新一代重磅选手——GPT-4.1
人工智能·深度学习·语言模型·自然语言处理·自动化
Rany-27 分钟前
市政消防栓智能监控管理系统(Axure高保真原型)
人工智能·经验分享·学习方法
扉间79842 分钟前
利用 RNN 预测股票价格:从数据处理到可视化实战
人工智能·rnn·深度学习
x-cmd1 小时前
[250411] Meta 发布 Llama 4 系列 AI 模型 | Rust 1.86 引入重大语言特性
人工智能·rust·llama
数信云 DCloud1 小时前
通付盾风控智能体(RiskAgent): 神烦狗(DOGE)
人工智能·ai
稳稳C91 小时前
Google A2A协议,是为了战略性占领标准?
人工智能·google·agent·mcp·a2a
AIbase20241 小时前
国内MCP服务有哪些?MCP服务器搜索引擎哪家好?
人工智能·ai导航站