KNN实战-图像识别

数据说明

是在循环0-9的数字一直循环500次所得到的数据,然后以手写照片的形式存在

识别的步骤

  • 加载数据
  • 构建目标值
  • 构建模型
  • 参数调优
  • 可视化展示

加载数据

python 复制代码
import numpy as np
import matplotlib.pyplot as plt
# 记载数据
data = np.load('./digit.npy')
data

构建目标值

python 复制代码
# 构建基础的目标值
y = list(np.arange(0,10))*500
# 对生成的目标值进行排序,与图片的目标值进行对应
y.sort()
# 为了在拆分数据的时候可以正常拆分
y = np.array(y)

数据处理和数据拆分

数据处理

python 复制代码
X = data.reshape(5000,-1)
X.shape # 784:是图片的像素值 ,也就是图像的特征

数据拆分

python 复制代码
from sklearn.model_selection import train_test_split
X_tarin,X_test,y_train,y_test = train_test_split(X,y,# x,y的数据
test_size=0.05  # 验证集的占总数据的比重
,random_state=1024 # 随机数的种子)
display(X_tarin.shape,X_test.shape,y_train.shape,y_test.shape)

创建模型

python 复制代码
from sklearn.neighbors import KNeighborsClassifier
# 创建模型
model = KNeighborsClassifier(n_neighbors=5)
model.fit(X_tarin,y_train)
# 数据分数
model.score(X_test,y_test)

训练数据的结果的分数

参数调优

python 复制代码
%%time
from sklearn.model_selection import GridSearchCV
prams = dict(n_neighbors = [5,7,9,12,15,17,21,23,30],
             weights=['uniform','distance'],
             p=[1,2])
estimator = KNeighborsClassifier()
gCV = GridSearchCV(estimator,prams,cv=5,scoring='accuracy')
gCV.fit(X_tarin,y_train)

%%time:获取当前程序的运行时间

获取最佳参数

python 复制代码
gCV.best_params_

获取平均分数

py 复制代码
gCV.best_score_

获取最佳模型

py 复制代码
gCV.best_estimator_

数据的验证与预测

python 复制代码
best_model = gCV.best_estimator_
y_predict = gCV.predict(X_test)
print('测试值:',y_predict)
print('真实值:',y_test)
best_model.score(X_test,y_test)

得到的结果(在得分上看模型的质量还是有所提升的)

可视化

python 复制代码
plt.figure(figsize=(5*2,10*3))
for i in range(50):
    plt.subplot(10,5,i+1)
    plt.imshow(X_test[i].reshape(28,28))
    true = y_test[i]
    predict = y_predict[i]
    plt.title(f'true:{true}\n'+f'predict:{predict}')

坚持学习,整理复盘

相关推荐
360智汇云1 小时前
AI标注平台TLP:AI预标+人工精修,重塑数据标注效率
人工智能·深度学习·机器学习
落羽的落羽2 小时前
【算法札记】练习 | Week2
android·linux·服务器·c++·python·算法·机器学习
做cv的小昊2 小时前
【TJU】研究生应用统计学课程笔记(3)——第一章 数理统计的基本知识(1.4 正态总体的样本均值和样本方差的分布、1.5 充分统计量和完备统计量)
笔记·学习·线性代数·机器学习·数学建模·概率论
码农的神经元2 小时前
从零搭建一个带 GUI 的机器学习建模系统:多模型切换、遗传算法优化与可视化实战复盘
人工智能·机器学习
一楼的猫2 小时前
茄子小说AI辅助智能写作助手:10倍速创作神器
人工智能·学习·机器学习·学习方法·ai写作·迁移学习·集成学习
gjhave2 小时前
强化学习论文(Double-DQN)
人工智能·机器学习
MicroTech20252 小时前
融合残差结构的量子电路算法:MLGO微算法科技拓展量子机器学习频谱边界
科技·算法·机器学习
源码之家3 小时前
计算机毕业设计:Python农业数据分析与粮食产量预测系统 Django框架 数据分析 可视化 机器学习 深度学习 大数据 大模型(建议收藏)✅
python·机器学习·信息可视化·数据分析·django·flask·课程设计
MediaTea3 小时前
Scikit-learn:特征矩阵与目标变量
人工智能·python·机器学习·矩阵·scikit-learn
郝学胜-神的一滴3 小时前
深度学习入门:极简神经网络搭建与参数计算全攻略
人工智能·pytorch·python·深度学习·神经网络·机器学习