【深度学习】不管理论,入门从手写数字识别开始

1. 环境安装

学习深度学习,开发语言是Python。Python开发工具有很多。其中 anaconda + vscode的Python开发环境很好用,建议使用这个组合。

编写手写数字识别测试代码,需要在使用Anaconda安装以下4个库:

  • Numpy
  • Scipy
  • matplotlib
  • scikit-learn

2. 手写数字识别

我觉得不管看不看得懂理论,至少要把代码敲一遍。

手写数字识别是最经典和入门的深度学习编程案例,一定要自己亲自敲一遍,每一行都要弄懂在做什么。

下面是贴上我写的代码和注释。

python 复制代码
import numpy as np
from sklearn.datasets import load_digits
from sklearn.neural_network import MLPClassifier

# 加载数据集
d = load_digits()
digits = d["data"]
labels = d["target"]

N = 200

# 打乱数据集的顺序
sorted_idxes = np.argsort(np.random.random(len(labels)))

# 取出前N个作为测试数据
test_key, test_value = digits[sorted_idxes[:N]], labels[sorted_idxes[:N]]

# 后面的数据作为训练数据
train_key, train_value = digits[sorted_idxes[N:]], labels[sorted_idxes[N:]]

# 分类,也就是神经网络训练
clf = MLPClassifier(hidden_layer_sizes=(128,)) 
clf.fit(test_key, test_value)

# 模型评估
score = clf.score(test_key, test_value) # 计算测试集准确率,这个函数会调用predict获取预测结果,再和答案做比较,计算出得分。

# 预测
predict_value = clf.predict(test_key) # 生成预测结果,这一步其实上一步已经做过了,这里是为了计算偏差才重新算一次

# 计算偏差
err = np.where(test_value != predict_value)[0]

# 打印结果
print("socre:", score)
print("errors:", err)
print(" actual:", test_value[err])
print(" predicted:",  predict_value[err])

3. 总结

通过第一个深度学习案例,能够总体掌握代码结构和流程。理论虽然还差很多,但是大体上能够对深度学习有大概的印象。深度学习大体上做的事情,就是从已有数据中发现规律,利用这个规律,再对新的输入数据进行响应,由经验数据预测/计算出新的结果。当已有数据非常非常多的时候,预测/计算的准确率理论上来说应该会越来越高,但是能够达到100%?我觉得只能是逼近100%,做不到100%。

相关推荐
淘源码d2 小时前
自然语言处理+知识图谱:智能导诊的“大脑”是如何工作的?
人工智能·自然语言处理·知识图谱·智能导诊
安达发4 小时前
安达发|高效智能塑料切割数控系统 - 全自动化软件解决方案
大数据·运维·人工智能·自动化·aps排产软件·智能优化排产软件
资讯分享周6 小时前
数字中国浪潮下:Coremail AI赋能邮件办公,筑牢安全防线引领转型
人工智能·安全
蜡笔小电芯6 小时前
【OpenCV】第一章——基础知识
人工智能·opencv·计算机视觉
jndingxin6 小时前
OpenCV 图形API(71)图像与通道拼接函数-----从图像(GMat)中裁剪出一个矩形区域的操作函数 crop()
人工智能·opencv·计算机视觉
亚图跨际7 小时前
大脑、机器人与贝叶斯信念及AI推理
人工智能·机器人
MonkeyKing_sunyuhua7 小时前
6.1 客户服务:智能客服与自动化支持系统的构建
人工智能·agent
啊阿狸不会拉杆8 小时前
人工智能数学基础(三):微积分初步
人工智能·python·算法·数学建模
蜂耘8 小时前
面向人工智能、量子科技、人形机器人等产业,山东启动制造业创新中心培育认定
人工智能·科技·机器人
深眸财经9 小时前
业绩回暖、股价承压,三只松鼠赴港上市能否重构价值锚点?
人工智能