手写数字可视化_Python数据分析与可视化

手写数字可视化

手写数字

手写数字无论是在数据可视化还是深度学习都是一个比较实用的案例。

数据在sklearn中,包含近2000份8 x 8的手写数字缩略图。

首先需要先下载数据,然后使用plt.imshow()对一些图形进行可视化:


打开cmd命令窗口,输入pip install scikit-learn
(sklearn包被启用了,要用scikit-learn包)


然后在jupyter notebook中输入以下代码

python 复制代码
from sklearn.datasets import load_digits
import matplotlib.pyplot as plt

digits = load_digits(n_class=6)
fig, ax = plt.subplots(8, 8, figsize=(6, 6))
for i, axi in enumerate(ax.flat):
    axi.imshow(digits.images[i], cmap='binary')
    axi.set(xticks=[], yticks=[])

plt.show()

输出图

总体


流形学习

由于每个数字都由64像素的色相构成,因此可以将每个数字看成是一个位于64维空间的点,即每个维度表示一个像素的亮度。但是想通过可视化来描述如此高维度的空间是非常困难的。

一种解决方案是通过降维技术,在尽量保留数据内部重要关联性的同时降低数据的维度,例如流形学习。

下面展示如何用流形学习将这些数据投影到二维空间进行可视化:

python 复制代码
from sklearn.datasets import load_digits
from sklearn.manifold import Isomap
iso = Isomap(n_components=2)
digits = load_digits(n_class=6)
projection = iso.fit_transform(digits.data)
plt.scatter(projection[:, 0], projection[:, 1], lw=0.1,
c=digits.target, cmap=plt.cm.get_cmap('cubehelix', 6))
plt.colorbar(ticks=range(6), label='digit value')
plt.clim(-0.5, 5.5)

输出结果

总体

上面使用了离散型颜色条来显示结果,调整ticks和clim参数来改善颜色条。这个结果向我们展示了一些数据集的有趣特性。

例如数字5与数字3在投影中有大面积重叠,说明一些手写的5与3难以区分,因此自动分类算法也更容易搞混它们。其它的数字,像数字0与数字1,隔得特别远,说明两者不太可能出现混淆。

相关推荐
程序猿零零漆几秒前
Python 基础核心知识总结:函数、文件操作、异常、模块与常用内置模块
python
星栈独行4 分钟前
用 Rust + Makepad 做一个 JSON 查看器:从零到能用的全过程
开发语言·程序人生·ui·rust·json
咸鱼翻身小阿橙4 分钟前
VS2008 C# WinForm 简易计算器
开发语言·c#
189228048618 分钟前
NV091固态MT29F16T08EWLCHD8-QJES:C
c语言·开发语言
枫叶林FYL9 分钟前
项目十一:Saga模式分布式旅行预订系统 核心服务实现与Saga编排器
数据库·python·docker
流浪法师解剖鱼10 分钟前
CocosCreator制作推箱子游戏
python·cocos2d
杨了个杨898212 分钟前
Dockerfile介绍及镜像制作
java·开发语言
AI科技星14 分钟前
《数术工坊:无穷套娃录》 一部用数学套娃写成的“天书小说”
c语言·开发语言·网络·量子计算·agi
阿正的梦工坊15 分钟前
【Rust】01-认识 Rust:语言定位、工具链与第一个程序
开发语言·后端·rust
EQUINOX115 分钟前
【论文阅读】| ViT精读
论文阅读·人工智能·深度学习·机器学习