pytorch基础神经网络构建

www.ai-xlab.com
AI MOOC
Torch介绍
Torch是一个开源的机器学习的框架，早在2002年就发
布了Torch的初版，Torch的编程语言为C和Lua。如今
的Torch7依旧是热门的深度学习框架之一。 www.ai-xlab.com
AI MOOC
PyTorch介绍
PyTorch是在2017年1月由Facebook推出的。它是经
典机器学习库Torch框架的一个端口，主要编程语言为
python。
PyTorch"曾经"的优点是动态图
PyTorch现在的优点是开源代码和开源社区 www.ai-xlab.com
AI MOOC
各种深度学习框架介绍
Torch： 2002年发布，早期的机器学习框架。
Theano： 2008年开发，第一个影响力较大的python深度学习框架。
CNTK： 2016年1月由微软公司开源，在语音领域效果比较突出。
TensorFlow： 2015年11月Google开源，目前最热门深度学习框架之一。
Keras：以Theano/Tensorflow/CNTK作为底层，最容易使用的深度学习框架。
Caffe/Caffe2: 2013年开源的C++深度学习框架，曾经计算机视觉领域的王者。
MXNet： 2015年发布，AWS云计算的官方深度学习平台。
Paddle： 2016年8月开源的百度深度学习框架。
PyTorch： 2017年开源，Torch的python版本，目前最有潜力，最热门的深度学
习框架之一。 www.ai-xlab.com
AI MOOC
安装 url PyTorch PyTorch
www.ai-xlab.com
AI MOOC
MNIST数据集介绍
2 www.ai-xlab.com
AI MOOC
MNIST数据集
MNIST数据集官网： Yann LeCun's Website
下载下来的数据集被分成两部分：60000行的训练数据集（mnist.train）和
10000行的测试数据集（mnist.test） www.ai-xlab.com
AI MOOC
MNIST的数据
一张图片包含28*28个像素，我们把这一个数组展开成一个向量，长度是28*28=784。
如果把数据用矩阵表示，可以把MNIST训练数据变成一个形状为 [60000, 784] 的矩阵，
第一个维度数字用来索引图片，第二个维度数字用来索引每张图片中的像素点。图片里
的某个像素的强度值介于0-1之间。 www.ai-xlab.com
AI MOOC
MNIST的数据 www.ai-xlab.com
AI MOOC
独热编码（one-hot）
• MNIST数据集的标签是介于0-9的数字，我们要把标签转化为"one-hot
vectors"。一个one-hot向量除了某一位数字是1以外，其余维度数字都是0，
比如标签0将表示为([1,0,0,0,0,0,0,0,0,0])，标签3将表示为
([0,0,0,1,0,0,0,0,0,0]) 。
• 因此，可以把MNIST训练集的标签变为 [60000, 10] 的矩阵。 www.ai-xlab.com
AI MOOC
Softmax函数介绍
3 www.ai-xlab.com
AI MOOC
Softmax激活函数
在多分类问题中，我们通常会使用softmax函数作为网络输出层的激活函数，
softmax函数可以对输出值进行归一化操作，把所有输出值都转化为概率，所有概率
值加起来等于1，softmax的公式为：
𝑠𝑜𝑓𝑡𝑚𝑎𝑥(𝑥ሻ 𝑖 =
ሻ
ex p( 𝑥
𝑖
σ 𝑗
൯
ex p( 𝑥
𝑗 www.ai-xlab.com
AI MOOC
Softmax计算例子
例如某个神经网络有3个输出值，为[1,5,3]。
计算e1=2.718，e5=148.413，e3=20.086，e1+e5+e3=171.217。
p1 = 𝑒
1
𝑒 1 +
𝑒
5 +𝑒 3 = 0.016 ， p2 = 𝑒
5
𝑒 1 +
𝑒
5 +𝑒 3 = 0.867 ， p3 = 𝑒
3
𝑒 1 +
𝑒
5 +𝑒 3 = 0.117 。
所以加上softmax函数后数值变成了[0.016,0.867,0.117]。
例如手写数字识别的网络最后的输出结果本来是:

h t 是当前输出，接收 [h t−1 ,
෨
ℎ
𝑡 ] www.ai-xlab.com
AI MOOC
其他RNN模型
6 www.ai-xlab.com
AI MOOC
双向RNN(Bidirectional RNNs)
双向的 RNN 是同时考虑"过去"和"未来"的信息，输入（黑色点）沿着黑色的实线箭
头传输到隐层（黄色点），再沿着红色实线传到输出（红色点）。黑色实线做完前向传播
后，在 Bidirectional RNNs 却先不急着后向传播，而是从末尾的时刻沿着虚线的方向再回
传回来。 www.ai-xlab.com
AI MOOC
Stacked Bidirectional RNNs
图中是双向的三层 RNNs，堆叠多层的RNN网络，可以增加模型的参数，提高模型的拟合
能力。每层的 hidden state 不仅要输给下一时刻，还是当做是此时刻下一层的输入。 www.ai-xlab.com
AI MOOC
THANKS

pytorch基础 神经网络构建

pytorch基础神经网络构建