《Pytorch深度学习实践》ch8-多分类

------B站《刘二大人》

1.Softmax Layer

  • 在多分类问题中,输出的是每类的概率:
  • 计算公式:保证了每类概率大于 0 ,又由保证了概率之和为 1;
  • 举例如下:

2.Cross Entropy

  • 计算损失:
  • y = np.array([1, 0, 0]) :是目标标签的one-hot编码。假设有 3 个类别,这里表示正确的类别是第一个类别;
python 复制代码
import numpy as np
y = np.array([1, 0, 0])
z = np.array([0.2, 0.1, -0.1])
y_pred = np.exp(z) / np.exp(z).sum()
loss = (-y * np.log(y_pred)).sum()
print(loss) # 0.9729189131256584
  • 交叉熵损失函数:
  • y 是一个长度为 1 的长整型张量,是标签类别的 索引[0] 表示正确的类别是类别 0;
python 复制代码
import torch
y = torch.LongTensor([0])
z = torch.Tensor([[0.2, 0.1, -0.1]])
criterion = torch.nn.CrossEntropyLoss()
loss = criterion(z, y)
print(loss) # tensor(0.9729)
  • Mini - Batch
python 复制代码
import torch
criterion = torch.nn.CrossEntropyLoss()
Y = torch.LongTensor([2, 0, 1])

Y_pred1 = torch.Tensor([[0.1, 0.2, 0.9],
                        [1.1, 0.1, 0.2],
                        [0.2, 2.1, 0.1]])
Y_pred2 = torch.Tensor([[0.8, 0.2, 0.3],
                        [0.2, 0.3, 0.5],
                        [0.2, 0.2, 0.5]])

loss1 = criterion(Y_pred1, Y) # Batch Loss1 =  tensor(0.4966)
loss2 = criterion(Y_pred2, Y) # Batch Loss2 =  tensor(1.2389)
print('Batch Loss1 = ', loss1.data, '\nBatch Loss2 = ', loss2.data)

3.MNIST

  • 导包
python 复制代码
import torch
from torchvision import datasets
from torchvision import transforms
from torch.utils.data import DataLoader
import torch.nn.functional as F
import torch.optim as optim
  • 准备数据集
    • ToTensor():将图片转换为PyTorch的张量。
    • Normalize(mean, std):使用指定的均值和标准差对图片进行标准化。
python 复制代码
batch_size = 64

transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.1307, ), (0.3081, ))
])

train_dataset = datasets.MNIST('data/MNIST/', train=True, transform=transform, download=True)
train_loader = DataLoader(dataset=train_dataset, batch_size=batch_size, shuffle=True)

test_dataset = datasets.MNIST('data/MNIST/', train=False, transform=transform, download=True)
test_loader = DataLoader(dataset=test_dataset, batch_size=batch_size, shuffle=False)
  • 构造模型
    • 输入层:784个神经元(因为每张图片是28x28,展平后变成784维)。
    • 隐藏层:4个全连接层,神经元数量分别为512、256、128和64。
    • 输出层:10个神经元,分别对应数字0到9。
    • 最后一层不做激活,因为后面调用 torch.nn.CrossEntropyLoss。
python 复制代码
class Net(torch.nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.linear1 = torch.nn.Linear(784, 512)
        self.linear2 = torch.nn.Linear(512, 256)
        self.linear3 = torch.nn.Linear(256, 128)
        self.linear4 = torch.nn.Linear(128, 64)
        self.linear5 = torch.nn.Linear(64, 10)

    def forward(self, x):
        x = x.view(-1, 784)
        x = F.relu(self.linear1(x))
        x = F.relu(self.linear2(x))
        x = F.relu(self.linear3(x))
        x = F.relu(self.linear4(x))
        x = self.linear5(x) # 不用激活函数,因为 torch.nn.CrossEntropyLoss = softmax + nllloss
        return x
    
model = Net()
  • 损失与优化器
python 复制代码
criterion = torch.nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.5)
  • 训练与测试
    • torch.max:返回最大值和对应的下标。
    • dim=1,说明是在行的维度。 0是列,1是行。
python 复制代码
# training
def train(epoch):
    running_loss = 0.0
    for batch_idx, data in enumerate(train_loader, 0):
        inputs, target = data
        optimizer.zero_grad()

        outputs = model(inputs)
        loss = criterion(outputs, target)
        loss.backward()
        optimizer.step()

        running_loss += loss.item()

        if batch_idx % 300 == 299:
            print('[%d, %5d] loss: %.3f' % (epoch+1, batch_idx+1, running_loss/300))
            running_loss = 0.0

# test
def test():
    correct = 0
    total = 0
    with torch.no_grad():
        for data in test_loader:
            inputs, labels = data
            outputs = model(inputs)
            _, predicted = torch.max(outputs.data, dim=1)
            total += labels.size(0)
            correct += (predicted == labels).sum().item()
        print('Accuracy on test set: %d %%' %(100*correct/total))


if __name__ == '__main__':
    for epoch in range(10):
        train(epoch)
        if epoch % 10 == 0:
            test()
相关推荐
氵文大师12 分钟前
A机通过 python -m http.server 下载B机的文件
linux·开发语言·python·http
程序员爱钓鱼21 分钟前
用 Python 批量生成炫酷扫光 GIF 动效
后端·python·trae
封奚泽优23 分钟前
下降算法(Python实现)
开发语言·python·算法
java1234_小锋28 分钟前
基于Python深度学习的车辆车牌识别系统(PyTorch2卷积神经网络CNN+OpenCV4实现)视频教程 - 自定义字符图片数据集
python·深度学习·cnn·车牌识别
技术支持者python,php33 分钟前
训练模型,物体识别(opencv)
人工智能·opencv·计算机视觉
爱笑的眼睛1136 分钟前
深入理解MongoDB PyMongo API:从基础到高级实战
java·人工智能·python·ai
辣椒酱.42 分钟前
jupyter相关
python·jupyter
郝学胜-神的一滴1 小时前
Python中常见的内置类型
开发语言·python·程序人生·个人开发
软件开发技术深度爱好者1 小时前
基于多个大模型自己建造一个AI智能助手
人工智能
中國龍在廣州1 小时前
现在人工智能的研究路径可能走反了
人工智能·算法·搜索引擎·chatgpt·机器人