2025三掌柜赠书活动第一期:动手学深度学习(PyTorch版)

目录

目录

目录

前言

深度学习基础

1、深度学习简介

2、PyTorch安装与配置

3、张量与自动微分

线性回归

1、线性回归简介

2、PyTorch实现线性回归

多层感知机

1、多层感知机(MLP)简介

2、PyTorch实现MLP

关于《动手学深度学习(PyTorch版)》

编辑推荐

内容简介

作者简介

1、作者简介

2、译者简介

图书目录

《动手学深度学习(PyTorch版)》全书速览

拓展:同款推荐

1、深度学习高手笔记系列

2、破解深度学习系列

结束语


前言

人工智能是引领未来发展的战略性技术,是新一轮科技革命和产业变革的重要驱动力量。深度学习作为机器学习的一个分支,近年来在图像识别、自然语言处理、游戏智能等领域取得了显著的进展。PyTorch,作为一个开源的深度学习框架,因其动态计算图、易用性和灵活性而受到广泛欢迎。那么本文就来详细介绍如何使用PyTorch进行深度学习,包括基础概念、核心API和实际代码示例,旨在帮助大家快速上手深度学习项目。

深度学习基础

先来深度了解一番关于深度学习的相关基础理论内容。

1、深度学习简介

关于深度学习的概念,其实深度学习通过构建多层神经网络模拟人脑处理信息的方式,以识别模式和特征。

2、PyTorch安装与配置

在开始之前,需要安装PyTorch,并配置开发环境。

3、张量与自动微分

PyTorch中的张量是多维数组,自动微分是PyTorch的核心特性之一,张量的基本操作和自动微分的工作原理。

线性回归

接着再来介绍关于线性回归相关的内容。

1、线性回归简介

线性回归是最简单的机器学习模型之一,用于预测连续值,通过PyTorch实现线性回归模型,并介绍训练和评估过程。

2、PyTorch实现线性回归

这里举一个简单的关于通过PyTorch实现线性回归的示例,具体如下所示:

import torch
import torch.nn as nn

# 定义线性回归模型
class LinearRegressionModel(nn.Module):
    def __init__(self):
        super(LinearRegressionModel, self).__init__()
        self.linear = nn.Linear(1, 1)

    def forward(self, x):
        return self.linear(x)

# 实例化模型、定义损失函数和优化器
model = LinearRegressionModel()
criterion = nn.MSELoss()
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)

# 训练模型
for epoch in range(100):
    model.train()
    optimizer.zero_grad()
    outputs = model(torch.randn(10, 1))
    labels = torch.randn(10, 1)
    loss = criterion(outputs, labels)
    loss.backward()
    optimizer.step()
    print(f'Epoch {epoch+1}, Loss: {loss.item()}')

多层感知机

再来介绍一下多层感知机相关的内容。

1、多层感知机(MLP)简介

其实多层感知机,就是通过增加隐藏层提高了模型的非线性拟合能力。

2、PyTorch实现MLP

同样的,这里介绍一个通过PyTorch实现MLP的简单示例,具体如下所示:

class MLPModel(nn.Module):
    def __init__(self):
        super(MLPModel, self).__init__()
        self.layer1 = nn.Linear(784, 256)
        self.relu = nn.ReLU()
        self.layer2 = nn.Linear(256, 10)

    def forward(self, x):
        x = self.relu(self.layer1(x))
        x = self.layer2(x)
        return x

# 实例化模型、定义损失函数和优化器
model = MLPModel()
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.SGD(model.parameters(), lr=0.1)

# 训练模型
for epoch in range(10):
    model.train()
    optimizer.zero_grad()
    outputs = model(torch.randn(32, 784))
    labels = torch.randint(0, 10, (32,))
    loss = criterion(outputs, labels)
    loss.backward()
    optimizer.step()
    print(f'Epoch {epoch+1}, Loss: {loss.item()}')

关于《动手学深度学习(PyTorch版)》

接下来给大家推荐一本关于深度学习的书籍,这是一本关于如何动手学深度学习的干货图书,一经上市就登上了当当"计算机与互联网"图书排行榜前列。本书从深度学习原理剖析讲起到实战技巧,帮助大家在深度学习领域更好的学习和使用!另外,关注本文博主,点赞+收藏本文,且在本文评论区评论"动手学深度学习",将选取三名幸运读者送出纸质版《动手学深度学习(PyTorch版)》一本,截止时间:2025.01.09。入手《动手学深度学习(PyTorch版)》传送门:https://item.jd.com/13628339.html或者《动手学深度学习 PyTorch版 人民邮电出版社》 【简介_书评_在线阅读】 - 当当 - 文轩网旗舰店,个人觉得这本书非常的不错,是一本不可多得的好书,值得拥有去学习。年薪30W!这本书真心建议深度学习人冲一冲,工资高、前景好!

编辑推荐

适读人群 :本书同时覆盖深度学习的方法和实践,主要面向在校大学生、技术人员和研究人员。阅读本书需要读者了解基本的Python编程或附录中描述的线性代数、微分和概率基础。

·深度学习领域重磅作品《动手学深度学习》重磅推出PyTorch版本;

·李沐、阿斯顿·张等大咖作者强强联合,精心编撰;

·全球400多所大学采用的教科书,提供视频课程、教学PPT、习题,方便教师授课与学生自学;

·能运行、可讨论的深度学习入门书,可在线运行源码并与作译者实时讨论。

内容简介

本书是《动手学深度学习》的重磅升级版本,选用经典的PyTorch深度学习框架,旨在向读者交付更为便捷的有关深度学习的交互式学习体验。

本书重新修订《动手学深度学习》的所有内容,并针对技术的发展,新增注意力机制、预训练等内容。本书包含15章,第一部分介绍深度学习的基础知识和预备知识,并由线性模型引出最简单的神经网络------多层感知机;第二部分阐述深度学习计算的关键组件、卷积神经网络、循环神经网络、注意力机制等大多数现代深度学习应用背后的基本工具;第三部分讨论深度学习中常用的优化算法和影响深度学习计算性能的重要因素,并分别列举深度学习在计算机视觉和自然语言处理中的重要应用。

本书同时覆盖深度学习的方法和实践,主要面向在校大学生、技术人员和研究人员。阅读本书需要读者了解基本的Python编程知识及预备知识中描述的线性代数、微分和概率等基础知识。

作者简介

1、作者简介

阿斯顿.张(Aston Zhang),亚马逊资深科学家,美国伊利诺伊大学香槟分校计算机科学博士,统计学和计算机科学双硕士。他专注于机器学习和自然语言处理的研究,荣获深度学习国际顶级学术会议ICLR杰出论文奖、ACM UbiComp杰出论文奖以及ACM SenSys最佳论文奖提名。他担任过EMNLP领域主席和AAAI资深程序委员。

扎卡里.C. 立顿(Zachary C. Lipton),美国卡内基梅隆大学机器学习和运筹学助理教授,并在海因茨公共政策学院以及软件和社会系统系担任礼节性任命。他领导着近似正确机器智能(ACMI)实验室,研究涉及核心机器学习方法、其社会影响以及包括临床医学和自然语言处理在内的各种应用领域。他目前的研究重点包括处理各种因果结构下分布变化的稳健和自适应算法、超越预测为决策提供信息(包括应对已部署模型的战略响应)、医学诊断和预后预测、算法公平性和可解释性的基础。他是"Approximately Correct"博客的创始人,也是讽刺性漫画"Superheroes of Deep Learning"的合著者。

李沐(Mu Li),亚马逊资深首席科学家(Senior Principal Scientist),美国加利福尼亚大学伯克利分校、斯坦福大学客座助理教授,美国卡内基梅隆大学计算机系博士。他曾任机器学习创业公司Marianas Labs的CTO和百度深度学习研究院的主任研发架构师。他专注于机器学习系统和机器学习算法的研究。他在理论与应用、机器学习与操作系统等多个领域的顶级学术会议上发表过论文,被引用上万次。

亚历山大.J. 斯莫拉(Alexander J. Smola),亚马逊副总裁/杰出科学家,德国柏林工业大学计算机科学博士。他曾在澳大利亚国立大学、美国加利福尼亚大学伯克利分校和卡内基梅隆大学任教。他发表过超过300篇学术论文,并著有5本书,其论文及书被引用超过15万次。他的研究兴趣包括深度学习、贝叶斯非参数、核方法、统计建模和可扩展算法。

2、译者简介

何孝霆(Xiaoting He),亚马逊应用科学家,中国科学院软件工程硕士。他专注于对深度学习的研究,特别是自然语言处理的应用(包括语言模型、AIOps、OCR),相关工作落地于众多企业。他担任过ACL、EMNLP、NAACL、EACL等学术会议的程序委员或审稿人。

瑞潮儿.胡(Rachel Hu),亚马逊应用科学家,美国加利福尼亚大学伯克利分校统计学硕士,加拿大滑铁卢大学数学学士。她致力于将机器学习应用于现实世界的产品。她也是亚马逊人工智能团队的讲师,教授自然语言处理、计算机视觉和机器学习商业应用等课程。她已向累计1000余名亚马逊工程师教授机器学习,其公开课程视频在YouTube和哔哩哔哩上广受好评。

图书目录

对本书的赞誉

前言

译者简介

学习环境配置

资源与支持

主要符号表

第 1章 引言 1

1.1 日常生活中的机器学习 2

1.2 机器学习中的关键组件 3

1.2.1 数据 3

1.2.2 模型 4

1.2.3 目标函数 4

1.2.4 优化算法 5

1.3 各种机器学习问题 5

1.3.1 监督学习 5

1.3.2 无监督学习 11

1.3.3 与环境互动 11

1.3.4 强化学习 12

1.4 起源 13

1.5 深度学习的发展 15

1.6 深度学习的成功案例 16

1.7 特点 17

第 2章 预备知识 20

2.1 数据操作 20

2.1.1 入门 21

2.1.2 运算符 22

2.1.3 广播机制 23

2.1.4 索引和切片 24

2.1.5 节省内存 24

2.1.6 转换为其他Python对象 25

2.2 数据预处理 26

2.2.1 读取数据集 26

2.2.2 处理缺失值 26

2.2.3 转换为张量格式 27

2.3 线性代数 27

2.3.1 标量 28

2.3.2 向量 28

2.3.3 矩阵 29

2.3.4 张量 30

2.3.5 张量算法的基本性质 31

2.3.6 降维 32

2.3.7 点积 33

2.3.8 矩阵-向量积 33

2.3.9 矩阵-矩阵乘法 34

2.3.10 范数 35

2.3.11 关于线性代数的更多信息 36

2.4 微积分 37

2.4.1 导数和微分 37

2.4.2 偏导数 40

2.4.3 梯度 41

2.4.4 链式法则 41

2.5 自动微分 42

2.5.1 一个简单的例子 42

2.5.2 非标量变量的反向传播 43

2.5.3 分离计算 43

2.5.4 Python控制流的梯度计算 44

2.6 概率 44

2.6.1 基本概率论 45

2.6.2 处理多个随机变量 48

2.6.3 期望和方差 50

2.7 查阅文档 51

2.7.1 查找模块中的所有函数和类 51

2.7.2 查找特定函数和类的用法 52

第3章 线性神经网络 54

3.1 线性回归 54

3.1.1 线性回归的基本元素 54

3.1.2 向量化加速 57

3.1.3 正态分布与平方损失 58

3.1.4 从线性回归到深度网络 60

3.2 线性回归的从零开始实现 61

3.2.1 生成数据集 62

3.2.2 读取数据集 63

3.2.3 初始化模型参数 63

3.2.4 定义模型 64

3.2.5 定义损失函数 64

3.2.6 定义优化算法 64

3.2.7 训练 64

3.3 线性回归的简洁实现 66

3.3.1 生成数据集 66

3.3.2 读取数据集 66

3.3.3 定义模型 67

3.3.4 初始化模型参数 67

3.3.5 定义损失函数 68

3.3.6 定义优化算法 68

3.3.7 训练 68

3.4 softmax回归 69

3.4.1 分类问题 69

3.4.2 网络架构 70

3.4.3 全连接层的参数开销 70

3.4.4 softmax运算 71

3.4.5 小批量样本的向量化 71

3.4.6 损失函数 72

3.4.7 信息论基础 73

3.4.8 模型预测和评估 74

3.5 图像分类数据集 74

3.5.1 读取数据集 75

3.5.2 读取小批量 76

3.5.3 整合所有组件 76

3.6 softmax回归的从零开始实现 77

3.6.1 初始化模型参数 77

3.6.2 定义softmax操作 78

3.6.3 定义模型 78

3.6.4 定义损失函数 79

3.6.5 分类精度 79

3.6.6 训练 80

3.6.7 预测 82

3.7 softmax回归的简洁实现 83

3.7.1 初始化模型参数 83

3.7.2 重新审视softmax的实现 84

3.7.3 优化算法 84

3.7.4 训练 84

第4章 多层感知机 86

4.1 多层感知机 86

4.2 多层感知机的从零开始实现 92

4.3 多层感知机的简洁实现 94

模型 94

4.4 模型选择、欠拟合和过拟合 95

4.5 权重衰减 103

4.6 暂退法 108

4.7 前向传播、反向传播和计算图 112

4.8 数值稳定性和模型初始化 115

4.9 环境和分布偏移 119

4.10 实战Kaggle比赛:预测房价 127

第5章 深度学习计算 136

5.1 层和块 136

5.2 参数管理 141

5.3 延后初始化 145

实例化网络 146

5.4 自定义层 146

5.5 读写文件 148

5.6 GPU 150

第6章 卷积神经网络 155

6.1 从全连接层到卷积 155

6.2 图像卷积 159

6.3 填充和步幅 164

6.4 多输入多输出通道 166

6.5 汇聚层 170

6.6 卷积神经网络(LeNet) 173

第7章 现代卷积神经网络 178

7.1 深度卷积神经网络(AlexNet) 178

7.2 使用块的网络(VGG) 184

7.3 网络中的网络(NiN) 187

7.4 含并行连接的网络(GoogLeNet) 190

7.5 批量规范化 194

7.6 残差网络(ResNet) 200

7.7 稠密连接网络(DenseNet) 205

第8章 循环神经网络 209

8.1 序列模型 209

8.2 文本预处理 216

8.3 语言模型和数据集 219

8.4 循环神经网络 226

8.5 循环神经网络的从零开始实现 230

8.6 循环神经网络的简洁实现 237

8.7 通过时间反向传播 239

第9章 现代循环神经网络 244

9.1 门控循环单元(GRU) 244

9.2 长短期记忆网络(LSTM) 249

9.3 深度循环神经网络 254

9.4 双向循环神经网络 256

9.5 机器翻译与数据集 260

9.6 编码器-解码器架构 265

9.7 序列到序列学习(seq2seq) 267

9.8 束搜索 275

第 10章 注意力机制 278

10.1 注意力提示 278

10.2 注意力汇聚:Nadaraya-Watson 核回归 281

10.3 注意力评分函数 287

10.4 Bahdanau 注意力 291

10.5 多头注意力 295

10.6 自注意力和位置编码 298

10.7 Transformer 302

第 11章 优化算法 311

11.1 优化和深度学习 311

11.2 凸性 315

11.3 梯度下降 322

11.4 随机梯度下降 329

11.5 小批量随机梯度下降 334

11.6 动量法 341

11.7 AdaGrad算法 348

11.8 RMSProp算法 353

11.9 Adadelta算法 356

11.10 Adam算法 358

11.11 学习率调度器 361

第 12章 计算性能 369

12.1 编译器和解释器 369

12.2 异步计算 372

通过后端异步处理 373

12.3 自动并行 375

12.4 硬件 378

12.5 多GPU训练 388

12.6 多GPU的简洁实现 394

12.7 参数服务器 397

第 13章 计算机视觉 404

13.1 图像增广 404

13.2 微调 410

13.3 目标检测和边界框 415

13.4 锚框 417

13.5 多尺度目标检测 427

13.6 目标检测数据集 430

13.7 单发多框检测(SSD) 433

13.8 区域卷积神经网络(R-CNN)系列 441

13.9 语义分割和数据集 445

13.10 转置卷积 450

13.11 全卷积网络 453

13.12 风格迁移 458

13.13 实战 Kaggle竞赛:图像分类(CIFAR-10) 464

13.14 实战Kaggle竞赛:狗的品种识别(ImageNet Dogs) 470

第 14章 自然语言处理:预训练 476

14.1 词嵌入(word2vec) 477

14.2 近似训练 480

14.3 用于预训练词嵌入的数据集 482

14.4 预训练word2vec 488

14.5 全局向量的词嵌入(GloVe) 491

14.6 子词嵌入 494

14.7 词的相似度和类比任务 497

14.8 来自Transformer的双向编码器表示(BERT) 500

14.9 用于预训练BERT的数据集 507

14.10 预训练BERT 512

第 15章 自然语言处理:应用 515

15.1 情感分析及数据集 516

15.2 情感分析:使用循环神经网络 518

15.3 情感分析:使用卷积神经网络 521

15.4 自然语言推断与数据集 526

15.5 自然语言推断:使用注意力 530

15.6 针对序列级和词元级应用微调BERT 535

15.7 自然语言推断:微调BERT 538

附录A 深度学习工具 543

A.1 使用Jupyter记事本 543

A.1.1 在本地编辑和运行代码 543

A.1.2 高级选项 545

A.2 使用Amazon SageMaker 546

A.2.1 注册 547

A.2.2 创建SageMaker实例 547

A.2.3 运行和停止实例 548

A.2.4 更新Notebook 548

A.3 使用Amazon EC2实例 549

A.3.1 创建和运行EC2实例 549

A.3.2 安装CUDA 553

A.3.3 安装库以运行代码 553

A.3.4 远程运行Jupyter记事本 554

A.3.5 关闭未使用的实例 554

A.4 选择服务器和GPU 555

A.4.1 选择服务器 555

A.4.2 选择GPU 556

A.5 为本书做贡献 558

A.5.1 提交微小更改 558

A.5.2 大量文本或代码修改 559

A.5.3 提交主要更改 559

参考文献 562

《动手学深度学习(PyTorch版)》全书速览

拓展:同款推荐

通过上文介绍关于深度学习的内容,以及给大家推荐了一本关于深度学习领域非常棒的书籍,我觉得这一本书还不够大家学习使用,再给大家推荐几本同系列的其他书籍,组合学习,才能获得最大的知识收益,具体如下所示:

1、深度学习高手笔记系列

关于深度学习高手笔记系列详情,请点击链接进入:《深度学习高手笔记 卷1:基础算法》(刘岩(@大师兄))【简介_书评_在线阅读】 - 当当图书或者https://item.jd.com/13484669.html

2、破解深度学习系列

关于深度学习高手笔记系列详情,请点击链接进入:《破解深度学习:模型算法与实现(核心篇)》(瞿炜)【简介_书评_在线阅读】 - 当当图书或者https://item.jd.com/14826638.html#crumb-wrap

结束语

通过本文的介绍,大家应该对使用PyTorch进行深度学习有了初步的了解。从基础的线性回归到多层感知机,PyTorch提供了强大的工具和灵活的接口,使得深度学习变得触手可及。随着技术的不断发展,深度学习将在更多领域展现其强大的潜力。在这里,我想号召大家继续探索和实践,共同推动深度学习技术的发展,一起见证深度学习带来下一代的创新!

相关推荐
JINGWHALE114 分钟前
设计模式 结构型 代理模式(Proxy Pattern)与 常见技术框架应用 解析
前端·人工智能·后端·设计模式·性能优化·系统架构·代理模式
youcans_22 分钟前
【YOLO 项目实战】(12)红外/可见光多模态目标检测
人工智能·yolo·目标检测·计算机视觉·多模态
深蓝学院22 分钟前
Visual CoT:解锁视觉链式思维推理的潜能
人工智能·计算机视觉·目标跟踪
AI追随者23 分钟前
超越YOLO11!DEIM:先进的实时DETR目标检测
人工智能·深度学习·算法·目标检测·计算机视觉
卧式纯绿27 分钟前
自动驾驶3D目标检测综述(六)
人工智能·算法·目标检测·计算机视觉·3d·目标跟踪·自动驾驶
KeyPan1 小时前
【机器学习:一、机器学习简介】
人工智能·数码相机·算法·机器学习·计算机视觉
deardao1 小时前
【顶刊TPAMI 2025】多头编码(MHE)之极限分类 Part 1:背景动机
人工智能·深度学习·神经网络·数据挖掘·极限标签分类
沐欣工作室_lvyiyi1 小时前
基于单片机的家庭智能垃圾桶(论文+源码)
人工智能·stm32·单片机·嵌入式硬件·单片机毕业设计·垃圾桶
B站计算机毕业设计超人1 小时前
计算机毕业设计Python动漫推荐系统 漫画推荐系统 动漫视频推荐系统 机器学习 bilibili动漫爬虫 数据可视化 数据分析 大数据毕业设计
大数据·python·深度学习·机器学习·网络爬虫·课程设计·推荐算法
湫ccc1 小时前
《Opencv》基础操作详解(4)
人工智能·opencv·计算机视觉