深度学习(pytorch版)前言:环境安装和书籍框架介绍

使用的是李沐老师的教材https://zh-v2.d2l.ai/

关于深度学习的一些介绍

时至今日,人们常用的计算机程序几乎都是软件开发人员从零编写的。 比如,现在开发人员要编写一个程序来管理网上商城。 经过思考,开发人员可能提出如下一个解决方案: 首先,用户通过Web浏览器(或移动应用程序)与应用程序进行交互; 紧接着,应用程序与数据库引擎进行交互,以保存交易历史记录并跟踪每个用户的动态; 其中,这个应用程序的核心------"业务逻辑",详细说明了应用程序在各种情况下进行的操作。

为了完善业务逻辑,开发人员必须细致地考虑应用程序所有可能遇到的边界情况,并为这些边界情况设计合适的规则。 当买家单击将商品添加到购物车时,应用程序会向购物车数据库表中添加一个条目,将该用户ID与商品ID关联起来。 虽然一次编写出完美应用程序的可能性微乎其微,但在大多数情况下,开发人员可以从上述的业务逻辑出发,编写出符合业务逻辑的应用程序,并不断测试直到满足用户的需求。 根据业务逻辑设计自动化系统,驱动正常运行的产品和系统,是一个人类认知上的非凡壮举。

幸运的是,对日益壮大的机器学习科学家群体来说,实现很多任务的自动化并不再屈从于人类所能考虑到的逻辑。 想象一下,假如开发人员要试图解决以下问题之一:

  • 编写一个应用程序,接受地理信息、卫星图像和一些历史天气信息,并预测明天的天气;

  • 编写一个应用程序,接受自然文本表示的问题,并正确回答该问题;

  • 编写一个应用程序,接受一张图像,识别出该图像所包含的人,并在每个人周围绘制轮廓;

  • 编写一个应用程序,向用户推荐他们可能喜欢,但在自然浏览过程中不太可能遇到的产品。

在这些情况下,即使是顶级程序员也无法提出完美的解决方案, 原因可能各不相同。有时任务可能遵循一种随着时间推移而变化的模式,我们需要程序来自动调整。 有时任务内的关系可能太复杂(比如像素和抽象类别之间的关系),需要数千或数百万次的计算。 即使人类的眼睛能毫不费力地完成这些难以提出完美解决方案的任务,这其中的计算也超出了人类意识理解范畴。 机器学习 (machine learning,ML)是一类强大的可以从经验中学习的技术。 通常采用观测数据或与环境交互的形式,机器学习算法会积累更多的经验,其性能也会逐步提高。 相反,对于刚刚所说的电子商务平台,如果它一直执行相同的业务逻辑,无论积累多少经验,都不会自动提高,除非开发人员认识到问题并更新软件。 本书将带读者开启机器学习之旅,并特别关注深度学习(deep learning,DL)的基础知识。 深度学习是一套强大的技术,它可以推动计算机视觉、自然语言处理、医疗保健和基因组学等不同领域的创新。

AI三巨头:机器学习、深度学习与人工智能解析_机器学习 深度学习 ai-CSDN博客

关于pytorch的具体安装过程

Anaconda与PyTorch安装全攻略,详细保姆级安装教程(gpu版本)_torch anaconda 安装-CSDN博客

关于这本书的一些重要框架

  • 第一部分包括基础知识和预备知识。 1节 提供深度学习的入门课程。然后在 2节 中,我们将快速介绍实践深度学习所需的前提条件,例如如何存储和处理数据,以及如何应用基于线性代数、微积分和概率基本概念的各种数值运算。 3节4节 涵盖了深度学习的最基本概念和技术,例如线性回归、多层感知机和正则化。

  • 接下来的五章集中讨论现代深度学习技术。 5节 描述了深度学习计算的各种关键组件,并为我们随后实现更复杂的模型奠定了基础。接下来,在 6节7节 中,我们介绍了卷积神经网络(convolutional neural network,CNN),这是构成大多数现代计算机视觉系统骨干的强大工具。随后,在 8节9节 中,我们引入了循环神经网络(recurrent neural network,RNN),这是一种利用数据中的时间或序列结构的模型,通常用于自然语言处理和时间序列预测。在 10节 中,我们介绍了一类新的模型,它采用了一种称为注意力机制的技术,最近它们已经开始在自然语言处理中取代循环神经网络。这一部分将帮助读者快速了解大多数现代深度学习应用背后的基本工具。

  • 第三部分讨论可伸缩性、效率和应用程序。 首先,在 11节 中,我们讨论了用于训练深度学习模型的几种常用优化算法。下一章 12节 将探讨影响深度学习代码计算性能的几个关键因素。在 13节 中,我们展示了深度学习在计算机视觉中的主要应用。在 14节15节 中,我们展示了如何预训练语言表示模型并将其应用于自然语言处理任务。

本书中的大部分代码都是基于PyTorch的。PyTorch是一个开源的深度学习框架,在研究界非常受欢迎。

相关推荐
人工智能AI技术几秒前
2026年AI编程新范式:“渐进式Spec“
人工智能
砍材农夫7 分钟前
spring-ai 第三结构化输出
java·人工智能·spring
tHeya06II14 分钟前
.NET AI 核心构建块:重塑智能应用开发的架构范式与生态
人工智能·架构·.net
m0_7372469819 分钟前
B端&企业内部产品AI赋能的机会点识别和落地
人工智能
comedate24 分钟前
【OpenClaw】图像配置指南
人工智能·openclaw·图像修改
派大星~课堂24 分钟前
【力扣-138. 随机链表的复制 ✨】Python笔记
python·leetcode·链表
王忘杰26 分钟前
0基础CUDA炼丹、增加断点保存,从零开始训练自己的AI大模型 87owo/EasyGPT Python CUDA
开发语言·人工智能·python
数据知道28 分钟前
claw-code 源码详细分析:`reference_data` JSON 快照——大型移植里「对照底稿」该怎么治理与演进?
linux·python·ubuntu·json·claude code
好家伙VCC29 分钟前
**发散创新:基于以太坊侧链的高性能去中心化应用部署实战**在区块链生态中,*
java·python·去中心化·区块链
枫叶林FYL32 分钟前
第 7 章 感知不确定性估计
人工智能·机器学习