吴恩达深度学习笔记：神经网络的编程基础2.5-2.8

第一门课：神经网络和深度学习 (Neural Networks and Deep Learning)

第二周：神经网络的编程基础 (Basics of Neural Network programming)

2.5 导数（Derivatives）

这个视频我主要是想帮你获得对微积分和导数直观的理解。或许你认为自从大学毕以后你再也没有接触微积分。这取决于你什么时候毕业，也许有一段时间了，如果你顾虑这点，请不要担心。为了高效应用神经网络和深度学习，你并不需要非常深入理解微积分。因此如果你观看这个视频或者以后的视频时心想："哇哦，这些知识、这些运算对我来说很复杂。"我给你的建议是：坚持学习视频，最好下课后做作业，成功的完成编程作业，然后你就可以使用深度学习了。在第四周之后的学习中，你会看到定义的很多种类的函数，通过微积分他们能够帮助你把所有的知识结合起来，其中有的叫做前向函数和反向函数，因此你不需要了解所有你使用的那些微积分中的函数。所以你不用担心他们，除此之外在对深度学习的尝试中，这周我们要进一步深入了解微积分的细节。所有你只需要直观地认识微积分，用来构建和成功的应用这些算法。最后，如果你是精通微积分的那一小部分人群，你对微积分非常熟悉，你可以跳过这部分视频。其他同学让我们开始深入学习导数。

一个函数𝑓(𝑎) = 3𝑎，它是一条直线。下面我们来简单理解下导数。让我们看看函数中几个点，假定𝑎 = 2，那么𝑓(𝑎)是𝑎的 3 倍等于 6，也就是说如果𝑎 = 2，那么函数𝑓(𝑎) = 6。假定稍微改变一点点𝑎的值，只增加一点，变为 2.001，这时𝑎将向右做微小的移动。0.001 的差别实在是太小了，不能在图中显示出来，我们把它右移一点，现在𝑓(𝑎)等于𝑎的 3 倍是 6.003，画在图里，比例不太符合。请看绿色高亮部分的这个小三角形，如果向右移动 0.001，那么𝑓(𝑎)增加 0.003，𝑓(𝑎)的值增加 3 倍于右移的𝑎，因此我们说函数𝑓(𝑎)在𝑎 = 2，.是这个导数的斜率，或者说，当𝑎 = 2时，斜率是 3。导数这个概念意味着斜率，导数听起来是一个很可怕、很令人惊恐的词，但是斜率以一种很友好的方式来描述导数这个概念。所以提到导数，我们把它当作函数的斜率就好了。更正式的斜率定义为在上图这个绿色的小三角形中，高除以宽。即斜率等于 0.003 除以 0.001，等于 3。或者说导数等于 3，这表示当你将𝑎右移 0.001，𝑓(𝑎)的值增加 3 倍水平方向的量。

现在让我们从不同的角度理解这个函数。假设𝑎 = 5 ，此时𝑓(𝑎) = 3𝑎 = 15。把𝑎右移一个很小的幅度，增加到 5.001，𝑓(𝑎) = 15.003。即在𝑎 = 5 时，斜率是 3，这就是表示，当微小改变变量𝑎的值，𝑑𝑓(𝑎)/𝑑𝑎= 3 。一个等价的导数表达式可以这样写 𝑑𝑓(𝑎) /𝑑𝑎，不管你是否将𝑓(𝑎)放在上面或者放在右边都没有关系。

在这个视频中，我讲解导数讨论的情况是我们将𝑎偏移 0.001，如果你想知道导数的数学定义，导数是你右移很小的𝑎值（不是 0.001，而是一个非常非常小的值）。通常导数的定义是你右移𝑎(可度量的值)一个无限小的值，𝑓(𝑎)增加 3 倍（增加了一个非常非常小的值）。也就是这个三角形右边的高度。

那就是导数的正式定义。但是为了直观的认识，我们将探讨右移𝑎 = 0.001 这个值，即使 0.001 并不是无穷小的可测数据。导数的一个特性是：这个函数任何地方的斜率总是等于3，不管𝑎 = 2或 𝑎 = 5，这个函数的斜率总等于 3，也就是说不管𝑎的值如何变化，如果你增加 0.001，𝑓(𝑎)的值就增加 3 倍。这个函数在所有地方的斜率都相等。一种证明方式是无论你将小三角形画在哪里，它的高除以宽总是 3。

我希望带给你一种感觉：什么是斜率？什么是导函数？对于一条直线，在例子中函数的斜率，在任何地方都是 3。在下一个视频让我们看一个更复杂的例子，这个例子中函数在不同点的斜率是可变的。

吴恩达深度学习笔记：神经网络的编程基础2.5-2.8

目录

第一门课：神经网络和深度学习 (Neural Networks and Deep Learning)

第二周：神经网络的编程基础 (Basics of Neural Network programming)

2.5 导数（Derivatives）