机器学习9-卷积和卷积核2

卷积与边缘提取

边缘：图像中亮度明显而急剧变化的点

为什么要研究边缘？

图中展示了视觉边缘的几种类型，分别是：

这些视觉边缘类型在计算机视觉和图像处理中非常重要，用于识别和分析图像中的物体及其结构。

二维函数(f(x,y))的偏导数的定义式：

∂ f ( x , y ) ∂ x = lim ⁡ ε → 0 f ( x + ε , y ) − f ( x , y ) ε \\frac{\\partial f(x,y)}{\\partial x} = \\lim_{\\varepsilon \\to 0} \\frac{f(x + \\varepsilon,y) - f(x,y)}{\\varepsilon} ∂x∂f(x,y)=limε→0εf(x+ε,y)−f(x,y)

偏导数的定义
- 对于一个多元函数（这里是二维函数( f ( x , y ) f(x,y) f(x,y))），偏导数表示函数在某一点沿着某一坐标轴方向的变化率。
- 对于( x x x)方向的偏导数( ∂ f ( x , y ) ∂ x \frac{\partial f(x,y)}{\partial x} ∂x∂f(x,y))，它衡量了函数( f ( x , y ) f(x,y) f(x,y))在( x x x)轴方向上的变化情况，而( y y y)被视为常数。
极限的意义
- 偏导数的定义中使用了极限。这里的( ε \varepsilon ε)是一个趋近于0的变量。
- 当( ε \varepsilon ε)趋近于0时，( f ( x + ε , y ) − f ( x , y ) ε \frac{f(x + \varepsilon,y) - f(x,y)}{\varepsilon} εf(x+ε,y)−f(x,y))表示函数在( x x x)方向上的平均变化率。极限( lim ⁡ ε → 0 \lim_{\varepsilon \to 0} limε→0)则表示当这个平均变化率在( ε \varepsilon ε)无限趋近于0时的精确变化率，即偏导数。
几何意义
- 在二维平面上，( ∂ f ( x , y ) ∂ x \frac{\partial f(x,y)}{\partial x} ∂x∂f(x,y))可以理解为函数( f ( x , y ) f(x,y) f(x,y))在( x x x)方向上的斜率。
- 例如，如果( f ( x , y ) f(x,y) f(x,y))表示一个曲面，那么( ∂ f ( x , y ) ∂ x \frac{\partial f(x,y)}{\partial x} ∂x∂f(x,y))在某一点的值就是该点处曲面在( x x x)方向上的切线斜率。

假设( f ( x , y ) = x 2 + y 2 f(x,y) = x^2 + y^2 f(x,y)=x2+y2)，求( ∂ f ( x , y ) ∂ x \frac{\partial f(x,y)}{\partial x} ∂x∂f(x,y))：

根据定义，( ∂ f ( x , y ) ∂ x = lim ⁡ ε → 0 f ( x + ε , y ) − f ( x , y ) ε \frac{\partial f(x,y)}{\partial x} = \lim_{\varepsilon \to 0} \frac{f(x + \varepsilon,y) - f(x,y)}{\varepsilon} ∂x∂f(x,y)=limε→0εf(x+ε,y)−f(x,y))。
代入( f ( x , y ) = x 2 + y 2 f(x,y) = x^2 + y^2 f(x,y)=x2+y2)：
- ( f ( x + ε , y ) = ( x + ε ) 2 + y 2 = x 2 + 2 x ε + ε 2 + y 2 f(x + \varepsilon,y) = (x + \varepsilon)^2 + y^2 = x^2 + 2x\varepsilon + \varepsilon^2 + y^2 f(x+ε,y)=(x+ε)2+y2=x2+2xε+ε2+y2)。
- ( f ( x , y ) = x 2 + y 2 f(x,y) = x^2 + y^2 f(x,y)=x2+y2)。
计算差值：
- ( f ( x + ε , y ) − f ( x , y ) = ( x 2 + 2 x ε + ε 2 + y 2 ) − ( x 2 + y 2 ) = 2 x ε + ε 2 f(x + \varepsilon,y) - f(x,y) = (x^2 + 2x\varepsilon + \varepsilon^2 + y^2) - (x^2 + y^2) = 2x\varepsilon + \varepsilon^2 f(x+ε,y)−f(x,y)=(x2+2xε+ε2+y2)−(x2+y2)=2xε+ε2)。
除以( ε \varepsilon ε)：
- ( f ( x + ε , y ) − f ( x , y ) ε = 2 x ε + ε 2 ε = 2 x + ε \frac{f(x + \varepsilon,y) - f(x,y)}{\varepsilon} = \frac{2x\varepsilon + \varepsilon^2}{\varepsilon} = 2x + \varepsilon εf(x+ε,y)−f(x,y)=ε2xε+ε2=2x+ε)。
取极限：
- ( lim ⁡ ε → 0 ( 2 x + ε ) = 2 x \lim_{\varepsilon \to 0} (2x + \varepsilon) = 2x limε→0(2x+ε)=2x)。

所以，对于( f ( x , y ) = x 2 + y 2 f(x,y) = x^2 + y^2 f(x,y)=x2+y2)，( ∂ f ( x , y ) ∂ x = 2 x \frac{\partial f(x,y)}{\partial x} = 2x ∂x∂f(x,y)=2x)。

∂ f ( x , y ) ∂ x ≈ f ( x + 1 , y ) − f ( x , y ) 1 \\frac{\\partial f(x,y)}{\\partial x} \\approx \\frac{f(x + 1,y) - f(x,y)}{1} ∂x∂f(x,y)≈1f(x+1,y)−f(x,y)

公式含义
- 这个公式是一个近似计算图像在 ( x x x) 方向上的偏导数的方法。
- 这里的 ( f ( x , y ) f(x,y) f(x,y)) 表示图像在坐标 ( ( x , y ) (x,y) (x,y)) 处的像素值。
- 公式中的 ( ∂ f ( x , y ) ∂ x \frac{\partial f(x,y)}{\partial x} ∂x∂f(x,y)) 表示图像在 ( x x x) 方向上的偏导数，即在 ( x x x) 方向上像素值的变化率。
- 公式右侧的 ( f ( x + 1 , y ) − f ( x , y ) 1 \frac{f(x + 1,y) - f(x,y)}{1} 1f(x+1,y)−f(x,y)) 是一个差分运算，用来近似计算偏导数。具体来说，它计算了在 ( x x x) 方向上相邻两个像素（( x x x) 和 ( x + 1 x+1 x+1)）的像素值之差。
近似原理
- 在连续函数中，导数是通过极限定义的，即 ( ∂ f ( x , y ) ∂ x = lim ⁡ ε → 0 f ( x + ε , y ) − f ( x , y ) ε \frac{\partial f(x,y)}{\partial x} = \lim_{\varepsilon \to 0} \frac{f(x + \varepsilon,y) - f(x,y)}{\varepsilon} ∂x∂f(x,y)=limε→0εf(x+ε,y)−f(x,y))。
- 在离散的图像数据中，我们无法取极限，因此采用一个较小的增量（这里是 ( 1 1 1)）来近似计算导数。这种方法称为差分近似。
应用场景
- 这种图像求导公式在图像处理中非常常见，例如在边缘检测、图像锐化等操作中。
- 通过计算图像的偏导数，可以找到图像中像素值变化剧烈的地方，这些地方通常对应于图像的边缘。