1. 霍夫空间和霍夫变换
1.1 霍夫空间
霍夫空间 (Hough space)是一种用于图像分析的特征空间,用于描述图像中具有相同形状的线段或曲线。
霍夫空间是指将图像空间中的点映射到参数空间后形成的空间。参数空间的维度由形状的描述参数的个数决定。例如,对于直线检测,参数空间的维度为 2,其中一个维度表示直线的斜率,另一个维度表示直线的截距。对于圆检测,参数空间的维度为 3,这三个参数分别是圆心坐标和圆的半径。
霍夫空间具有以下特性:
- 霍夫空间的维度等于直线或曲线的特征参数的个数。
- 霍夫空间中的每个点都对应于图像空间中的一条特征线。
- 霍夫空间中的点的值表示该特征线在图像空间中的出现频率。
1.2 霍夫变换
霍夫变换 (Hough transform)是一种基于霍夫空间的图像特征提取算法。它可以用于检测图像中的直线、圆形、椭圆等形状。
霍夫变换具有以下优点:
- 速度快,适合处理大尺寸的图像。
- 可以检测任意形状的图像。
霍夫变换也具有以下缺点:
- 对图像噪声敏感。
- 容易受到干扰。
霍夫变换的步骤:
- 对图像进行预处理,提取边缘点。
- 将边缘点映射到霍夫空间中。
- 在霍夫空间中计算累加函数。
- 根据累加函数的值来检测图像中的形状。
2. 霍夫直线检测
2.1 直线检测的霍夫空间
在图像空间中,直线可以用 y = mx+b 表示,其中 m 是直线的斜率,b 是直线的截距。
在参数空间中,直线可以用 (m,b) 表示,其中 m 是直线的斜率,b 是直线的截距。
图像空间中的每条直线在参数空间中都对应着单独一个点 来表示。 图像空间中的直线上任何一部分线段在参数空间对应的是同一个点。
将图像空间中的直线映射到参数空间中的点,其中 θ 是直线的倾斜角,r 是直线与原点的距离。
r 所在的直线跟直线 y = mx + b 的交点可得 <math xmlns="http://www.w3.org/1998/Math/MathML"> { x 1 = r ∗ cos θ y 1 = r ∗ sin θ \begin{cases} x_1 = r*\cos\theta\\ y_1 = r*\sin\theta \end{cases} </math>{x1 = r∗cosθy1 = r∗sinθ
由于
<math xmlns="http://www.w3.org/1998/Math/MathML"> { x 1 ∗ cos θ = r ∗ cos 2 θ y 1 ∗ sin θ = r ∗ sin 2 θ \begin{cases} x_1*\cos\theta = r*\cos^2\theta\\ y_1*\sin\theta = r*\sin^2\theta \end{cases} </math>{x1∗cosθ = r∗cos2θy1∗sinθ = r∗sin2θ
所以, <math xmlns="http://www.w3.org/1998/Math/MathML"> x 1 ∗ cos θ + y 1 ∗ sin θ = r x_1*\cos\theta + y_1*\sin\theta = r </math>x1∗cosθ + y1∗sinθ = r
这样,图像空间**(直角坐标系x-y)**的一个点在参数空间(极坐标系𝜌-𝜃)中就对应为一条曲线。
其中:(x,y) 表示线上点的坐标,𝜌 表示线距原点的距离,𝜃 表示线与 x 轴的方向。
图像空间的一个点在参数空间中就对应为一条曲线 ρ = xcos(θ) + ysin(θ),而参数空间的每个点 (θ, ρ) 都对应了图像空间的一条直线。
霍夫变换默认使用极坐标系来检测图像中的线,因为笛卡尔坐标系中线的斜率范围无限大,导致计算量较高。
2.2 投票机制
在霍夫直线检测中,有一个重要的投票机制,它的过程如下:
- 边缘检测:使用边缘检测算法识别图像中的边缘像素。
- 参数空间映射:每个边缘点为其可能所属的参数空间(霍夫空间)中的每条潜在线"投票"。 投票的位置取决于线的角度 (θ) 和距原点的距离 (ρ)。
- 累加器数组:在霍夫空间中,每当边缘像素符合该线参数化时,对应于特定 (θ, ρ) 组合的每个单元都会收到投票。投票被累加在累加器数组中。
- 峰值检测:迭代所有边缘像素后,分析累加器数组以查找具有最高投票计数(峰值)的单元格。 这些峰值代表由最多数量的边缘点支持的线,并且被认为是图像中最可能出现的线。
- 线参数提取:最后利用峰值的(θ,ρ)值重建原始图像空间中的直线方程,提供最终检测到的线。
投票机制好处在于:
- 对噪声和部分遮挡的鲁棒性
- 能够同时检测多条直线
- 基于边缘高效识别直线
总体而言,投票机制是霍夫直线检测的核心优势,使其能够有效地从噪声和复杂图像中识别直线。
2.3 例子
下面的例子,通过 Canny 查找提取图像的边缘,然后映射到霍夫空间进行直线检测,最后绘制找到的直线。
cpp
#include "opencv2/imgproc.hpp"
#include "opencv2/highgui.hpp"
using namespace std;
using namespace cv;
int main(int argc, char **argv) {
Mat src = imread(".../country_road.jpg");
imshow("src", src);
Mat gray;
cvtColor(src, gray, cv::COLOR_BGR2GRAY);
GaussianBlur(gray,gray,Size(7,7),0);
Mat edge;
Canny(gray,edge,100,300,3);
imshow("edge", edge);
std::vector<Vec4f> lines;
cv::HoughLinesP(edge, lines, 1, CV_PI / 180.0, 80, 50, 5);
cv::Scalar color = cv::Scalar(0, 0, 255);
for(size_t i = 0; i < lines.size(); i++){
line(src, cv::Point(lines[i][0], lines[i][1]), cv::Point(lines[i][2], lines[i][3]), color, 8, cv::LINE_AA);
}
imshow("result", src);
waitKey(0);
return 0;
}
HoughLinesP() 函数是基于**累积概率霍夫变换(PPHT)**的一种实现。PPHT 算法比标准霍夫变换算法更准确,但也更耗时。
cpp
void HoughLinesP( InputArray image, OutputArray lines,
double rho, double theta, int threshold,
double minLineLength = 0, double maxLineGap = 0 );
第一个参数 image:输入图像,必须是单通道的灰度图像或二值图像。 第二个参数 lines:输出数组,其中存储检测到的直线。每个直线由四个元素的向量表示,分别为直线的起点 (x1, y1)、终点 (x2, y2)。 第三个参数 rho:参数空间中 ρ 的范围。 第四个参数 theta:参数空间中 θ 的范围。 第五个参数 threshold:累加器中用于判定线段是否有效的阈值。 第六个参数 minLineLength:线段的最小长度。 第七个参数 maxLineGap:线段之间的最大间隔。
HoughLinesP() 函数对噪声敏感,因此在使用前应对图像进行降噪处理。
下面的例子,同样是基于 Canny 查找图像的边缘,然后进行直线检测。
cpp
#include "opencv2/imgproc.hpp"
#include "opencv2/highgui.hpp"
using namespace std;
using namespace cv;
int main(int argc, char **argv) {
Mat src = imread(".../paper.jpg");
imshow("src", src);
Mat gray;
cvtColor(src, gray, cv::COLOR_BGR2GRAY);
Mat edge;
Canny(gray,edge,40,80,3);
imshow("edge", edge);
std::vector<Vec4f> lines;
cv::HoughLinesP(edge, lines, 1, CV_PI / 180.0, 20, 100, 30);
cv::Scalar color = cv::Scalar(0, 0, 255);
for(size_t i = 0; i < lines.size(); i++){
line(src, cv::Point(lines[i][0], lines[i][1]), cv::Point(lines[i][2], lines[i][3]), color, 8, cv::LINE_AA);
}
imshow("result", src);
waitKey(0);
return 0;
}
HoughLinesP() 函数在使用时,需要注意的是:
- threshold:投票阈值,阈值越高,检测到的直线越少。
- minLineLength:直线的最小长度,小于此值的直线将被拒绝。minLineLength 越大,检测到的直线越长。
- maxLineGap:最大允许的直线间距,以使它们被视为单一线段。maxLineGap 越大,检测到的直线越可能被视为单一线段。
3. 总结
霍夫直线检测是图像处理中用于检测图像中直线的一种常用方法。 可以检测出图像中任意方向的直线,包括水平直线、垂直直线以及斜直线。也可以检测出图像中多条直线,即使这些直线重叠或被遮挡。它是一种简单而有效的图像处理方法,在许多应用中得到了广泛的应用。