计算机视觉之图像特征提取

图像特征提取是计算机视觉中的重要任务,它有助于识别、分类、检测和跟踪对象。以下是一些常用的图像特征提取算法及其简介:

  1. 颜色直方图(Color Histogram)

    • 简介:颜色直方图表示图像中各种颜色的分布情况。通过将图像中的像素分成颜色通道(如RGB)并计算每个通道的颜色值分布,可以捕捉到图像的颜色信息。
    • 应用:颜色直方图常用于图像检索、图像分类和图像匹配等任务。
  2. 局部二值模式(Local Binary Pattern,LBP)

    • 简介:LBP是一种用于纹理特征提取的方法。它通过比较每个像素与其邻域像素的灰度值来构建特征。LBP特征对纹理的变化和结构有很好的描述能力。
    • 应用:LBP常用于人脸识别、纹理分类和目标检测等任务。
  3. 方向梯度直方图(Histogram of Oriented Gradients,HOG)

    • 简介:HOG是一种用于物体检测的特征提取方法,特别适用于行人检测。它通过计算图像中每个像素的梯度方向并构建梯度方向的直方图来表示图像。
    • 应用:HOG广泛应用于行人检测、目标识别和行为分析等领域。
  4. 尺度不变特征变换(Scale-Invariant Feature Transform,SIFT)

    • 简介:SIFT是一种用于检测和描述图像中局部特征的方法。它对图像的尺度、旋转和亮度变化具有不变性,因此在各种条件下都表现良好。
    • 应用:SIFT广泛用于特征匹配、物体识别和图像配准等任务。
  5. 加速稳定特征(Speeded-Up Robust Features,SURF)

    • 简介:SURF是一种用于图像特征提取的快速算法。它结合了SIFT的特点,并使用积分图像来加速特征检测和描述子计算。
    • 应用:SURF适用于实时应用,如实时目标跟踪和图像拼接。
  6. 卷积神经网络特征(Convolutional Neural Network Features)

    • 简介:基于深度学习的方法,如卷积神经网络(CNN),已经取得了在图像特征提取任务上的显著成功。通过在预训练的CNN模型上提取特征向量,可以获得强大的图像表示。
    • 应用:CNN特征广泛用于图像分类、目标检测、图像生成等各种计算机视觉任务。

历程:

颜色直方图 (Color Histogram) 示例

cpp 复制代码
#include <opencv2/opencv.hpp>

int main() {
    cv::Mat image = cv::imread("image.jpg");
    cv::Mat hist;

    // 将图像转换为HSV颜色空间
    cv::cvtColor(image, image, cv::COLOR_BGR2HSV);

    // 计算直方图
    int histSize = 256; // 直方图的大小
    float range[] = {0, 256}; // 像素值范围
    const float* histRange = {range};
    cv::calcHist(&image, 1, 0, cv::Mat(), hist, 1, &histSize, &histRange);

    // 打印直方图
    for (int i = 0; i < histSize; i++) {
        std::cout << "Bin " << i << ": " << hist.at<float>(i) << std::endl;
    }

    return 0;
}

局部二值模式 (Local Binary Pattern, LBP) 示例

cpp 复制代码
#include <opencv2/opencv.hpp>

int main() {
    cv::Mat image = cv::imread("image.jpg", cv::IMREAD_GRAYSCALE);
    cv::Mat lbpImage;

    // 计算LBP图像
    cv::Ptr<cv::ximgproc::LBP> lbp = cv::ximgproc::createLBPFast();
    lbp->compute(image, lbpImage);

    return 0;
}

方向梯度直方图 (Histogram of Oriented Gradients, HOG) 示例

cpp 复制代码
#include <opencv2/opencv.hpp>

int main() {
    cv::Mat image = cv::imread("image.jpg", cv::IMREAD_GRAYSCALE);
    cv::HOGDescriptor hog;

    // 设置HOG参数
    hog.winSize = cv::Size(64, 128); // 检测窗口大小
    hog.blockSize = cv::Size(16, 16); // 块大小
    hog.blockStride = cv::Size(8, 8); // 块的步幅
    hog.cellSize = cv::Size(8, 8); // 细胞大小

    // 计算HOG特征向量
    std::vector<float> descriptors;
    hog.compute(image, descriptors);

    return 0;
}

加速稳健特征 (Speeded-Up Robust Features, SURF) 示例

cpp 复制代码
#include <opencv2/opencv.hpp>

int main() {
    cv::Mat image = cv::imread("image.jpg", cv::IMREAD_GRAYSCALE);
    cv::Ptr<cv::xfeatures2d::SURF> surf = cv::xfeatures2d::SURF::create();

    // 检测关键点和计算描述子
    std::vector<cv::KeyPoint> keypoints;
    cv::Mat descriptors;
    surf->detectAndCompute(image, cv::noArray(), keypoints, descriptors);

    return 0;
}

尺度不变特征变换 (Scale-Invariant Feature Transform, SIFT) 示例

cpp 复制代码
#include <opencv2/opencv.hpp>

int main() {
    cv::Mat image = cv::imread("image.jpg", cv::IMREAD_GRAYSCALE);
    cv::Ptr<cv::xfeatures2d::SIFT> sift = cv::xfeatures2d::SIFT::create();

    // 检测关键点和计算描述子
    std::vector<cv::KeyPoint> keypoints;
    cv::Mat descriptors;
    sift->detectAndCompute(image, cv::noArray(), keypoints, descriptors);

    return 0;
}

卷积神经网络特征 (Convolutional Neural Network Features) 示例

cpp 复制代码
#include <opencv2/opencv.hpp>
#include <opencv2/dnn.hpp>

int main() {
    cv::Mat image = cv::imread("image.jpg");
    cv::dnn::Net net = cv::dnn::readNetFromCaffe("deploy.prototxt", "model.caffemodel");

    // 预处理图像(归一化、尺寸调整等)
    cv::Mat blob = cv::dnn::blobFromImage(image, 1.0, cv::Size(224, 224), cv::Scalar(104, 117, 123));

    // 设置输入图像
    net.setInput(blob);

    // 前向传播并获取特征向量
    cv::Mat features = net.forward();

    return 0;
}
相关推荐
reddingtons34 分钟前
Adobe Firefly AI驱动设计:实用技巧与创新思维路径
大数据·人工智能·adobe·illustrator·photoshop·premiere·indesign
CertiK36 分钟前
IBW 2025: CertiK首席商务官出席,探讨AI与Web3融合带来的安全挑战
人工智能·安全·web3
Deepoch2 小时前
Deepoc 大模型在无人机行业应用效果的方法
人工智能·科技·ai·语言模型·无人机
Deepoch2 小时前
Deepoc 大模型:无人机行业的智能变革引擎
人工智能·科技·算法·ai·动态规划·无人机
kngines2 小时前
【字节跳动】数据挖掘面试题0003:有一个文件,每一行是一个数字,如何用 MapReduce 进行排序和求每个用户每个页面停留时间
人工智能·数据挖掘·mapreduce·面试题
Binary_ey2 小时前
AR衍射光波导设计遇瓶颈,OAS 光学软件来破局
人工智能·软件需求·光学软件·光波导
昵称是6硬币2 小时前
YOLOv11: AN OVERVIEW OF THE KEY ARCHITECTURAL ENHANCEMENTS目标检测论文精读(逐段解析)
图像处理·人工智能·深度学习·yolo·目标检测·计算机视觉
平和男人杨争争3 小时前
机器学习2——贝叶斯理论下
人工智能·机器学习
静心问道3 小时前
XLSR-Wav2Vec2:用于语音识别的无监督跨语言表示学习
人工智能·学习·语音识别
算家计算3 小时前
5 秒预览物理世界,2 行代码启动生成——ComfyUI-Cosmos-Predict2 本地部署教程,重塑机器人训练范式!
人工智能·开源