opencv核心类型

mat

Mat替代lplImage

创建和清理mat空间
  • Mat mat(3000, 4000, CV_8UC3);//3000行,4000列数组,数组里存放3个unsigned char类型的数据
  • mat.create(rows, cols, CV_8UC1);//行数,列数,如果mat已经有空间,create时会自动清理已有空间
  • release或者析构:引用计数为1时释放

处理类型一定要用unsigned char而不是char

3*3RGB图像存放方式(连续)

i[image](http://) ###### isContinuous * 判断存储空间是否连续 * 通过step记录 ##### 直接地址访问连续空间 int size = mat.rows*mat.cols*mat.elemSize(); for(int i = 0; i< size; i+3)//3是因为RGB { mat.data[i] = 0; //B mat.data[i+1] = 0; //G mat.data[i+2] = 0; //R } //优化编码后效率高13ms (4000\*3000) ##### 直接地址访问不连续空间 for(int i = 0; i < mat.row; i++) { for(int j = 0; j < mat.cols; j++) { (&mat.data[i*mat.step])[j*3] = 255;//B (&mat.data[i*mat.step])[j*3 + 1] = 255;//G (&mat.data[i*mat.step])[j*3 + 2] = 1;//R } } ##### 通过ptr接口遍历Mat(模板函数) * 性能基本等同与地址访问 * mat.ptr(row);//返回的指针 * mat.ptr(row, col); ##### 通过at接口遍历Mat(模板函数) * 接口最简单的遍历方法 mat.at(row, col)[0] = 255; mat.at(row, col)[1] = 0; mat.at(row, col)[2] = 0; at可以使用try{} catch(.../cv::Exception \&ex){}捕获异常 ##### 通过迭代器遍历Mat * 可以不用管mat的行列 auto it = mr.begin(); auto it_end = mr.end(); #### ROI感兴趣区域 cv::Rect rect(100, 100, 300, 300); #### 像素格式和灰度图 RGB, YUV, GRAY cvtColor(src, img, COLOR_BGR2GRAY);//源图像,目标凸显,转换方式,利用多线程等方式提高效率 自己实现转换: Gray = (R*30 + G*59 + B\*11 + 50)/100 #### 二值化和阈值 * THRESH_BINARY 二进制阈值化 * THRESH_BINARY_INV 反二进制阈值化 #### 改变图片的对比度和亮度 g(i,j) = a\*f(i,j) + b a 1.0\~3.0(对比) b 0\~100(亮度) saturate_cast防止移除函数 #### 图像尺寸调整 * INTER_NEAREST 近邻算法(最快) int sx, sy = 0;//原图对应的坐标 float fy = float(src.rows)/out.rows; float fx = float(src.cols)/out.cols; for(int y = 0; y< out.rows;y++){ sy = fy*y + 0.5;//+0.5四舍五入 for(int x = 0; x < out.cols;x++){ sx = fx*x + 0.5; out.at(y,x) = src.at(sy, sx); } } * CV_INTER_LINEAR 双线程差值(缺省使用) 滤波: 输入图像中像素的小领域来产生输出图像的方法,在信号处理中,这种方法称为滤波(filtering).其中,最常用的是线性滤波:输出像素是输入领域像素的加权和. 双线性内插值: 是由源图像位置在它附近的2\*2区域4个邻近像素的值通过加权平均计算得出的. 低通滤波性质,使高频分量受损,图像轮廓可能会有一点模糊. #### 图像金字塔 高斯金字塔(Gaussian pyramid):用来向下采样 * 获取G(i+1)将G(i)与高斯内核卷积 * 将所有偶数行和列去除 * 拉普拉斯金字塔(Laplacian pyramid):用来从金字塔底层图像重建上层未采样图像 * 用来从金字塔底层图像重建上层未采样图像 * 首先,将图像扩大两杯,新增以0填充 * 高斯内核(乘以4)与放大后的图像卷积 #### 两幅图像混合(blending) * `dst = src1*a + src2*(1-a) + gamma`//gamma增益 * a=\[0\~1

  • 画面叠化(cross-dissolve)效果
  • addWeighted(src1, a, src2, 1-a, 0.0, dst);//两幅图像大小需一致

图像旋转和镜像

  • cv::rotate(src, dst, type);

    • ROTATE_180
    • ROTATE_90_CLOCKWISE
    • ROTATE_90_COUNTERCLOCKWISE
  • cv::flip(src,dst, type);//镜像type 0(x), 1(y), -1

###通过ROI图像合并

打开摄像头接口说明和源码分析

  • VideoCapture
  • bool open(int index)
  • VideoCapture cap(index)
  • open(int cameraNum, int apiPrefrence)

打开视频流文件

  • bool open(const String &filename)

  • VideoCapture cap(const String &file)

  • bool open(const String &filename, int apiPrefrence)

  • 关闭和空间释放

  • ~VideoCapture

  • release

读取一帧视频

read(OutputArray image);

  • bool grab() 读取并解码
  • virtual bool retrieve(OUtputArray , intflag= 0):图像色彩转换
  • vc>>mat

获取视频,相机属性

  • CAP_PROP_FPS帧率
  • CAP_PROP_FRAME_COUNT 总帧数
  • CAP_PROP_POS_FRAMES 播放帧的位置
  • CAP_PROP_FRAME_WIDTH HEIGHT

VideoWriter

  • open(const String &filename, int fourcc, //VideoWrite::fourcc('H', '2', '6', '4')
    double fps, Size frameSize,bool isColor=true)

release

  • void write(const Mat&)
  • cvVideoWriter_FFMPEG::writeFrame
相关推荐
技术闲聊DD6 分钟前
机器学习(1)- 机器学习简介
人工智能·机器学习
mwq3012312 分钟前
GPT-2 中的残差权重初始化
人工智能
mwq3012339 分钟前
Transformer : 深度神经网络中的残差连接 (Residual Connection)
人工智能
信田君952741 分钟前
瑞莎星瑞(Radxa Orion O6) 基于 Android OS 使用 NPU的图片模糊查找APP 开发
android·人工智能·深度学习·神经网络
StarPrayers.1 小时前
卷积神经网络(CNN)入门实践及Sequential 容器封装
人工智能·pytorch·神经网络·cnn
周末程序猿1 小时前
谈谈上下文工程(Context Engineering)
人工智能
一水鉴天1 小时前
整体设计 逻辑系统程序 之29 拼语言+ CNN 框架核心定位、三阶段程序与三种交换模式配套的方案讨论 之2
人工智能·神经网络·cnn
海森大数据1 小时前
AI破解数学界遗忘谜题:GPT-5重新发现尘封二十年的埃尔德什问题解法
人工智能·gpt
望获linux2 小时前
【实时Linux实战系列】Linux 内核的实时组调度(Real-Time Group Scheduling)
java·linux·服务器·前端·数据库·人工智能·深度学习