OpenCv读/写视频色差 方案

OpenCv read / write video color differenceOpenCv读/写视频色差

感谢博主:

OpenCv读/写视频色差答案 - 爱码网

  • 有没有办法让 OpenCV 使用正确的转换??

  • 是的,使用 GStreamer 后端而不是 FFmpeg 后端,颜色看起来很完美。默认情况下,OpenCV 不是使用 GStreamer 构建的(至少在 Windows 中不是)。我使用 GStreamer 从源代码构建 OpenCV(在下载并安装 GStreamer 之后)...

【解决方案1】:

使用 FFmpeg 后端读取视频帧时,OpenCV VideoCapture 中存在错误。

当 H.264 视频流标记为BT.709 颜色标准时,该错误会导致"颜色偏移"。


主题太重要了,无法回答...

这篇文章的重要部分是重现问题,并证明问题是真实的。

我找到的解决方案是选择 GStreamer 后端而不是 FFmpeg 后端。 建议的解决方案有缺点(例如需要构建支持 GStreamer 的 OpenCV)。

注意:

  • 在 Windows 10 下使用 OpenCV 4.53 可以重现该问题。
    该问题在 Ubuntu 18.04 下也可重现(在 Python 中使用 OpenCV)。
    该问题适用于 BT.709 颜色标准的"全范围"和"有限范围"。

构建合成视频模式 以重现问题:

我们可以使用FFmpeg 命令行工具创建合成视频作为输入。

以下命令生成一个带有 H.264 编解码器和 BT.709 颜色标准的 MP4 视频文件:

复制代码
ffmpeg -y -f lavfi -src_range 1 -color_primaries bt709 -color_trc bt709 -colorspace bt709 -i testsrc=size=192x108:rate=1:duration=5 -vcodec libx264 -crf 17 -pix_fmt yuv444p -dst_range 1 -color_primaries bt709 -color_trc bt709 -colorspace bt709 -bsf:v h264_metadata=video_full_range_flag=1:colour_primaries=1:transfer_characteristics=1:matrix_coefficients=1 bt709_full_range.mp4
  • 上述命令使用 yuv444p 像素格式(而不是 yuv420p)来获得更纯的颜色。
  • 参数-bsf:v h264_metadata=video_full_range_flag=1:colour_primaries=1:transfer_characteristics=1:matrix_coefficients=1 使用Bitstream Filter 将H.264 流标记为"全范围"BT.709。

使用MediaInfo工具,我们可以查看以下颜色特征:

复制代码
colour_range:             Full 
colour_primaries:         BT.709 
transfer_characteristics: BT.709 
matrix_coefficients:      BT.709 

使用 OpenCV 捕获视频

以下 C++ 代码抓取第一帧,并将其保存到1.png 图像文件:

复制代码
#include "opencv2/opencv.hpp"

void main()
{   
    cv::VideoCapture cap("bt709_full_range.mp4");

    cv::Mat frame;    
    cap >> frame;

    cv::imwrite("1.png", frame);

    cap.release();    
}

我们也可以使用以下 Python 代码:

复制代码
import cv2

cap = cv2.VideoCapture('bt709_full_range.mp4')
_, frame = cap.read()
cv2.imwrite('1.png', frame)
cap.release()

使用 FFmpeg 将bt709_full_range.mp4 转换为图像序列:

复制代码
ffmpeg -i bt709_full_range.mp4 -pix_fmt rgb24 %03d.png

第一个"提取"帧的文件名为001.png


比较结果:

  • 左边是1.png(OpenCV的结果)
  • 右边是001.png(FFmpeg命令行工具的结果)

如您所见,颜色不同。

  • OpenCV 的红色像素值是 RGB = [232, 0, 3]
  • FFmpeg的红色像素值是RGB = [254, 0, 0].
    原始的 RGB 值可能是[255, 0, 0](由于颜色转换,值是 254)。

如您所见,OpenCV 颜色是错误的!


解决方案 - 选择 GStreamer 后端而不是 FFmpeg 后端:

默认的 OpenCV 版本不包括 GStreamer 支持(至少在 Windows 中)。

您可以使用以下instruction 使用 GStreamer 构建 OpenCV。


这是一个使用 GStreamer 后端抓取第一帧的 C++ 代码示例:

复制代码
void main()
{   
    cv::VideoCapture cap("filesrc location=bt709_full_range.mp4 ! decodebin ! videoconvert ! appsink", cv::CAP_GSTREAMER);

    cv::Mat frame;    
    cap >> frame;

    cv::imwrite("1g.png", frame);

    cap.release();
}

结果:

  • 左边是1g.png(OpenCV使用GStreamer的结果)
  • 右边是001.png(FFmpeg命令行工具的结果)

使用 GStreamer 的 OpenCV 红色像素的值是 RGB = [254, 0, 1]。 (由于颜色转换,蓝色为 1 而不是零)。


结论:

  • 使用 GStreamer 后端(而不是 FFmpeg)后端似乎可以解决"颜色偏移"问题。
  • OpenCV 用户需要注意颜色偏移问题。
  • 让我们希望 OpenCV 开发人员(或 FFmpeg 插件开发人员)解决这个问题。

【讨论】:

  • 很好,效果很好!顺便说一句,GStreamer 并不真正适合未流式传输的视频,因为它很难在给定位置检索帧。但是,出于与您介绍的相同原因,使用 MicrosoftMedia Foundation 作为后端也可以很好地工作。 cv::VideoCapture cap(video_path, cv::CAP_MSMF);
相关推荐
白熊1882 分钟前
【计算机视觉】OpenCV实战项目:基于OpenCV与face_recognition的实时人脸识别系统深度解析
人工智能·opencv·计算机视觉
闭月之泪舞7 分钟前
OpenCv高阶(4.0)——案例:海报的透视变换
人工智能·opencv·计算机视觉
九亿AI算法优化工作室&28 分钟前
乡村地区无人机医药配送路径规划与优化仿真
人工智能·算法·matlab·回归
jndingxin31 分钟前
OpenCV CUDA模块中矩阵操作-----矩阵最大最小值查找函数
人工智能·opencv
AI technophile34 分钟前
OpenCV计算机视觉实战(5)——图像基础操作全解析
python·opencv·计算机视觉
AI Echoes37 分钟前
LLM(大语言模型)部署加速方法——PagedAttention
人工智能·语言模型·自然语言处理
yangshuo12811 小时前
风车OVF镜像:解放AI开发限制的Ubuntu精简系统
linux·人工智能·ubuntu
Jamence1 小时前
多模态大语言模型arxiv论文略读(七十七)
人工智能·语言模型·自然语言处理
AI量化投资实验室1 小时前
金融量化智能体,如何开发一个有效的策略?
人工智能·金融
九章云极AladdinEdu2 小时前
GPU SIMT架构的极限压榨:PTX汇编指令级并行优化实践
汇编·人工智能·pytorch·python·深度学习·架构·gpu算力