【PYTHON】视频转图片

【PYTHON】视频转图片

一、前期准备:安装依赖库

核心使用 opencv-python(OpenCV)库处理视频和图像,这是Python视觉处理的主流库,先通过pip安装:

bash 复制代码
# 安装opencv-python
pip install opencv-python

# 若需处理特殊视频格式(如MP4编码问题),可额外安装ffmpeg(可选)
# Windows:下载ffmpeg并配置环境变量;Ubuntu:sudo apt install ffmpeg;Mac:brew install ffmpeg

二、方案1:基础版 - 按帧提取(提取所有帧/每隔N帧提取)

适合大多数标注场景,可灵活设置提取间隔,避免图片过多冗余。

完整代码

python 复制代码
import cv2
import os

def video_to_images_basic(
    video_path,          # 输入视频文件路径(如:test.mp4)
    output_dir,          # 输出图片文件夹路径
    frame_interval=30,   # 提取间隔:每30帧提取1张(默认30帧,对应1秒/帧,可调整)
    img_format="jpg",    # 输出图片格式(jpg/png,推荐jpg,占用空间小)
    img_prefix="frame"   # 图片文件名前缀(如:frame_0001.jpg)
):
    # 1. 创建输出文件夹(若不存在则自动创建)
    if not os.path.exists(output_dir):
        os.makedirs(output_dir)
        print(f"创建输出文件夹:{output_dir}")

    # 2. 打开视频文件
    cap = cv2.VideoCapture(video_path)
    if not cap.isOpened():
        raise ValueError(f"无法打开视频文件:{video_path}")

    # 3. 获取视频基本信息
    total_frames = int(cap.get(cv2.CAP_PROP_FRAME_COUNT))  # 视频总帧数
    fps = cap.get(cv2.CAP_PROP_FPS)                        # 视频帧率(每秒帧数)
    print(f"视频信息:总帧数={total_frames},帧率={fps:.2f},预计提取图片数={total_frames//frame_interval + 1}")

    # 4. 循环提取帧并保存
    frame_count = 0  # 当前帧计数器
    saved_count = 0  # 已保存图片计数器

    while True:
        # 读取一帧视频
        ret, frame = cap.read()

        # 若读取失败(已到视频末尾),退出循环
        if not ret:
            break

        # 按间隔提取帧
        if frame_count % frame_interval == 0:
            # 构造图片文件名(补零对齐,方便排序)
            img_name = f"{img_prefix}_{saved_count:04d}.{img_format}"
            img_path = os.path.join(output_dir, img_name)

            # 保存图片
            cv2.imwrite(img_path, frame)
            print(f"已保存:{img_path}")

            saved_count += 1

        frame_count += 1

    # 5. 释放资源
    cap.release()
    print(f"\n转换完成!共保存 {saved_count} 张图片,存储路径:{output_dir}")

# ------------------- 调用示例 -------------------
if __name__ == "__main__":
    # 配置参数
    VIDEO_PATH = "input_video.mp4"  # 你的视频文件路径
    OUTPUT_DIR = "extracted_images" # 图片输出文件夹
    FRAME_INTERVAL = 30             # 每30帧提取1张(1秒1张,若视频帧率25,则每1.2秒1张)

    # 执行转换
    video_to_images_basic(
        video_path=VIDEO_PATH,
        output_dir=OUTPUT_DIR,
        frame_interval=FRAME_INTERVAL,
        img_format="jpg"
    )

三、方案2:进阶版 - 按时间间隔提取(更精准可控)

适合需要按固定时间间隔(如每2秒提取1张)的场景,比按帧间隔更直观,不受视频帧率影响。

完整代码

python 复制代码
import cv2
import os

def video_to_images_by_time(
    video_path,          # 输入视频文件路径
    output_dir,          # 输出图片文件夹路径
    time_interval=1.0,   # 时间间隔:每1.0秒提取1张(可调整,如2.0=每2秒1张)
    img_format="jpg",    # 输出图片格式
    img_prefix="frame"   # 图片文件名前缀
):
    # 1. 创建输出文件夹
    if not os.path.exists(output_dir):
        os.makedirs(output_dir)
        print(f"创建输出文件夹:{output_dir}")

    # 2. 打开视频文件
    cap = cv2.VideoCapture(video_path)
    if not cap.isOpened():
        raise ValueError(f"无法打开视频文件:{video_path}")

    # 3. 获取视频基本信息
    total_frames = int(cap.get(cv2.CAP_PROP_FRAME_COUNT))
    fps = cap.get(cv2.CAP_PROP_FPS)
    video_duration = total_frames / fps  # 视频总时长(秒)
    frame_interval = int(fps * time_interval)  # 换算为帧间隔

    print(f"视频信息:总帧数={total_frames},帧率={fps:.2f},总时长={video_duration:.2f}秒")
    print(f"时间间隔={time_interval}秒,对应帧间隔={frame_interval}帧,预计提取图片数={int(video_duration//time_interval) + 1}")

    # 4. 循环提取帧并保存
    frame_count = 0
    saved_count = 0
    last_saved_time = 0.0  # 上一次保存图片的时间

    while True:
        ret, frame = cap.read()
        if not ret:
            break

        # 获取当前帧对应的时间(秒)
        current_time = frame_count / fps

        # 按时间间隔保存
        if current_time - last_saved_time >= time_interval:
            img_name = f"{img_prefix}_{saved_count:04d}.{img_format}"
            img_path = os.path.join(output_dir, img_name)
            cv2.imwrite(img_path, frame)
            print(f"时间{current_time:.2f}秒:已保存 {img_path}")

            saved_count += 1
            last_saved_time = current_time

        frame_count += 1

    # 5. 释放资源
    cap.release()
    print(f"\n转换完成!共保存 {saved_count} 张图片,存储路径:{output_dir}")

# ------------------- 调用示例 -------------------
if __name__ == "__main__":
    VIDEO_PATH = "input_video.mp4"
    OUTPUT_DIR = "extracted_images_by_time"
    TIME_INTERVAL = 2.0  # 每2秒提取1张图片

    video_to_images_by_time(
        video_path=VIDEO_PATH,
        output_dir=OUTPUT_DIR,
        time_interval=TIME_INTERVAL,
        img_format="jpg"
    )

四、核心功能说明

1. 关键函数与参数

  • cv2.VideoCapture(video_path):打开视频文件,返回视频捕获对象;
  • cap.read():读取一帧视频,返回(ret, frame)ret为布尔值(是否读取成功),frame为当前帧图像(numpy数组);
  • cap.get(cv2.CAP_PROP_FRAME_COUNT):获取视频总帧数;
  • cap.get(cv2.CAP_PROP_FPS):获取视频帧率(每秒播放的帧数);
  • cv2.imwrite(img_path, frame):将帧图像保存为图片文件;
  • 核心参数调整:
    • frame_interval(方案1):帧间隔,数值越大提取图片越少,推荐30(对应1秒1张);
    • time_interval(方案2):时间间隔,按需设置(如0.5=每0.5秒1张,5.0=每5秒1张)。

2. 实用优化点

  • 文件夹自动创建:无需手动创建输出文件夹,代码会自动判断并创建;
  • 文件名补零对齐 :图片名格式为frame_0001.jpg,方便后续标注软件按顺序加载;
  • 格式灵活选择 :支持jpg(占用空间小)和png(无损压缩,适合高精度标注);
  • 进度打印:实时打印保存路径,方便查看转换进度;
  • 资源释放 :使用cap.release()释放视频资源,避免内存泄漏。

五、使用注意事项

  1. 视频路径问题
    • 若使用相对路径,需将视频文件放在Python脚本同一目录下;
    • 绝对路径示例(Windows):"D:/videos/test.mp4",(Linux/Mac):"/home/user/videos/test.mp4"
  2. 图片冗余控制
    • 标注时无需提取所有帧,建议按1~3秒间隔提取,避免图片过多增加标注工作量;
    • 若视频画面变化缓慢(如监控视频),可增大间隔(如5~10秒);
  3. 编码问题处理
    • 若出现"无法打开视频"或"保存图片失败",大概率是视频编码不兼容,可先用FFmpeg转换为MP4格式(ffmpeg -i input.avi -c:v libx264 output.mp4);
  4. 内存占用
    • 处理超长视频时,无需担心内存溢出,代码逐帧读取并保存,不会缓存全部帧。

六、标注工具推荐

转换后的图片可使用以下主流标注工具进行标注:

  1. LabelImg:轻量级图形化标注工具,支持VOC/YOLO格式,适合目标检测标注;
  2. LabelMe:支持多边形、关键点等复杂标注,适合语义分割、实例分割标注;
  3. CVAT:工业级标注平台,支持批量标注、多人协作,适合大规模数据集标注。
相关推荐
代码or搬砖2 小时前
== 和 equals() 的区别
java·开发语言·jvm
Shirley~~2 小时前
PPTist 画布工具栏
开发语言·前端·javascript
chen_2272 小时前
qt加ffmpeg制作简易录屏工具
开发语言·qt·ffmpeg
惆怅客1232 小时前
libuvc初探
python·c·libuvc
历程里程碑2 小时前
LeetCode 283:原地移动零的优雅解法
java·c语言·开发语言·数据结构·c++·算法·leetcode
卜锦元2 小时前
Golang后端性能优化手册(第一章:数据库性能优化)
大数据·开发语言·数据库·人工智能·后端·性能优化·golang
渡我白衣2 小时前
Python 与数据科学工具链入门:NumPy、Pandas、Matplotlib 快速上手
人工智能·python·机器学习·自然语言处理·numpy·pandas·matplotlib
虾说羊2 小时前
java中的反射详解
java·开发语言
love530love2 小时前
【笔记】把已有的 ComfyUI 插件发布到 Comfy Registry(官方节点商店)全流程实录
人工智能·windows·笔记·python·aigc·comfyui·torchmonitor