Python + FFmpeg 批量提取视频音频(支持 Windows / macOS / Linux)

在日常开发或音频处理场景中,我们经常需要从大量视频文件中批量提取音频,例如:

  • 从课程视频中提取音频
  • 将短视频转为 MP3
  • 做语音识别 / 音频分析前处理

本文介绍一种 使用 Python 调用 FFmpeg 的通用方案,同时支持 Windows、macOS 和 Linux


一、环境准备

1️⃣ 安装 Python

确保已安装 Python 3.7+

bash 复制代码
python --version

2️⃣ 安装 FFmpeg(关键)

FFmpeg 是跨平台音视频处理神器,本脚本依赖它。


✅ Windows
  1. 下载 FFmpeg
    👉 https://ffmpeg.org/download.html
  2. 解压后,将 bin 目录加入 系统环境变量 PATH
  3. 验证:
bat 复制代码
ffmpeg -version

✅ macOS(推荐 Homebrew)
bash 复制代码
brew install ffmpeg

验证:

bash 复制代码
ffmpeg -version

✅ Linux(Ubuntu / Debian)
bash 复制代码
sudo apt update
sudo apt install ffmpeg

CentOS / Rocky:

bash 复制代码
sudo yum install ffmpeg

二、项目目录结构

text 复制代码
project/
├── v/        # 存放视频文件
│   ├── a.mp4
│   ├── b.mkv
│   └── c.mov
├── mp3/      # 输出 MP3 音频
└── extract_audio.py

📌 支持格式:mp4 / mov / avi / mkv(可自行扩展)


三、完整 Python 脚本

python 复制代码
import os
import subprocess

def extract_audio(video_file, output_dir):
    # 构建输出文件路径
    output_file = os.path.join(
        output_dir,
        os.path.splitext(os.path.basename(video_file))[0] + '.mp3'
    )

    # ffmpeg 命令
    command = [
        'ffmpeg',
        '-i', video_file,
        '-vn',                    # 不处理视频流
        '-acodec', 'libmp3lame',  # MP3 编码器
        '-ab', '192k',            # 音频码率
        output_file
    ]

    try:
        subprocess.run(command, check=True)
        print(f"✅ 音频已提取:{output_file}")
    except subprocess.CalledProcessError:
        print(f"❌ 处理失败:{video_file}")

def process_videos(input_dir, output_dir):
    os.makedirs(output_dir, exist_ok=True)

    for file_name in os.listdir(input_dir):
        if file_name.lower().endswith(('.mp4', '.mov', '.avi', '.mkv')):
            video_path = os.path.join(input_dir, file_name)
            extract_audio(video_path, output_dir)

if __name__ == "__main__":
    input_dir = './v'
    output_dir = './mp3'
    process_videos(input_dir, output_dir)

四、运行方式(全平台通用)

在项目根目录执行:

bash 复制代码
python extract_audio.py

运行后效果:

text 复制代码
mp3/
├── a.mp3
├── b.mp3
└── c.mp3
相关推荐
90的程序爱好者26 分钟前
Flask 用户注册功能实现
python·flask
张3蜂2 小时前
Gunicorn深度解析:Python WSGI服务器的王者
服务器·python·gunicorn
rayufo8 小时前
【工具】列出指定文件夹下所有的目录和文件
开发语言·前端·python
Python 老手9 小时前
Python while 循环 极简核心讲解
java·python·算法
开源技术10 小时前
如何将本地LLM模型与Ollama和Python集成
开发语言·python
weixin_4370446410 小时前
Netbox批量添加设备——堆叠设备
linux·网络·python
我有医保我先冲10 小时前
AI 时代 “任务完成“ 与 “专业能力“ 的区分:理论基础、行业影响与个人发展策略
人工智能·python·机器学习
测试开发Kevin11 小时前
小tip:换行符CRLF 和 LF 的区别以及二者在实际项目中的影响
java·开发语言·python
爱学习的阿磊11 小时前
使用PyTorch构建你的第一个神经网络
jvm·数据库·python
阿狸OKay11 小时前
einops 库和 PyTorch 的 einsum 的语法
人工智能·pytorch·python