Python + FFmpeg 批量提取视频音频(支持 Windows / macOS / Linux)

在日常开发或音频处理场景中,我们经常需要从大量视频文件中批量提取音频,例如:

  • 从课程视频中提取音频
  • 将短视频转为 MP3
  • 做语音识别 / 音频分析前处理

本文介绍一种 使用 Python 调用 FFmpeg 的通用方案,同时支持 Windows、macOS 和 Linux


一、环境准备

1️⃣ 安装 Python

确保已安装 Python 3.7+

bash 复制代码
python --version

2️⃣ 安装 FFmpeg(关键)

FFmpeg 是跨平台音视频处理神器,本脚本依赖它。


✅ Windows
  1. 下载 FFmpeg
    👉 https://ffmpeg.org/download.html
  2. 解压后,将 bin 目录加入 系统环境变量 PATH
  3. 验证:
bat 复制代码
ffmpeg -version

✅ macOS(推荐 Homebrew)
bash 复制代码
brew install ffmpeg

验证:

bash 复制代码
ffmpeg -version

✅ Linux(Ubuntu / Debian)
bash 复制代码
sudo apt update
sudo apt install ffmpeg

CentOS / Rocky:

bash 复制代码
sudo yum install ffmpeg

二、项目目录结构

text 复制代码
project/
├── v/        # 存放视频文件
│   ├── a.mp4
│   ├── b.mkv
│   └── c.mov
├── mp3/      # 输出 MP3 音频
└── extract_audio.py

📌 支持格式:mp4 / mov / avi / mkv(可自行扩展)


三、完整 Python 脚本

python 复制代码
import os
import subprocess

def extract_audio(video_file, output_dir):
    # 构建输出文件路径
    output_file = os.path.join(
        output_dir,
        os.path.splitext(os.path.basename(video_file))[0] + '.mp3'
    )

    # ffmpeg 命令
    command = [
        'ffmpeg',
        '-i', video_file,
        '-vn',                    # 不处理视频流
        '-acodec', 'libmp3lame',  # MP3 编码器
        '-ab', '192k',            # 音频码率
        output_file
    ]

    try:
        subprocess.run(command, check=True)
        print(f"✅ 音频已提取:{output_file}")
    except subprocess.CalledProcessError:
        print(f"❌ 处理失败:{video_file}")

def process_videos(input_dir, output_dir):
    os.makedirs(output_dir, exist_ok=True)

    for file_name in os.listdir(input_dir):
        if file_name.lower().endswith(('.mp4', '.mov', '.avi', '.mkv')):
            video_path = os.path.join(input_dir, file_name)
            extract_audio(video_path, output_dir)

if __name__ == "__main__":
    input_dir = './v'
    output_dir = './mp3'
    process_videos(input_dir, output_dir)

四、运行方式(全平台通用)

在项目根目录执行:

bash 复制代码
python extract_audio.py

运行后效果:

text 复制代码
mp3/
├── a.mp3
├── b.mp3
└── c.mp3
相关推荐
Storynone20 小时前
【Day28】LeetCode:509. 斐波那契数,70. 爬楼梯,746. 使用最小花费爬楼梯
python·算法·leetcode
guts35020 小时前
使用python里的OpenCV包做简单的车道线检测
人工智能·python·opencv
sz-lcw20 小时前
HOG特征向量计算方法
人工智能·python·算法
ZTLJQ20 小时前
驾驭高并发:Python协程与 async/await 完全解析
服务器·数据库·python
一勺菠萝丶21 小时前
芋道框架 - API 前缀区分机制
java·linux·python
kcuwu.21 小时前
Python判断及循环
android·java·python
Maverick0621 小时前
02-SQL执行计划与优化器:Oracle是怎么决定“该怎么查“的
数据库·sql·oracle·ffmpeg
前进的李工21 小时前
LangChain使用之Model IO(提示词模版之ChatPromptTemplate)
java·前端·人工智能·python·langchain·大模型
Fairy要carry21 小时前
面试-Agent上下文过载、步骤混乱的问题
开发语言·python
今儿敲了吗21 小时前
python基础学习笔记第五章——容器
笔记·python·学习