【开源项目】自动字幕生成和字幕翻译

盛世隐者2024-03-01 13:11

文章目录

[1. 安装ffmpeg](#1. 安装ffmpeg)
[2. 克隆项目](#2. 克隆项目)
[3. 配置项目运行环境](#3. 配置项目运行环境)
[4. 填写配置文件](#4. 填写配置文件)
[5. 运行项目（仅使用CPU）](#5. 运行项目（仅使用CPU）)

项目地址：Github - qinL-cdy/auto_ai_subtitle

项目原理：使用ffmpeg提取视频的音频，使用whisper将音频转写为字幕，使用translate将源语言字幕翻译成目标语言字幕。

说明：translate API免费1000行（行宽70字符），超出需要付费购买API

1. 安装ffmpeg

下载构建好的ffmpeg。Windows版本下载。
用7-zip解压文件，将解压目录下的bin目录对应的路径添加到环境变量
- 在搜索框中搜索环境变量 > 编辑系统环境变量 > 环境变量 > 系统变量 > Path
- 将bin目录对应的路径添加到Path中
win + R启动运行，输入cmd，在命令提示符中输入以下命令，出现下图所示内容即配置成功。
bash 复制代码
```
ffmpeg -version
```

2. 克隆项目

打开VSCode，点击Clone Git Repository ...。选择克隆的目标文件夹，克隆完成后打开文件夹。

3. 配置项目运行环境

使用conda创建虚拟环境（安装Anaconda、conda换源、pip换源可以去搜索）
- 启动Anaconda Prompt
- 输入以下命令创建虚拟环境
bash 复制代码
```
conda create -n auto_ai_subtitle python=3.9 -y
```
- 激活虚拟环境
bash 复制代码
```
	conda activate auto_ai_subtitle
```
VSCode选择虚拟环境
右键main.py，点击打开集成终端，输入以下命令安装第三方库。

bash 复制代码

pip install -r requirements.txt

4. 填写配置文件

打开config.yaml，可以根据自己的实际情况设置相应的参数。

语言简称参照链接后两位字母转小写。
路径中不能有中文

5. 运行项目（仅使用CPU）

修改script/audio_tool.py为以下内容：

python 复制代码

import ffmpeg
import subprocess

def audio_extract(input, output):
	ffmpeg.input(input, vn=None).output(output).run()

# 解决中文路径ffmpeg无法运行的问题
# def audio_extract(input_path, output_path):
# 	command = [
# 		'ffmpeg', 
# 		'-i', 'pipe:0',  # 从stdin读取输入
# 		'-vn',          # 仅提取音频
# 		output_path     # 输出文件路径
# 	]

# 	with open(input_path, 'rb') as f:
# 		subprocess.run(command, input=f.read())

修改script/whisper_tool.py，添加verbose=True能显示转写过程。
在集成终端输入以下命令：

bash 复制代码

python main.py

运行过程中出现以下警告可以忽略，因为默认使用FP16，但是CPU不支持FP16，程序自动会改成FP32。

上一篇：zookeeper快速上手

下一篇：CSS-显示模式，背景，盒子模型

热门推荐

01Qwen3-Coder 快速上手教程 | Qwen Code + Claude Code 02全球最强模型Grok4，国内已可免费使用！（附教程）03MSPM0G3507——读取引脚的高低电平方法（数字信号循迹模块）04Coze 开源了，送上保姆级私有化部署方案【建议收藏】05腾讯还是太全面了，限时免费！超全CodeBuddy IDE保姆级教程！（附案例）06扣子开源本地部署教程丨Coze智能体小白喂饭级指南 07KGG转MP3工具|非KGM文件|解密音频 08【手把手攻略】国家育儿补贴正式开领！一键算清你能拿多少钱？附补贴领取计算器 09coze 开源版本地部署及踩过的坑【喂饭级教程】10【Spring】依赖注入的方式：构造方法、setter注入、字段注入