faster-whisper本地转录简单方案

如果你正在寻找一个完全免费、在自己电脑上运行、并且转录效果顶尖的语音转字幕工具,那么你来对地方了。

这份教程会手把手带你完成所有设置,过程非常简单!

第一部分:准备工作(如果已有uv和ffmpeg可跳过该部分)

在正式开始前,我们需要给电脑请来两位"小助手":uvffmpeg。别担心,这很简单!

步骤 1:安装 uv

uv 就像一个聪明的管家,它能帮我们自动搞定所有复杂的程序配置,我们只需要一个简单的命令就行。

  • 下载地址: Windows 用户请点击这里下载 uvhttps://github.com/astral-sh/uv/releases/download/0.9.8/uv-x86_64-pc-windows-msvc.zip

  • 操作步骤:

    1. 下载后,解压这个 uv-x86_64-pc-windows-msvc.zip 压缩包。你会看到 uv.exe 等几个文件。
    2. 现在,我们需要把这个"管家"放到一个系统能随时找到的地方。打开电脑的任意文件夹,在顶部的地址栏里,清空原有路径 ,然后输入 %userprofile%\.local\bin 并按回车键。
    3. 把刚才解压出来的 uv.exe 等所有文件,全部复制粘贴 到这个新打开的文件夹里。
  • 小贴士: 这一步是为了让电脑"记住" uv 在哪里,以后我们就能在任何地方直接使唤它了!

  • (如果你是 Mac 用户,操作更简单,只需在终端里运行 wget -qO- https://astral.sh/uv/install.sh | sh 即可。)

步骤 2:安装 ffmpeg

ffmpeg 是一个处理音视频的万能工具,我们的程序需要用它来读取你上传的任何音频或视频文件。

  • 下载地址: Windows 用户请点击这里下载 ffmpeghttps://www.gyan.dev/ffmpeg/builds/ffmpeg-release-full.7z

  • 操作步骤:

    1. 下载后,解压这个 ffmpeg-release-full.7z 压缩包。
    2. 进入解压后的文件夹(名字类似 ffmpeg-x.x.x-full_build),找到里面的 bin 文件夹。
    3. bin 文件夹里,你会看到一个 ffmpeg.exe 文件。把它复制出来。
    4. 将这个 ffmpeg.exe 文件,粘贴到我们刚才存放 uv.exe同一个文件夹 里(也就是 %userprofile%\.local\bin 那个)。
  • (如果你是 Mac 用户,同样很简单,在终端里运行 brew install ffmpeg 就行了。)

仍然提示 uv 或 ffmpeg 未找到怎么办?

打开一个新的cmd,输入uv,如果提示未找到,说明 %userprofile%/.local/bin不在环境变量中

点开左下角"开始菜单"找到 "命令行提示符",右键-->更多--->以管理员身份运行,粘贴这个命令,回车执行

reg add "HKCU\Environment" /v Path /t REG_EXPAND_SZ /d "%PATH%;%USERPROFILE%\.local\bin" /f

太棒了! 最关键的准备工作已经完成。这两个工具只需要安装这一次,以后就再也不用管了。

第二部分:下载程序与模型

现在,我们来下载转录工具本身。

步骤 1:下载主程序

  • 下载地址: https://pyvideotrans.com/stt.7z (约600KB)

  • 操作步骤:

    1. 点击上面的链接下载 stt.7z 压缩包。
    2. 把它解压到你喜欢的位置,比如桌面。解压后你会得到一个文件夹modelsapp.pyindex.html 文件。

步骤 2:下载核心模型

模型就是这个工具的"大脑",负责识别语音。

  • 下载模型国内: https://hf-mirror.com/dropbox-dash/faster-whisper-large-v3-turbo/resolve/main/model.bin?download=true
  • 下载模型墙外: https://huggingface.co/dropbox-dash/faster-whisper-large-v3-turbo/resolve/main/model.bin?download=true
  • 操作步骤:
    1. 点击链接下载这个 model.bin 文件(文件1.6G,请耐心等待)。
    2. 下载完成后,把它移动到我们刚才解压的程序文件夹里。具体路径是:进入程序文件夹 -> 进入 models 文件夹 -> 进入 turbo 文件夹,然后把 model.bin 放进这个 turbo 文件夹里

第三部分:启动与使用

  1. 打开我们刚才解压的程序文件夹。

  2. 在文件夹顶部的地址栏里,清空所有内容 ,输入 cmd,然后按回车键。这会弹出一个黑色窗口。

  3. 在黑色窗口里,输入下面的命令,然后按回车键: uv run app.py

  4. 稍等片刻,当窗口里显示出类似下面的信息时,就代表服务启动成功了!

  5. 同时,你的默认浏览器会自动打开一个新页面,这就是我们的语音转录工具界面!

现在,你就可以点击或拖拽你的音频/视频文件上去,调整参数,然后点击"提交转录"来体验了!祝你使用愉快!

相关推荐
OpenCSG4 小时前
CSGHub v1.12.0开源版本更新
人工智能·开源·opencsg·csghub
兆龙电子单片机设计4 小时前
【STM32项目开源】STM32单片机物联网门禁控制系统
stm32·单片机·物联网·开源·自动化
ApacheSeaTunnel4 小时前
结项报告完整版 | Apache SeaTunnel支持metalake开发
大数据·开源·数据集成·seatunnel·数据同步
白鲸开源4 小时前
结项报告完整版:Apache SeaTunnel 支持 Flink 引擎 Schema Evolution 功能
大数据·flink·开源
OpenTiny社区5 小时前
不止按钮和表格!TinyVue 偷偷上线 Space 组件,直接搞定「弹性+间距」布局
前端·vue.js·github
用户221765927926 小时前
python第三方库可以处理多线程请求接口结果顺序问题?
github
软件供应链安全指南6 小时前
“基于‘多模态SCA+全周期协同’的中间件开源风险治理实践”荣获OSCAR开源+安全及风险治理案例
安全·中间件·开源
CoderJia程序员甲6 小时前
GitHub 热榜项目 - 日榜(2025-11-11)
ai·开源·大模型·github·ai教程
lkbhua莱克瓦246 小时前
Java入门——Java跨平台的原理
java·开发语言·笔记·github