STT语音识别转文字工具 - 离线运行的本地语音识别服务

黑贝是条狗2024-12-19 22:44

STT - 强大的离线语音识别转文字工具

STT是一款功能强大的本地语音识别转文字工具,基于fast-whisper开源模型开发,可以将视频和音频中的人声识别并转换为文字。它支持多种输出格式,包括JSON、带时间戳的SRT字幕以及纯文本格式,为用户提供了灵活的选择。

主要特点

完全离线运行,保护隐私
支持多种语言识别
识别准确率高,可媲美OpenAI官方API
多种输出格式:JSON、SRT字幕、纯文本
内置base模型,可自行下载更大模型提升效果

使用方法

从GitHub Releases页面下载预编译版本
解压后运行start.exe,等待浏览器自动打开
上传音视频文件,选择语言和输出格式
点击"立即开始识别"即可获得转换结果

高级功能

支持CUDA加速,提高识别速度
提供API接口,方便集成到其他系统
可自定义模型,balance效果和资源消耗

学习资源

STT为用户提供了一个强大而灵活的离线语音识别解决方案,无论是个人使用还是企业部署,都是一个值得尝试的工具。欢迎大家下载使用,如有问题可在GitHub提issue讨论。

上一篇：CSS|08 浮动&清除浮动

下一篇：VSCode使用

热门推荐

01GitHub 镜像站点 02如何新建文件夹？电脑新建文件夹的4种方法 032026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 04AI科技热点日报 | 2026年07月01日 05国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）06幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 08微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 092026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？10【解构】DeepSeek V4 发布：技术报告深度解读 + 横向对比六大开源模型，我们的判断是……