10K star!免费离线的语音转文字工具,远超垃圾付费软件

工作中你会有这些情况吗,开会想要快速记录内容?想要导出视频的内容文本?想把音频转文字?

今天我们介绍的开源项目,可以免费进行视频/音频转录文字,也支持实时语音转文字,并且离线可用,帮助打工人提升效率,它就是:buzz

buzz 是什么

Buzz 是一款基于 OpenAI Whisper 的开源、可离线的实时语音转文字工具,支持 Windows、macOS、Linux,它可以将麦克风的语音实时转换为文字,也支持将视频、音频文件转换为文字、字幕。buzz目前支持Whisper、 Whisper.cpp、Faster Whisper、 Whisper 兼容的 Hugging Face 模型和OpenAI Whisper API。

Buzz目前的主要功能:

  • 从麦克风实时语音转录文字、实时翻译
  • 导入音频、视频文件(mp3、wav、m4a、ogg、mp4、webm、ogm),导出逐句字幕或逐词字幕(导出格式:TXT、SRT、VTT)

安装buzz

buzz的安装非常方便,各平台都有支持一键安装或下载离线包。离线包还是不小的,以mac为例,下载是380mb,安装后大概要1.3G左右。

macOS

通过brew安装:

css 复制代码
brew install --cask buzz

或者,下载并运行该Buzz-x.y.z.dmg文件。

Windows(要求Win10以上)

下载并运行该Buzz-x.y.z.exe文件。

Linux

arduino 复制代码
sudo apt-get install libportaudio2

sudo snap install buzz

安装完成后打开软件,界面非常非常的简洁。

使用 buzz

在第一次使用 Buzz 的时候,会下载 Whisper 的模型,根据不同的质量要求,模型的大小也不相同,在有条件的情况下,建议考虑中大型的模型。可以参考下表:

视频/音频转录:

  • 单击"文件"菜单上的"导入媒体文件"(或工具栏上的"+"图标,或Command/Ctrl + O)。
  • 选择音频或视频文件。
  • 选择任务、语言和模型设置。

  • 单击运行,开始任务。

  • 当转录状态显示"已完成"时,双击该行(或选择该行并单击"⤢"图标)以查看结果。

如果选择比较大的模型,那速度就会比较慢。

实时转录:

  • 点击麦克风图表,选择录音任务、语言、质量和麦克风。
  • 单击"录制"。

注意:使用默认 Whisper 模型转录音频会占用大量资源。考虑使用 Whisper.cpp Tiny 模型来获得实时性能。

存储位置:

buzz使用到的模型会存储在本地,但是目前没看到修改存储位置的设置,当前存储位置如下:

Whisper 模型存储在~/.cache/whisper.

Whisper.cpp 模型存储在~/Library/Caches/Buzz (Mac OS)、~/.cache/Buzz(Unix) 或C:\Users\\AppData\Local\Buzz\Buzz\Cache(Windows) 中。

Hugging Face模型存储在~/.cache/huggingface/hub.

总结

Buzz是款非常不错的语音转录工具,可以大大的提升工作效率,我总结一下它具有的特点:

  • 高精度:基于 OpenAI 开源的强大机器学习模型 Whisper ,Buzz的识别精度很高
  • 速度快:Buzz 的模型都是离线使用,因此转换速度很快,适合批量转换语音
  • 跨平台:目前支持Windows /macOS / Linux
  • 多语言:不仅支持中文,也支持很多个国家的语言,还能将结果翻译,但翻译只支持英文

项目信息

相关推荐
GitCode官方6 分钟前
GitCode 光引计划投稿 | GoIoT:开源分布式物联网开发平台
分布式·开源·gitcode
m0_7482567818 分钟前
WebGIS实战开源项目:智慧机场三维可视化(学习笔记)
笔记·学习·开源
猫头虎1 小时前
新纪天工 开物焕彩:重大科技成就发布会参会感
人工智能·开源·aigc·开放原子·开源软件·gpu算力·agi
血色橄榄枝3 小时前
进阶岛-L2G5000
人工智能·开源
sdaxue.com12 小时前
帝国CMS:如何去掉帝国CMS登录界面的认证码登录
数据库·github·网站·帝国cms·认证码
在肯德基吃麻辣烫12 小时前
使用开源在线聊天工具Fiora轻松搭建个性化聊天平台在线交流
开源
m0_7482475512 小时前
github webhooks 实现网站自动更新
github
是小崔啊13 小时前
开源轮子 - EasyExcel01(核心api)
java·开发语言·开源·excel·阿里巴巴
张国荣家的弟弟14 小时前
【Yonghong 企业日常问题04】永洪BI可视化工具Linux部署全攻略(部署详解版)
linux·运维·github
fanstuck14 小时前
Prompt提示工程上手指南(七)Prompt编写实战-基于智能客服问答系统下的Prompt编写
人工智能·数据挖掘·openai