Mozilla为本地音频到文本翻译开发Whisperfile引擎

DisonTangor2024-08-25 9:52

Mozilla Ocho 小组正进行 Mozilla 的"创新和实验"。Llamafile 用于将大型语言模型以单个文件的形式发布，以便在不同的硬件/软件间轻松执行。Whisperfile 是一项将音频轻松转化为文本的新引擎。

正如其名称所暗示的，Whisperfile 是围绕 OpenAI 的 Whisper 模型构建的，用于本地音频/语言翻译。Whisperfile 基于 Whisper.cpp 源，在转录过程中还能将非英语音频翻译成英语。

Whisperfiles 可在 Linux、Windows、macOS、FreeBSD、OpenBSD 和 NetBSD 系统中运行。Whisperfiles 目前可在 x86_64 和 AArch64 上运行。

想了解有关 Whisperfile 的更多信息，请访问 HuggingFace 上的 Mozilla/whisperfile：

https://huggingface.co/Mozilla/whisperfile

Mozilla 曾开发过 DeepSpeech 作为开源离线语音到文本引擎。DeepSpeech 利用了 TensorFlow 和百度的 Deep Speech 研究论文。遗憾的是，DeepSpeech 的开发随着 Mozilla 之前的裁员而停止，其 GitHub 存储库已经有三年没有任何提交了。