Mozilla为本地音频到文本翻译开发Whisperfile引擎

Mozilla Ocho 小组正进行 Mozilla 的"创新和实验"。Llamafile 用于将大型语言模型以单个文件的形式发布,以便在不同的硬件/软件间轻松执行。Whisperfile 是一项将音频轻松转化为文本的新引擎。

正如其名称所暗示的,Whisperfile 是围绕 OpenAI 的 Whisper 模型构建的,用于本地音频/语言翻译。Whisperfile 基于 Whisper.cpp 源,在转录过程中还能将非英语音频翻译成英语。

Whisperfiles 可在 Linux、Windows、macOS、FreeBSD、OpenBSD 和 NetBSD 系统中运行。Whisperfiles 目前可在 x86_64 和 AArch64 上运行。

想了解有关 Whisperfile 的更多信息,请访问 HuggingFace 上的 Mozilla/whisperfile:

https://huggingface.co/Mozilla/whisperfile

Mozilla 曾开发过 DeepSpeech 作为开源离线语音到文本引擎。DeepSpeech 利用了 TensorFlow 和百度的 Deep Speech 研究论文。遗憾的是,DeepSpeech 的开发随着 Mozilla 之前的裁员而停止,其 GitHub 存储库已经有三年没有任何提交了。

相关推荐
geneculture1 天前
当前主流人工智能(大语言模型、世界模型)与融智学双重形式化路径之间的根本差异
人工智能·融智学的重要应用·哲学与科学统一性·融智时代(杂志)·人际间性·人机间性
江南一点雨1 天前
让AI更懂你,松哥教你一招!
人工智能
淡海水1 天前
【AI模型】核心概念解析
人工智能·机器学习
AI 编程助手GPT1 天前
GPT-5.6意外曝光、Claude安全检查全面公测、Grok 4.3搅局价格战——多模型混战的五月,开发者如何避坑?
人工智能·gpt·ai·chatgpt·bug·ai编程
刘~浪地球1 天前
DeepSeek V3 vs GPT-4 深度对比测评:国产大模型能否一战?
人工智能
IT_陈寒1 天前
JavaScript的异步地狱,我差点没爬出来
前端·人工智能·后端
AI木马人1 天前
20.人工智能实战:大模型项目如何从 Demo 走向生产?一套可落地的上线验收清单与工程治理方案
java·开发语言·人工智能
湘-枫叶情缘1 天前
穿透范畴的迷雾:从“四范式”到AI问题建模的现代认知框架
人工智能
@不误正业1 天前
OpenHarmony-A2A协议实战-多智能体跨应用协同架构与实现
人工智能·架构·harmonyos·开源鸿蒙
前端.火鸡1 天前
如何使用本地显卡算力给AI赋能(文生图、图生图等)分币不要、无限次数
人工智能