Mozilla为本地音频到文本翻译开发Whisperfile引擎

Mozilla Ocho 小组正进行 Mozilla 的"创新和实验"。Llamafile 用于将大型语言模型以单个文件的形式发布,以便在不同的硬件/软件间轻松执行。Whisperfile 是一项将音频轻松转化为文本的新引擎。

正如其名称所暗示的,Whisperfile 是围绕 OpenAI 的 Whisper 模型构建的,用于本地音频/语言翻译。Whisperfile 基于 Whisper.cpp 源,在转录过程中还能将非英语音频翻译成英语。

Whisperfiles 可在 Linux、Windows、macOS、FreeBSD、OpenBSD 和 NetBSD 系统中运行。Whisperfiles 目前可在 x86_64 和 AArch64 上运行。

想了解有关 Whisperfile 的更多信息,请访问 HuggingFace 上的 Mozilla/whisperfile:

https://huggingface.co/Mozilla/whisperfile

Mozilla 曾开发过 DeepSpeech 作为开源离线语音到文本引擎。DeepSpeech 利用了 TensorFlow 和百度的 Deep Speech 研究论文。遗憾的是,DeepSpeech 的开发随着 Mozilla 之前的裁员而停止,其 GitHub 存储库已经有三年没有任何提交了。

相关推荐
AI导出鸭4 分钟前
智谱清言复制表格|AI 导出鸭一站式解决表格导出各类难题
人工智能
江畔柳前堤7 分钟前
github实战指南03-Pull Request 全流程实战
开发语言·人工智能·python·深度学习·github·word
小二·9 分钟前
AI 编程工具深度实战:从 Copilot 到 Coding Agent
人工智能·copilot
米小虾10 分钟前
让AI自主运行:Loop Engineering设计指南
人工智能·agent
shelutai11 分钟前
大模型折扣站66ai.ai使用方法
人工智能
微学AI12 分钟前
递阶式智能体开发范式(HADP):从超级Agent到智能体应用的层级架构理论与工程实践
人工智能·架构·agent
小易撩挨踢12 分钟前
[特殊字符] Spring AI 2.0.0 正式发布:大版本升级,MCP 原生集成 + Anthropic SDK 全线重构
人工智能·spring·重构
萤丰信息12 分钟前
从数字化到AI自治!2026智慧园区全新运营变革趋势
人工智能·智慧城市
老刘说AI13 分钟前
类Sora模型:解锁动态视觉艺术的密码
人工智能·stable diffusion·架构·embedding
basketball61614 分钟前
AI Infra 硬件体系与编程模型:17. CUDA编程基础:底层驱动 API 调用
人工智能·microsoft·nvidia·cuda