Mozilla为本地音频到文本翻译开发Whisperfile引擎

Mozilla Ocho 小组正进行 Mozilla 的"创新和实验"。Llamafile 用于将大型语言模型以单个文件的形式发布,以便在不同的硬件/软件间轻松执行。Whisperfile 是一项将音频轻松转化为文本的新引擎。

正如其名称所暗示的,Whisperfile 是围绕 OpenAI 的 Whisper 模型构建的,用于本地音频/语言翻译。Whisperfile 基于 Whisper.cpp 源,在转录过程中还能将非英语音频翻译成英语。

Whisperfiles 可在 Linux、Windows、macOS、FreeBSD、OpenBSD 和 NetBSD 系统中运行。Whisperfiles 目前可在 x86_64 和 AArch64 上运行。

想了解有关 Whisperfile 的更多信息,请访问 HuggingFace 上的 Mozilla/whisperfile:

https://huggingface.co/Mozilla/whisperfile

Mozilla 曾开发过 DeepSpeech 作为开源离线语音到文本引擎。DeepSpeech 利用了 TensorFlow 和百度的 Deep Speech 研究论文。遗憾的是,DeepSpeech 的开发随着 Mozilla 之前的裁员而停止,其 GitHub 存储库已经有三年没有任何提交了。

相关推荐
twc82937 分钟前
大模型生成 QA Pairs 提升 RAG 应用测试效率的实践
服务器·数据库·人工智能·windows·rag·大模型测试
宇擎智脑科技39 分钟前
A2A Python SDK 源码架构解读:一个请求是如何被处理的
人工智能·python·架构·a2a
IT_陈寒40 分钟前
Redis缓存击穿:3个鲜为人知的防御策略,90%开发者都忽略了!
前端·人工智能·后端
电商API&Tina1 小时前
【电商API接口】开发者一站式电商API接入说明
大数据·数据库·人工智能·云计算·json
湘美书院--湘美谈教育1 小时前
湘美谈教育湘美书院网文研究:人工智能与微型小说选集
人工智能·深度学习·神经网络·机器学习·ai写作
uzong1 小时前
Harness Engineering 是什么?一场新的 AI 范式已经开始
人工智能·后端·架构
墨有6661 小时前
FieldFormer:基于物理场论的极简AI大模型底层架构,附带源码
人工智能·架构·电磁场算法映射
Mountain and sea2 小时前
从零搭建工业机器人激光切割+焊接产线:KUKA七轴协同+节卡AGV+视觉检测实战复盘
人工智能·机器人·视觉检测
K姐研究社2 小时前
阿里JVS Claw实测 – 手机一键部署 OpenClaw,开箱即用
人工智能·智能手机·aigc·飞书
卷积殉铁子2 小时前
从“手动挡”到“自动驾驶”:OpenClaw如何让AI开发变成“说话就行”
人工智能