Mozilla为本地音频到文本翻译开发Whisperfile引擎

Mozilla Ocho 小组正进行 Mozilla 的"创新和实验"。Llamafile 用于将大型语言模型以单个文件的形式发布,以便在不同的硬件/软件间轻松执行。Whisperfile 是一项将音频轻松转化为文本的新引擎。

正如其名称所暗示的,Whisperfile 是围绕 OpenAI 的 Whisper 模型构建的,用于本地音频/语言翻译。Whisperfile 基于 Whisper.cpp 源,在转录过程中还能将非英语音频翻译成英语。

Whisperfiles 可在 Linux、Windows、macOS、FreeBSD、OpenBSD 和 NetBSD 系统中运行。Whisperfiles 目前可在 x86_64 和 AArch64 上运行。

想了解有关 Whisperfile 的更多信息,请访问 HuggingFace 上的 Mozilla/whisperfile:

https://huggingface.co/Mozilla/whisperfile

Mozilla 曾开发过 DeepSpeech 作为开源离线语音到文本引擎。DeepSpeech 利用了 TensorFlow 和百度的 Deep Speech 研究论文。遗憾的是,DeepSpeech 的开发随着 Mozilla 之前的裁员而停止,其 GitHub 存储库已经有三年没有任何提交了。

相关推荐
Christo316 分钟前
TFS-2018《On the convergence of the sparse possibilistic c-means algorithm》
人工智能·算法·机器学习·数据挖掘
qq_5088234016 分钟前
金融量化指标--2Alpha 阿尔法
大数据·人工智能
黑金IT43 分钟前
`.cursorrules` 与 `.cursorcontext`:Cursor AI 编程助手时代下的“双轨配置”指南
人工智能
dlraba8021 小时前
基于 OpenCV 的信用卡数字识别:从原理到实现
人工智能·opencv·计算机视觉
IMER SIMPLE2 小时前
人工智能-python-深度学习-经典神经网络AlexNet
人工智能·python·深度学习
小憩-3 小时前
【机器学习】吴恩达机器学习笔记
人工智能·笔记·机器学习
却道天凉_好个秋4 小时前
深度学习(二):神经元与神经网络
人工智能·神经网络·计算机视觉·神经元
UQI-LIUWJ4 小时前
unsloth笔记:运行&微调 gemma
人工智能·笔记·深度学习
THMAIL4 小时前
深度学习从入门到精通 - 生成对抗网络(GAN)实战:创造逼真图像的魔法艺术
人工智能·python·深度学习·神经网络·机器学习·生成对抗网络·cnn
却道天凉_好个秋4 小时前
计算机视觉(八):开运算和闭运算
人工智能·计算机视觉·开运算与闭运算