Mozilla为本地音频到文本翻译开发Whisperfile引擎

Mozilla Ocho 小组正进行 Mozilla 的"创新和实验"。Llamafile 用于将大型语言模型以单个文件的形式发布,以便在不同的硬件/软件间轻松执行。Whisperfile 是一项将音频轻松转化为文本的新引擎。

正如其名称所暗示的,Whisperfile 是围绕 OpenAI 的 Whisper 模型构建的,用于本地音频/语言翻译。Whisperfile 基于 Whisper.cpp 源,在转录过程中还能将非英语音频翻译成英语。

Whisperfiles 可在 Linux、Windows、macOS、FreeBSD、OpenBSD 和 NetBSD 系统中运行。Whisperfiles 目前可在 x86_64 和 AArch64 上运行。

想了解有关 Whisperfile 的更多信息,请访问 HuggingFace 上的 Mozilla/whisperfile:

https://huggingface.co/Mozilla/whisperfile

Mozilla 曾开发过 DeepSpeech 作为开源离线语音到文本引擎。DeepSpeech 利用了 TensorFlow 和百度的 Deep Speech 研究论文。遗憾的是,DeepSpeech 的开发随着 Mozilla 之前的裁员而停止,其 GitHub 存储库已经有三年没有任何提交了。

相关推荐
腾讯云音视频12 分钟前
AI实时对话的通信基础,WebRTC技术综合指南
人工智能·webrtc
暴龙胡乱写博客19 分钟前
机器学习 --- 模型选择与调优
人工智能·机器学习
白熊18837 分钟前
【计算机视觉】OpenCV实战项目:基于OpenCV与face_recognition的实时人脸识别系统深度解析
人工智能·opencv·计算机视觉
闭月之泪舞42 分钟前
OpenCv高阶(4.0)——案例:海报的透视变换
人工智能·opencv·计算机视觉
九亿AI算法优化工作室&1 小时前
乡村地区无人机医药配送路径规划与优化仿真
人工智能·算法·matlab·回归
jndingxin1 小时前
OpenCV CUDA模块中矩阵操作-----矩阵最大最小值查找函数
人工智能·opencv
AI Echoes1 小时前
LLM(大语言模型)部署加速方法——PagedAttention
人工智能·语言模型·自然语言处理
yangshuo12811 小时前
风车OVF镜像:解放AI开发限制的Ubuntu精简系统
linux·人工智能·ubuntu
Jamence1 小时前
多模态大语言模型arxiv论文略读(七十七)
人工智能·语言模型·自然语言处理
AI量化投资实验室2 小时前
金融量化智能体,如何开发一个有效的策略?
人工智能·金融