Mozilla为本地音频到文本翻译开发Whisperfile引擎

Mozilla Ocho 小组正进行 Mozilla 的"创新和实验"。Llamafile 用于将大型语言模型以单个文件的形式发布,以便在不同的硬件/软件间轻松执行。Whisperfile 是一项将音频轻松转化为文本的新引擎。

正如其名称所暗示的,Whisperfile 是围绕 OpenAI 的 Whisper 模型构建的,用于本地音频/语言翻译。Whisperfile 基于 Whisper.cpp 源,在转录过程中还能将非英语音频翻译成英语。

Whisperfiles 可在 Linux、Windows、macOS、FreeBSD、OpenBSD 和 NetBSD 系统中运行。Whisperfiles 目前可在 x86_64 和 AArch64 上运行。

想了解有关 Whisperfile 的更多信息,请访问 HuggingFace 上的 Mozilla/whisperfile:

https://huggingface.co/Mozilla/whisperfile

Mozilla 曾开发过 DeepSpeech 作为开源离线语音到文本引擎。DeepSpeech 利用了 TensorFlow 和百度的 Deep Speech 研究论文。遗憾的是,DeepSpeech 的开发随着 Mozilla 之前的裁员而停止,其 GitHub 存储库已经有三年没有任何提交了。

相关推荐
Q8343158196 分钟前
海思SD3403(21AP10, 108DC2910 )4K60 的 ISP 图像处理能力,4Tops INT8算力
linux·图像处理·人工智能·嵌入式硬件·视觉检测·视频编解码
机器不会学习CL12 分钟前
分类预测|基于麻雀优化支持向量机的Adaboost集成的数据分类预测Matlab程序SSA-SVM-Adaboost
人工智能·算法·机器学习·支持向量机·matlab·分类
科技资讯快报31 分钟前
容联云容犀Copilot&Agent入选《中国 AI Agent 产品罗盘》
大数据·人工智能·copilot
爱研究的小牛43 分钟前
ESRGAN——老旧照片、视频帧的修复和增强,提高图像的分辨率
人工智能·深度学习·自动化·aigc·音视频
ClonBrowser1 小时前
社交媒体的未来:Facebook如何通过AI技术引领潮流
人工智能·媒体·facebook
chiikawa&q1 小时前
(不用互三)解密AI创作:提升Prompt提示词的提问技巧
人工智能·prompt
E___V___E1 小时前
yolov1到yolov5的发展
人工智能·yolo·目标跟踪
tangjunjun-owen1 小时前
kitti数据label的2d与3d坐标转为像素坐标方法与教程(代码实现)
人工智能·opencv·3d·3d目标检测·kitti·内参
使者大牙2 小时前
深度学习中的常用线性代数知识汇总——第一篇:基础概念、秩、奇异值
人工智能·pytorch·python·深度学习·线性代数
猿类崛起@2 小时前
OpenAI o1预览模型发布:推理能力更强 可达理科博士生水准
人工智能·深度学习·ai大模型·大模型学习·大模型入门·大模型教程