whisper

带电的小王13 小时前
android·智能手机·llm·whisper·音频大模型·whisper.cpp
whisper.cpp: Android端测试 -- Android端手机部署音频大模型以下是经实验验证可行的环境参考,也可尝试其他版本。(1)PC:Ubuntu 22.04.4(2)硬件设备:Android 手机
带电的小王17 小时前
llm·whisper·音视频·音频大模型
whisper.cpp: PC端测试 -- 电脑端部署音频大模型以下是经实验验证可行的环境参考,也可尝试其他版本。(1)PC:Ubuntu 22.04.4(2)软件环境:如下表所示
AI慧聚堂3 天前
whisper
记录本地部署 Whisper 模型的过程Whisper 是论文中提出的用于自动语音识别 (ASR) 和语音翻译先进的模型通过大规模弱监督实现稳健语音识别 作者:Alec Radford 等人,来自 OpenAI。Whisper 在 >5M 小时的标记数据上进行了训练,表现出了很强的泛化能力 数据集和域。
学习中的程序媛~3 天前
python·whisper·语音识别
whisper实时语音转文字安装Whisper pip install -U openai-whisper 1 此外你还需要安装ffmpeg。
曦云沐3 天前
人工智能·whisper·语音识别
深入解析:选择最适合你的Whisper语音识别模型在语音识别领域,Whisper系列模型因其卓越的性能和多语言支持而备受青睐。今天,我们将详细解析三种不同的Whisper模型Whisper-large-v3、Belle-whisper-large-v3-zh以及Whisper-large-v3-turbo,帮助你根据具体需求选择最合适的版本。
ZVAyIVqt0UFji3 天前
ffmpeg·whisper·音视频
如何使用whisper+ollama+ffmpeg为视频添加中文字幕在日常学习生活中,许多有价值的资料都是非中文的,例如 Andrej Karpathy 推出的几个与大模型相关的视频,例如经久不衰的 MIT 6.824 分布式系统课程,这些视频系统地讲解了特定领域的知识,时长较长,往往从一小时起步。如果逐句翻译,将耗费大量时间。然而,随着大型模型技术的快速发展,我们可以利用这些技术来翻译和学习这些视频,使我们的学习之路更加顺畅。本文将介绍如何使用 Whisper、Ollama 和 FFmpeg 组建一套完善的非中文视频翻译流程。
m0_748256569 天前
前端·人工智能·whisper
Web 端语音对话 AI 示例:使用 Whisper 和 llama.cpp 构建语音聊天机器人大语言模型(LLM)为基于文本的对话提供了强大的能力。那么,能否进一步扩展,将其转化为语音对话的形式呢?本文将展示如何使用 Whisper 语音识别和 llama.cpp 构建一个 Web 端语音聊天机器人。
GPUStack14 天前
stable diffusion·llm·whisper·speech-to-text·text-to-speech
GPUStack v0.4:文生图模型、语音模型、推理引擎版本管理、离线支持和部署本地模型GPUStack 是一个专为运行 AI 模型设计的开源 GPU 集群管理器,致力于支持基于任何品牌的异构 GPU 构建统一管理的算力集群。无论这些 GPU 运行在 Apple Mac、Windows PC 还是 Linux 服务器上,GPUStack 都能将它们纳入统一的算力集群中。管理员可以轻松地从 Hugging Face 等流行的模型仓库中部署 AI 模型,开发人员则能够通过 OpenAI 兼容的 API 访问这些私有模型服务,就像使用 OpenAI 或 Microsoft Azure 提供的公共模
飘逸高铁侠19 天前
python·whisper·音视频·字幕
使用Python和OpenAI Whisper为视频生成字幕这段代码是用于加载 OpenAI 的 Whisper 模型的。在语音识别中,Whisper 是 OpenAI 提供的一个开源模型,专门用于语音转文字(ASR,Automatic Speech Recognition)。
engchina19 天前
whisper·potplayer
PotPlayer 最新版本支持使用 Whisper 自动识别语音生成字幕https://www.videohelp.com/software/PotPlayer
十八年后又是一条好汉1 个月前
whisper·语音识别·asr·stt
选择使用whisper.cpp进行语音转文字需要将一些wav格式的语音文件转成文字(ASR,STT),接到这个任务后,首先上网搜索有没有现成免费的工具或服务可以使用。常用的关键字如“语音转文字 免费 在线”。
ziqibit1 个月前
whisper·音视频
linux部署Whisper 视频音频转文字github链接:链接我这里使用anaconda来部署,debian12系统,其他linux也同样 可以使用gpu或者cpu版本,建议使用n卡,rtx3060以上
拾回程序猿的圈圈∞1 个月前
whisper
昇腾CANN环境下Whisper.cpp安装指南确认昇腾AI处理器已经安装妥当❕务必确认操作系统架构及版本、Python版本满足要求软件版本操作系统openEuler20.03/22.03, Ubuntu 20.04/22.04
凌虚(失业了求个工作)1 个月前
前端·人工智能·python·whisper·llama
Web 端语音对话 AI 示例:使用 Whisper 和 llama.cpp 构建语音聊天机器人大语言模型(LLM)为基于文本的对话提供了强大的能力。那么,能否进一步扩展,将其转化为语音对话的形式呢?本文将展示如何使用 Whisper 语音识别和 llama.cpp 构建一个 Web 端语音聊天机器人。
知来者逆1 个月前
人工智能·gpt·语言模型·自然语言处理·whisper·人机交互
基于集成Whisper 与 Pepper-GPT改进人机交互体验并实现顺畅通信随着技术以令人眼花缭乱的速度发展,使人机交互更加顺畅比以往任何时候都更加重要。为了应对这一挑战,一个新领域应运而生:人机交互(HRI)。有效的人机交互被认为是实现技术效益的关键。
CV-King1 个月前
人工智能·opencv·计算机视觉·whisper
AI生成字幕模型whisper介绍与使用随着人工智能技术的飞速发展,AI生成字幕模型已成为视频内容创作和传播领域的重要工具。其中,OpenAI推出的Whisper模型以其卓越的性能和广泛的应用场景,受到了广大用户和研究者的关注。本文将详细介绍Whisper模型的基本原理、特点、应用场景以及使用方法,旨在帮助读者更好地了解和运用这一先进技术。
昨日之日20061 个月前
人工智能·whisper·语音识别
Moonshine - 新型开源ASR(语音识别)模型,体积小,速度快,比OpenAI Whisper快五倍 本地一键整合包下载Moonshine 是由 Useful Sensors 公司推出的一系列「语音到文本(speech-to-text, STT)转换模型」,旨在为资源受限设备提供快速而准确的「自动语音识别(ASR)服务」。Moonshine 的设计特别适合于需要即时响应的应用场景,如实时转录和语音命令识别。相比同类产品,如 OpenAI 的 Whisper,Moonshine 在处理速度上提高了五倍,并且在多个标准数据集上展示了更低的词错误率(WER)。 Moonshine 在多个维度上超越了现有的语音识别解决方案,特别是
新缸中之脑2 个月前
人工智能·whisper·语音识别
基于Distil-Whisper的实时ASR【自动语音识别】在快速发展的语音识别领域,实现高精度的同时保持低延迟是一项重大挑战。OpenAI 的 Whisper 模型为自动语音识别 (ASR) 树立了新的标杆。然而,其规模可能会成为资源受限设备上实时应用的障碍。
敢敢のwings2 个月前
windows·whisper·1024程序员节
如何在Windows平台下基于Whisper来训练自己的数据最近快到1024程序员节了,再给大家上点干活。Whisper是openai开源的一个语音转文字模型。也是现在识别效果最好的离线数据模型,但是我们发现我们在完成一些中英文或者专业术语对话的时候。这时候表现的效果就比较差了。而这一步就得用微调的方式来完成对这些特定词语进行修正了。这里最近受到优刻得的使用邀请,正好解决了我在大模型和自动驾驶行业对GPU的使用需求。UCloud云计算旗下的Compshare的GPU算力云平台。他们提供高性价比的4090 GPU,按时收费每卡2.08元,月卡只需要1.36元每小时,
z千鑫2 个月前
人工智能·chatgpt·whisper·gpt-3·openai·语音识别·codemoss能用ai
【OpenAI】第六节(语音生成与语音识别技术)从 ChatGPT 到 Whisper 的全方位指南在人工智能的浪潮中,语音识别技术正逐渐成为我们日常生活中不可或缺的一部分。随着 OpenAI 的 Whisper 模型的推出,语音转文本的过程变得前所未有的简单和高效。无论是从 YouTube 视频中提取信息,还是将播客内容转化为文本,Whisper 都能帮助我们轻松实现这一目标。今天,我们将深入探讨 Whisper 的强大功能,并提供详细的使用教程,让你能够快速上手这一技术。🌟