技术栈
whisper
不喝可乐_
12 小时前
whisper
在win11 中 whisper-large-v3-turbo 的简单使用
项目中如果有虚拟环境,忽略以上1,2,3; 在项目下执行
毛毛的毛毛
4 天前
whisper
如何使用OPENAI的Whisper功能进行音频字母提取功能
首先你可以使用 Python 中的 requests 库来下载该音频文件,然后通过 open() 打开该文件并传递给 OpenAI Whisper API。
Secede.
7 天前
开发语言
·
python
·
whisper
Whisper+T5-translate实现python实时语音翻译
烤鸭的世界我们不懂
7 天前
python
·
whisper
·
语音识别
Python + WhisperX:解锁语音识别的高效新姿势
大家好,我是烤鸭:最近在尝试做视频的质量分析,打算利用asr针对声音判断是否有人声,以及识别出来的文本进行进一步操作。asr看了几个开源的,最终选择了openai的whisper,后来发现性能不行,又换了whisperX。这是一篇实战和代码为主的文章。
落杉丶
23 天前
python
·
whisper
[ASR]faster-whisper报错Could not locate cudnn_ops64_9.dll
再初次安装之后,首次运行出现以下错误。(参照本文安装命令)看到其他帖子的方案都是下载dll文件,但是我尝试直接安装cuda版torch时,发现问题已经解决
drebander
1 个月前
whisper
·
音视频
Whisper-Medium 模型:音频转文本的原理、实践与硬件推荐
Whisper-Medium 是 OpenAI 提供的中型语音识别模型,具有良好的精度和速度平衡,适合对识别准确率要求较高的离线语音转文本场景。它支持多语言并具有较强的泛化能力,但相较于更小的模型(如 Tiny 和 Base),对硬件性能有更高要求。
drebander
1 个月前
whisper
·
音视频
Whisper-Tiny 模型:音频转文本的原理与实践
Whisper 是 OpenAI 发布的一款多语言语音识别模型,具有多个不同大小的模型(Tiny 到 Large),支持离线语音识别。Whisper-Tiny 是其最轻量级的模型版本,适合硬件资源有限、对准确性要求不高但需要快速处理的场景。
大模型之路
1 个月前
人工智能
·
whisper
·
语音识别
OpenAI Whisper:语音识别技术的革新者—深入架构与参数
当下语音识别技术正以前所未有的速度发展,极大地推动了人机交互的便利性和效率。OpenAI的Whisper系统无疑是这一领域的佼佼者,它凭借其卓越的性能、广泛的适用性和创新的技术架构,正在重新定义语音转文本技术的规则。今天我们一起了解一下Whisper的架构、核心能力以及其丰富的参数设置,帮助读者更好地理解这一前沿技术。
南棱笑笑生
1 个月前
whisper
20250109使用M6000显卡在Ubuntu20.04.6下跑whisper来识别中英文字幕
20250109使用M6000显卡在Ubuntu20.04.6下跑whisper来识别中英文字幕 2025/1/9 20:57
飘逸高铁侠
1 个月前
ffmpeg
·
whisper
·
音视频
使用 whisper和ffmpeg 烧录视频的中英文双语字幕
使用 whisper和ffmpeg 来烧录中英文双语字幕,可以通过以下几个步骤来修改你的代码。主要修改的地方是生成字幕的方式,将字幕通过 ffmpeg 的命令行工具烧录到视频中。通过生成字幕文件(.srt)然后用 ffmpeg 将字幕直接烧录到视频里。
长风清留扬
2 个月前
人工智能
·
神经网络
·
opencv
·
计算机视觉
·
自然语言处理
·
数据挖掘
·
whisper
基于OpenAI Whisper AI模型自动生成视频字幕:全面解析与实战指南
在数字化时代,视频内容已成为信息传播的重要载体。然而,为视频添加字幕却是一项繁琐且耗时的工作。幸运的是,随着人工智能技术的飞速发展,特别是OpenAI Whisper模型的推出,我们有了更加高效、智能的解决方案。
Aileen_0v0
2 个月前
linux
·
数据结构
·
人工智能
·
笔记
·
网络协议
·
tcp/ip
·
whisper
【AI驱动的数据结构:包装类的艺术与科学】
🌈个人主页: Aileen_0v0 🔥热门专栏: 华为鸿蒙系统学习|计算机网络|数据结构与算法 💫个人格言:“没有罗马,那就自己创造罗马~”
带电的小王
2 个月前
android
·
智能手机
·
whisper
·
qualcomm
WhisperKit: Android 端测试 Whisper -- Android手机(Qualcomm GPU)部署音频大模型
原文:https://flowus.cn/xiaoj_share/share/8c721e89-680e-451c-8c93-52e435ebf1a2
带电的小王
2 个月前
android
·
智能手机
·
llm
·
whisper
·
音频大模型
·
whisper.cpp
whisper.cpp: Android端测试 -- Android端手机部署音频大模型
以下是经实验验证可行的环境参考,也可尝试其他版本。(1)PC:Ubuntu 22.04.4(2)硬件设备:Android 手机
带电的小王
2 个月前
llm
·
whisper
·
音视频
·
音频大模型
whisper.cpp: PC端测试 -- 电脑端部署音频大模型
以下是经实验验证可行的环境参考,也可尝试其他版本。(1)PC:Ubuntu 22.04.4(2)软件环境:如下表所示
AI慧聚堂
2 个月前
whisper
记录本地部署 Whisper 模型的过程
Whisper 是论文中提出的用于自动语音识别 (ASR) 和语音翻译先进的模型通过大规模弱监督实现稳健语音识别 作者:Alec Radford 等人,来自 OpenAI。Whisper 在 >5M 小时的标记数据上进行了训练,表现出了很强的泛化能力 数据集和域。
学习中的程序媛~
2 个月前
python
·
whisper
·
语音识别
whisper实时语音转文字
安装Whisper pip install -U openai-whisper 1 此外你还需要安装ffmpeg。
曦云沐
2 个月前
人工智能
·
whisper
·
语音识别
深入解析:选择最适合你的Whisper语音识别模型
在语音识别领域,Whisper系列模型因其卓越的性能和多语言支持而备受青睐。今天,我们将详细解析三种不同的Whisper模型Whisper-large-v3、Belle-whisper-large-v3-zh以及Whisper-large-v3-turbo,帮助你根据具体需求选择最合适的版本。
ZVAyIVqt0UFji
2 个月前
ffmpeg
·
whisper
·
音视频
如何使用whisper+ollama+ffmpeg为视频添加中文字幕
在日常学习生活中,许多有价值的资料都是非中文的,例如 Andrej Karpathy 推出的几个与大模型相关的视频,例如经久不衰的 MIT 6.824 分布式系统课程,这些视频系统地讲解了特定领域的知识,时长较长,往往从一小时起步。如果逐句翻译,将耗费大量时间。然而,随着大型模型技术的快速发展,我们可以利用这些技术来翻译和学习这些视频,使我们的学习之路更加顺畅。本文将介绍如何使用 Whisper、Ollama 和 FFmpeg 组建一套完善的非中文视频翻译流程。
m0_74825656
2 个月前
前端
·
人工智能
·
whisper
Web 端语音对话 AI 示例:使用 Whisper 和 llama.cpp 构建语音聊天机器人
大语言模型(LLM)为基于文本的对话提供了强大的能力。那么,能否进一步扩展,将其转化为语音对话的形式呢?本文将展示如何使用 Whisper 语音识别和 llama.cpp 构建一个 Web 端语音聊天机器人。