whisper

gs801402 小时前
人工智能·whisper·语音识别
Faster-Whisper —— 为语音识别加速的利器在语音识别技术迅速发展的今天,OpenAI 的 Whisper 模型因其强大的多语言识别能力和优异的准确率而受到广泛关注。然而,高精度模型往往伴随着高昂的计算开销和较长的推理时间,这对于需要实时或大规模转录的场景来说可能并不理想。为此,社区中涌现出了一系列优化方案,其中 faster_whisper 脱颖而出,成为实现更快速、高效语音识别的优秀工具。
charles_vaez6 天前
深度学习·whisper·aigc
开源模型应用落地-语音转文本-whisper模型-AIGC应用探索(五)在上一节中,学习了如何使用vLLM来部署Whisper-large-v3-turbo模型。不过,在实际使用时,模型一次只能处理30秒的音频。今天,将结合实际业务,介绍如何处理一段完整的音频,并生成相应的字幕文件。
Mark White17 天前
whisper
开箱即用的whisper-service服务https://github.com/openai/whisperhttps://docker.aityp.com/r/docker.io/onerahmet
Python数据分析与机器学习1 个月前
大数据·人工智能·python·搜索引擎·whisper·语音识别·课程设计
基于fast-whisper模型的语音识别工具的设计与实现目录摘 要第1章 绪 论1.1 论文研究主要内容1.1.1模型类型选择1.1.2开发语言的选择1.2 国内外现状
不喝可乐_1 个月前
whisper
在win11 中 whisper-large-v3-turbo 的简单使用项目中如果有虚拟环境,忽略以上1,2,3; 在项目下执行
毛毛的毛毛1 个月前
whisper
如何使用OPENAI的Whisper功能进行音频字母提取功能首先你可以使用 Python 中的 requests 库来下载该音频文件,然后通过 open() 打开该文件并传递给 OpenAI Whisper API。
Secede.2 个月前
开发语言·python·whisper
Whisper+T5-translate实现python实时语音翻译
烤鸭的世界我们不懂2 个月前
python·whisper·语音识别
Python + WhisperX:解锁语音识别的高效新姿势大家好,我是烤鸭:最近在尝试做视频的质量分析,打算利用asr针对声音判断是否有人声,以及识别出来的文本进行进一步操作。asr看了几个开源的,最终选择了openai的whisper,后来发现性能不行,又换了whisperX。这是一篇实战和代码为主的文章。
落杉丶2 个月前
python·whisper
[ASR]faster-whisper报错Could not locate cudnn_ops64_9.dll再初次安装之后,首次运行出现以下错误。(参照本文安装命令)看到其他帖子的方案都是下载dll文件,但是我尝试直接安装cuda版torch时,发现问题已经解决
drebander3 个月前
whisper·音视频
Whisper-Medium 模型:音频转文本的原理、实践与硬件推荐Whisper-Medium 是 OpenAI 提供的中型语音识别模型,具有良好的精度和速度平衡,适合对识别准确率要求较高的离线语音转文本场景。它支持多语言并具有较强的泛化能力,但相较于更小的模型(如 Tiny 和 Base),对硬件性能有更高要求。
drebander3 个月前
whisper·音视频
Whisper-Tiny 模型:音频转文本的原理与实践Whisper 是 OpenAI 发布的一款多语言语音识别模型,具有多个不同大小的模型(Tiny 到 Large),支持离线语音识别。Whisper-Tiny 是其最轻量级的模型版本,适合硬件资源有限、对准确性要求不高但需要快速处理的场景。
大模型之路3 个月前
人工智能·whisper·语音识别
OpenAI Whisper:语音识别技术的革新者—深入架构与参数当下语音识别技术正以前所未有的速度发展,极大地推动了人机交互的便利性和效率。OpenAI的Whisper系统无疑是这一领域的佼佼者,它凭借其卓越的性能、广泛的适用性和创新的技术架构,正在重新定义语音转文本技术的规则。今天我们一起了解一下Whisper的架构、核心能力以及其丰富的参数设置,帮助读者更好地理解这一前沿技术。
南棱笑笑生3 个月前
whisper
20250109使用M6000显卡在Ubuntu20.04.6下跑whisper来识别中英文字幕20250109使用M6000显卡在Ubuntu20.04.6下跑whisper来识别中英文字幕 2025/1/9 20:57
飘逸高铁侠3 个月前
ffmpeg·whisper·音视频
使用 whisper和ffmpeg 烧录视频的中英文双语字幕使用 whisper和ffmpeg 来烧录中英文双语字幕,可以通过以下几个步骤来修改你的代码。主要修改的地方是生成字幕的方式,将字幕通过 ffmpeg 的命令行工具烧录到视频中。通过生成字幕文件(.srt)然后用 ffmpeg 将字幕直接烧录到视频里。
长风清留扬3 个月前
人工智能·神经网络·opencv·计算机视觉·自然语言处理·数据挖掘·whisper
基于OpenAI Whisper AI模型自动生成视频字幕:全面解析与实战指南在数字化时代,视频内容已成为信息传播的重要载体。然而,为视频添加字幕却是一项繁琐且耗时的工作。幸运的是,随着人工智能技术的飞速发展,特别是OpenAI Whisper模型的推出,我们有了更加高效、智能的解决方案。
Aileen_0v03 个月前
linux·数据结构·人工智能·笔记·网络协议·tcp/ip·whisper
【AI驱动的数据结构:包装类的艺术与科学】🌈个人主页: Aileen_0v0 🔥热门专栏: 华为鸿蒙系统学习|计算机网络|数据结构与算法 💫个人格言:“没有罗马,那就自己创造罗马~”
带电的小王3 个月前
android·智能手机·whisper·qualcomm
WhisperKit: Android 端测试 Whisper -- Android手机(Qualcomm GPU)部署音频大模型原文:https://flowus.cn/xiaoj_share/share/8c721e89-680e-451c-8c93-52e435ebf1a2
带电的小王3 个月前
android·智能手机·llm·whisper·音频大模型·whisper.cpp
whisper.cpp: Android端测试 -- Android端手机部署音频大模型以下是经实验验证可行的环境参考,也可尝试其他版本。(1)PC:Ubuntu 22.04.4(2)硬件设备:Android 手机
带电的小王3 个月前
llm·whisper·音视频·音频大模型
whisper.cpp: PC端测试 -- 电脑端部署音频大模型以下是经实验验证可行的环境参考,也可尝试其他版本。(1)PC:Ubuntu 22.04.4(2)软件环境:如下表所示
AI慧聚堂3 个月前
whisper
记录本地部署 Whisper 模型的过程Whisper 是论文中提出的用于自动语音识别 (ASR) 和语音翻译先进的模型通过大规模弱监督实现稳健语音识别 作者:Alec Radford 等人,来自 OpenAI。Whisper 在 >5M 小时的标记数据上进行了训练,表现出了很强的泛化能力 数据集和域。