技术栈
whisper
gs80140
2 小时前
人工智能
·
whisper
·
语音识别
Faster-Whisper —— 为语音识别加速的利器
在语音识别技术迅速发展的今天,OpenAI 的 Whisper 模型因其强大的多语言识别能力和优异的准确率而受到广泛关注。然而,高精度模型往往伴随着高昂的计算开销和较长的推理时间,这对于需要实时或大规模转录的场景来说可能并不理想。为此,社区中涌现出了一系列优化方案,其中 faster_whisper 脱颖而出,成为实现更快速、高效语音识别的优秀工具。
charles_vaez
6 天前
深度学习
·
whisper
·
aigc
开源模型应用落地-语音转文本-whisper模型-AIGC应用探索(五)
在上一节中,学习了如何使用vLLM来部署Whisper-large-v3-turbo模型。不过,在实际使用时,模型一次只能处理30秒的音频。今天,将结合实际业务,介绍如何处理一段完整的音频,并生成相应的字幕文件。
Mark White
17 天前
whisper
开箱即用的whisper-service服务
https://github.com/openai/whisperhttps://docker.aityp.com/r/docker.io/onerahmet
Python数据分析与机器学习
1 个月前
大数据
·
人工智能
·
python
·
搜索引擎
·
whisper
·
语音识别
·
课程设计
基于fast-whisper模型的语音识别工具的设计与实现
目录摘 要第1章 绪 论1.1 论文研究主要内容1.1.1模型类型选择1.1.2开发语言的选择1.2 国内外现状
不喝可乐_
1 个月前
whisper
在win11 中 whisper-large-v3-turbo 的简单使用
项目中如果有虚拟环境,忽略以上1,2,3; 在项目下执行
毛毛的毛毛
1 个月前
whisper
如何使用OPENAI的Whisper功能进行音频字母提取功能
首先你可以使用 Python 中的 requests 库来下载该音频文件,然后通过 open() 打开该文件并传递给 OpenAI Whisper API。
Secede.
2 个月前
开发语言
·
python
·
whisper
Whisper+T5-translate实现python实时语音翻译
烤鸭的世界我们不懂
2 个月前
python
·
whisper
·
语音识别
Python + WhisperX:解锁语音识别的高效新姿势
大家好,我是烤鸭:最近在尝试做视频的质量分析,打算利用asr针对声音判断是否有人声,以及识别出来的文本进行进一步操作。asr看了几个开源的,最终选择了openai的whisper,后来发现性能不行,又换了whisperX。这是一篇实战和代码为主的文章。
落杉丶
2 个月前
python
·
whisper
[ASR]faster-whisper报错Could not locate cudnn_ops64_9.dll
再初次安装之后,首次运行出现以下错误。(参照本文安装命令)看到其他帖子的方案都是下载dll文件,但是我尝试直接安装cuda版torch时,发现问题已经解决
drebander
3 个月前
whisper
·
音视频
Whisper-Medium 模型:音频转文本的原理、实践与硬件推荐
Whisper-Medium 是 OpenAI 提供的中型语音识别模型,具有良好的精度和速度平衡,适合对识别准确率要求较高的离线语音转文本场景。它支持多语言并具有较强的泛化能力,但相较于更小的模型(如 Tiny 和 Base),对硬件性能有更高要求。
drebander
3 个月前
whisper
·
音视频
Whisper-Tiny 模型:音频转文本的原理与实践
Whisper 是 OpenAI 发布的一款多语言语音识别模型,具有多个不同大小的模型(Tiny 到 Large),支持离线语音识别。Whisper-Tiny 是其最轻量级的模型版本,适合硬件资源有限、对准确性要求不高但需要快速处理的场景。
大模型之路
3 个月前
人工智能
·
whisper
·
语音识别
OpenAI Whisper:语音识别技术的革新者—深入架构与参数
当下语音识别技术正以前所未有的速度发展,极大地推动了人机交互的便利性和效率。OpenAI的Whisper系统无疑是这一领域的佼佼者,它凭借其卓越的性能、广泛的适用性和创新的技术架构,正在重新定义语音转文本技术的规则。今天我们一起了解一下Whisper的架构、核心能力以及其丰富的参数设置,帮助读者更好地理解这一前沿技术。
南棱笑笑生
3 个月前
whisper
20250109使用M6000显卡在Ubuntu20.04.6下跑whisper来识别中英文字幕
20250109使用M6000显卡在Ubuntu20.04.6下跑whisper来识别中英文字幕 2025/1/9 20:57
飘逸高铁侠
3 个月前
ffmpeg
·
whisper
·
音视频
使用 whisper和ffmpeg 烧录视频的中英文双语字幕
使用 whisper和ffmpeg 来烧录中英文双语字幕,可以通过以下几个步骤来修改你的代码。主要修改的地方是生成字幕的方式,将字幕通过 ffmpeg 的命令行工具烧录到视频中。通过生成字幕文件(.srt)然后用 ffmpeg 将字幕直接烧录到视频里。
长风清留扬
3 个月前
人工智能
·
神经网络
·
opencv
·
计算机视觉
·
自然语言处理
·
数据挖掘
·
whisper
基于OpenAI Whisper AI模型自动生成视频字幕:全面解析与实战指南
在数字化时代,视频内容已成为信息传播的重要载体。然而,为视频添加字幕却是一项繁琐且耗时的工作。幸运的是,随着人工智能技术的飞速发展,特别是OpenAI Whisper模型的推出,我们有了更加高效、智能的解决方案。
Aileen_0v0
3 个月前
linux
·
数据结构
·
人工智能
·
笔记
·
网络协议
·
tcp/ip
·
whisper
【AI驱动的数据结构:包装类的艺术与科学】
🌈个人主页: Aileen_0v0 🔥热门专栏: 华为鸿蒙系统学习|计算机网络|数据结构与算法 💫个人格言:“没有罗马,那就自己创造罗马~”
带电的小王
3 个月前
android
·
智能手机
·
whisper
·
qualcomm
WhisperKit: Android 端测试 Whisper -- Android手机(Qualcomm GPU)部署音频大模型
原文:https://flowus.cn/xiaoj_share/share/8c721e89-680e-451c-8c93-52e435ebf1a2
带电的小王
3 个月前
android
·
智能手机
·
llm
·
whisper
·
音频大模型
·
whisper.cpp
whisper.cpp: Android端测试 -- Android端手机部署音频大模型
以下是经实验验证可行的环境参考,也可尝试其他版本。(1)PC:Ubuntu 22.04.4(2)硬件设备:Android 手机
带电的小王
3 个月前
llm
·
whisper
·
音视频
·
音频大模型
whisper.cpp: PC端测试 -- 电脑端部署音频大模型
以下是经实验验证可行的环境参考,也可尝试其他版本。(1)PC:Ubuntu 22.04.4(2)软件环境:如下表所示
AI慧聚堂
3 个月前
whisper
记录本地部署 Whisper 模型的过程
Whisper 是论文中提出的用于自动语音识别 (ASR) 和语音翻译先进的模型通过大规模弱监督实现稳健语音识别 作者:Alec Radford 等人,来自 OpenAI。Whisper 在 >5M 小时的标记数据上进行了训练,表现出了很强的泛化能力 数据集和域。