技术栈
whisper
Luke Ewin
5 天前
人工智能
·
whisper
·
音视频
·
语音识别
·
asr
·
语音转写
·
视频字幕生成
一个基于OpenAI Whisper开发的音视频字幕文件生成工具
该工具软件是基于 OpenAI Whisper 的模型编写的,使用 Python 语言开发,然后通过 pyinstaller 打包成 exe 可执行程序,方便用户使用,之间双击就可以启动。点击这里,跳转到工具产品页面 该工具有以下功能:
Encarta1993
11 天前
人工智能
·
whisper
·
语音识别
【语音识别】vLLM 部署 Whisper 语音识别模型指南
目录1. 模型下载2. 环境安装3. 部署脚本4. 服务测试语音识别技术在现代人工智能应用中扮演着重要角色,OpenAI开源的Whisper模型以其出色的识别准确率和多语言支持能力成为当前最先进的语音识别解决方案之一。本文将详细介绍如何使用vLLM(一个高效的大模型推理和服务框架)来部署Whisper-large-v3-turbo模型,构建一个可扩展的语音识别API服务。
JHC000000
11 天前
ubuntu
·
whisper
·
音视频
ubuntu 下调用系统麦克风,以及faster-whisper-medium 处理音频转写文本
requirements.txt
西西弗Sisyphus
13 天前
whisper
·
语音识别
whisper 语音识别
flyfishWhisper 是一种通用的语音识别模型。它在大量多样化的音频数据集上进行了训练,同时也是一个多任务模型,能够执行多语言语音识别、语音翻译和语言识别。
JHC000000
13 天前
docker
·
容器
·
whisper
·
语音识别
docker 中跑faster-whisper 教程(1050显卡)
之前我本地机器运行faster-whisper 会报错类似github 上也有类似的情况 :https://github.com/SYSTRAN/faster-whisper/issues/516#issuecomment-2785038635 缺少.so.8 文件,我通过以下方式,完美解决
engchina
21 天前
人工智能
·
python
·
whisper
vLLM 部署 openai whisper 模型实现语音转文字
完结!
gs80140
21 天前
人工智能
·
whisper
·
语音识别
Faster-Whisper —— 为语音识别加速的利器
在语音识别技术迅速发展的今天,OpenAI 的 Whisper 模型因其强大的多语言识别能力和优异的准确率而受到广泛关注。然而,高精度模型往往伴随着高昂的计算开销和较长的推理时间,这对于需要实时或大规模转录的场景来说可能并不理想。为此,社区中涌现出了一系列优化方案,其中 faster_whisper 脱颖而出,成为实现更快速、高效语音识别的优秀工具。
charles_vaez
1 个月前
深度学习
·
whisper
·
aigc
开源模型应用落地-语音转文本-whisper模型-AIGC应用探索(五)
在上一节中,学习了如何使用vLLM来部署Whisper-large-v3-turbo模型。不过,在实际使用时,模型一次只能处理30秒的音频。今天,将结合实际业务,介绍如何处理一段完整的音频,并生成相应的字幕文件。
Mark White
1 个月前
whisper
开箱即用的whisper-service服务
https://github.com/openai/whisperhttps://docker.aityp.com/r/docker.io/onerahmet
Python数据分析与机器学习
2 个月前
大数据
·
人工智能
·
python
·
搜索引擎
·
whisper
·
语音识别
·
课程设计
基于fast-whisper模型的语音识别工具的设计与实现
目录摘 要第1章 绪 论1.1 论文研究主要内容1.1.1模型类型选择1.1.2开发语言的选择1.2 国内外现状
不喝可乐_
2 个月前
whisper
在win11 中 whisper-large-v3-turbo 的简单使用
项目中如果有虚拟环境,忽略以上1,2,3; 在项目下执行
毛毛的毛毛
2 个月前
whisper
如何使用OPENAI的Whisper功能进行音频字母提取功能
首先你可以使用 Python 中的 requests 库来下载该音频文件,然后通过 open() 打开该文件并传递给 OpenAI Whisper API。
Secede.
2 个月前
开发语言
·
python
·
whisper
Whisper+T5-translate实现python实时语音翻译
烤鸭的世界我们不懂
2 个月前
python
·
whisper
·
语音识别
Python + WhisperX:解锁语音识别的高效新姿势
大家好,我是烤鸭:最近在尝试做视频的质量分析,打算利用asr针对声音判断是否有人声,以及识别出来的文本进行进一步操作。asr看了几个开源的,最终选择了openai的whisper,后来发现性能不行,又换了whisperX。这是一篇实战和代码为主的文章。
落杉丶
3 个月前
python
·
whisper
[ASR]faster-whisper报错Could not locate cudnn_ops64_9.dll
再初次安装之后,首次运行出现以下错误。(参照本文安装命令)看到其他帖子的方案都是下载dll文件,但是我尝试直接安装cuda版torch时,发现问题已经解决
drebander
3 个月前
whisper
·
音视频
Whisper-Medium 模型:音频转文本的原理、实践与硬件推荐
Whisper-Medium 是 OpenAI 提供的中型语音识别模型,具有良好的精度和速度平衡,适合对识别准确率要求较高的离线语音转文本场景。它支持多语言并具有较强的泛化能力,但相较于更小的模型(如 Tiny 和 Base),对硬件性能有更高要求。
drebander
3 个月前
whisper
·
音视频
Whisper-Tiny 模型:音频转文本的原理与实践
Whisper 是 OpenAI 发布的一款多语言语音识别模型,具有多个不同大小的模型(Tiny 到 Large),支持离线语音识别。Whisper-Tiny 是其最轻量级的模型版本,适合硬件资源有限、对准确性要求不高但需要快速处理的场景。
大模型之路
3 个月前
人工智能
·
whisper
·
语音识别
OpenAI Whisper:语音识别技术的革新者—深入架构与参数
当下语音识别技术正以前所未有的速度发展,极大地推动了人机交互的便利性和效率。OpenAI的Whisper系统无疑是这一领域的佼佼者,它凭借其卓越的性能、广泛的适用性和创新的技术架构,正在重新定义语音转文本技术的规则。今天我们一起了解一下Whisper的架构、核心能力以及其丰富的参数设置,帮助读者更好地理解这一前沿技术。
南棱笑笑生
3 个月前
whisper
20250109使用M6000显卡在Ubuntu20.04.6下跑whisper来识别中英文字幕
20250109使用M6000显卡在Ubuntu20.04.6下跑whisper来识别中英文字幕 2025/1/9 20:57
飘逸高铁侠
3 个月前
ffmpeg
·
whisper
·
音视频
使用 whisper和ffmpeg 烧录视频的中英文双语字幕
使用 whisper和ffmpeg 来烧录中英文双语字幕,可以通过以下几个步骤来修改你的代码。主要修改的地方是生成字幕的方式,将字幕通过 ffmpeg 的命令行工具烧录到视频中。通过生成字幕文件(.srt)然后用 ffmpeg 将字幕直接烧录到视频里。