whisper

dgiij8 天前
docker·ai·node.js·whisper
openai-whisper-asr-webservice接入difyopenai-whisper-asr-webservice提供的asr的api其实并不兼容openai的api,所以在dify中是不能直接添加到语音转文字的模型中,对比了下两个api的传参情况,其实只要改动一处,就能支持: openai兼容的asr调用中formdata中音频文件是file=XXX这样的,而openai-whisper-asr-webservice提供的asr的api中formdata中音频文件是audio_file=XXX这样的。感觉使用openresty的lua简单处理一下改formd
allnlei9 天前
whisper·asr
whisper相关的开源项目 (asr)基于 Whisper(OpenAI 的开源语音识别模型)的开源项目有很多,涵盖了不同应用场景和优化方向。以下是一些值得关注的项目:
phper814 天前
whisper·音视频·语音识别
开源音视频转文字工具:基于 Vosk 和 Whisper 的多语言语音识别项目随着短视频、播客等音视频内容的爆发式增长,快速将音视频内容转换为文字的需求也越来越大。无论是内容创作者需要的字幕,还是企业需要的会议记录,都需要一个可靠的语音转文字解决方案。
AI360labs_atyun14 天前
人工智能·科技·ai·whisper·音视频·教育
使用 Whisper 生成视频字幕:从提取音频到批量处理生成视频字幕是许多视频处理任务的核心需求。本文将指导你使用 OpenAI 的 Whisper 模型为视频文件(如电视剧《Normal People》或电影《花样年华》)生成字幕(SRT 格式)。我们将从提取音频开始,逐步实现字幕生成,并提供一个 Python 脚本实现批量处理。此外,我们还将探讨如何处理非英语音频(如中文)并优化字幕质量。
waterHBO1 个月前
python·whisper
python + whisper 读取蓝牙耳机, 转为文字看到别人做了类似的效果。所以自己也想试试看。动手。我用的是蓝牙耳机,EDIFIER W820NB
代码骑士1 个月前
whisper
基于whisper和ffmpeg语音转文本小程序目录一、环境准备✅ 第一步:安装并准备 Conda 环境✅ 第二步:创建 Whisper 专用的 Conda 虚拟环境
Luke Ewin2 个月前
人工智能·whisper·音视频·语音识别·asr·语音转写·视频字幕生成
一个基于OpenAI Whisper开发的音视频字幕文件生成工具该工具软件是基于 OpenAI Whisper 的模型编写的,使用 Python 语言开发,然后通过 pyinstaller 打包成 exe 可执行程序,方便用户使用,之间双击就可以启动。点击这里,跳转到工具产品页面 该工具有以下功能:
Encarta19932 个月前
人工智能·whisper·语音识别
【语音识别】vLLM 部署 Whisper 语音识别模型指南目录1. 模型下载2. 环境安装3. 部署脚本4. 服务测试语音识别技术在现代人工智能应用中扮演着重要角色,OpenAI开源的Whisper模型以其出色的识别准确率和多语言支持能力成为当前最先进的语音识别解决方案之一。本文将详细介绍如何使用vLLM(一个高效的大模型推理和服务框架)来部署Whisper-large-v3-turbo模型,构建一个可扩展的语音识别API服务。
JHC0000002 个月前
ubuntu·whisper·音视频
ubuntu 下调用系统麦克风,以及faster-whisper-medium 处理音频转写文本requirements.txt
西西弗Sisyphus2 个月前
whisper·语音识别
whisper 语音识别flyfishWhisper 是一种通用的语音识别模型。它在大量多样化的音频数据集上进行了训练,同时也是一个多任务模型,能够执行多语言语音识别、语音翻译和语言识别。
JHC0000002 个月前
docker·容器·whisper·语音识别
docker 中跑faster-whisper 教程(1050显卡)之前我本地机器运行faster-whisper 会报错类似github 上也有类似的情况 :https://github.com/SYSTRAN/faster-whisper/issues/516#issuecomment-2785038635 缺少.so.8 文件,我通过以下方式,完美解决
engchina2 个月前
人工智能·python·whisper
vLLM 部署 openai whisper 模型实现语音转文字完结!
gs801402 个月前
人工智能·whisper·语音识别
Faster-Whisper —— 为语音识别加速的利器在语音识别技术迅速发展的今天,OpenAI 的 Whisper 模型因其强大的多语言识别能力和优异的准确率而受到广泛关注。然而,高精度模型往往伴随着高昂的计算开销和较长的推理时间,这对于需要实时或大规模转录的场景来说可能并不理想。为此,社区中涌现出了一系列优化方案,其中 faster_whisper 脱颖而出,成为实现更快速、高效语音识别的优秀工具。
charles_vaez2 个月前
深度学习·whisper·aigc
开源模型应用落地-语音转文本-whisper模型-AIGC应用探索(五)在上一节中,学习了如何使用vLLM来部署Whisper-large-v3-turbo模型。不过,在实际使用时,模型一次只能处理30秒的音频。今天,将结合实际业务,介绍如何处理一段完整的音频,并生成相应的字幕文件。
Mark White3 个月前
whisper
开箱即用的whisper-service服务https://github.com/openai/whisperhttps://docker.aityp.com/r/docker.io/onerahmet
Python数据分析与机器学习3 个月前
大数据·人工智能·python·搜索引擎·whisper·语音识别·课程设计
基于fast-whisper模型的语音识别工具的设计与实现目录摘 要第1章 绪 论1.1 论文研究主要内容1.1.1模型类型选择1.1.2开发语言的选择1.2 国内外现状
不喝可乐_3 个月前
whisper
在win11 中 whisper-large-v3-turbo 的简单使用项目中如果有虚拟环境,忽略以上1,2,3; 在项目下执行
毛毛的毛毛4 个月前
whisper
如何使用OPENAI的Whisper功能进行音频字母提取功能首先你可以使用 Python 中的 requests 库来下载该音频文件,然后通过 open() 打开该文件并传递给 OpenAI Whisper API。
Secede.4 个月前
开发语言·python·whisper
Whisper+T5-translate实现python实时语音翻译
烤鸭的世界我们不懂4 个月前
python·whisper·语音识别
Python + WhisperX:解锁语音识别的高效新姿势大家好,我是烤鸭:最近在尝试做视频的质量分析,打算利用asr针对声音判断是否有人声,以及识别出来的文本进行进一步操作。asr看了几个开源的,最终选择了openai的whisper,后来发现性能不行,又换了whisperX。这是一篇实战和代码为主的文章。