【Whisper】WhisperX: Time-Accurate Speech Transcription of Long-Form Audio

Abstract

Whisper 的跨语言语音识别取得了很好的结果,但是对应的时间戳往往不准确,而且单词级别的时间戳也不能做到开箱即用(out-of-the-box). 此外,他们在处理长音频时通过缓冲转录

相关推荐
菜鸟的日志2 天前
【音频字幕】构建一个离线视频字幕生成系统:使用 WhisperX 和 Faster-Whisper 的 Python 实现
python·whisper·音视频
AidLux7 天前
犀牛派A1上使用Faster Whisper完成音频转文字
人工智能·语言模型·whisper·音视频
ZHOU_WUYI8 天前
whisper-large-v3 模型
llm·whisper
llrraa201017 天前
python whisper生成字幕
开发语言·python·whisper
weixin_446260851 个月前
本地WSL部署接入 whisper + ollama qwen3:14b 总结字幕校对增强版
whisper
青山师1 个月前
Docker部署whisper转写模型
docker·容器·whisper
Micheal_Dad2 个月前
【尝试】基于openai-whisper进行语音转文字windows版本
whisper
Micheal_Dad2 个月前
【尝试】本地部署openai-whisper,通过 http请求识别
whisper
andyguo2 个月前
语音识别的速度革命:从 Whisper 到 Whisper-CTranslate2,我经历了什么?
人工智能·学习·ai·whisper·语音识别·xcode·ai测评
番茄老夫子2 个月前
OpenAI推出的语音识别系统Whisper简析
人工智能·whisper·语音识别