【Whisper】WhisperX: Time-Accurate Speech Transcription of Long-Form Audio

Abstract

Whisper 的跨语言语音识别取得了很好的结果,但是对应的时间戳往往不准确,而且单词级别的时间戳也不能做到开箱即用(out-of-the-box). 此外,他们在处理长音频时通过缓冲转录

相关推荐
@我们的天空4 天前
【AIGC】Whisper语音识别模型概述,应用场景和具体实例及如何本地搭建Whisper语音识别模型?
人工智能·python·深度学习·机器学习·whisper·aigc·语音识别
AI逍遥子5 天前
如何本地搭建Whisper语音识别模型
人工智能·whisper·语音识别·ai编程
不会代码的小林7 天前
如何本地搭建Whisper语音识别模型
whisper
rhythmcc9 天前
【whisper】使用whisper实现语音转文字
whisper
营赢盈英9 天前
OpenAI transcription API bad request
javascript·ai·node.js·whisper·axios·openai api
LQS20209 天前
本地搭建和运行Whisper语音识别模型小记
whisper
营赢盈英10 天前
Python Poetry fails to add openai-whisper due to triton installation error
python·ai·whisper·openai·poetry
一只老虎10 天前
本地搭建 Whisper 语音识别模型实现实时语音识别研究
人工智能·whisper·语音识别
营赢盈英10 天前
OpenAI Whisper API (InvalidRequestError)
python·ai·whisper·fastapi·openai api
shichaog15 天前
大模型之二十八-语音识别Whisper进阶
人工智能·whisper·语音识别