【Whisper】WhisperX: Time-Accurate Speech Transcription of Long-Form Audio

Abstract

Whisper 的跨语言语音识别取得了很好的结果,但是对应的时间戳往往不准确,而且单词级别的时间戳也不能做到开箱即用(out-of-the-box). 此外,他们在处理长音频时通过缓冲转录

相关推荐
手揽回忆怎么睡2 天前
Java集成whisper.cpp
java·开发语言·whisper
YXWik63 天前
Linux安装Whisper(C++版)音频解析文本
linux·c++·whisper
普通网友4 天前
解决下载慢!Whisper 模型国内镜像源汇总与各版本快速获取
whisper
minhuan7 天前
大模型应用:语音转文本(ASR)实践:OpenAI Whisper精准转录解析.21
whisper·asr·多模态模型·语音转文本应用·语音大模型应用
DARLING Zero two♡13 天前
浏览器里跑 AI 语音转写?Whisper Web + cpolar让本地服务跑遍全网
前端·人工智能·whisper
johnny23315 天前
OpenAI Whisper:生态
whisper
不解不惑23 天前
OpenAI whisper 语音识别服务器搭建
服务器·whisper·语音识别
许泽宇的技术分享24 天前
用 OpenAI Whisper + pyannote.audio 打造“谁在说什么”的全栈语音理解系统
macos·whisper·xcode
这儿有一堆花1 个月前
使用 Whisper 转写语音的完整教学
人工智能·ai·whisper
数据饕餮2 个月前
Faster-Whisper命令和意图识别程序设计调优:上下文感知和领域词汇增强
whisper