技术栈
【Whisper】WhisperX: Time-Accurate Speech Transcription of Long-Form Audio
Dovake
2024-07-17 21:07
Abstract
Whisper 的跨语言语音识别取得了很好的结果,但是对应的时间戳往往不准确,而且单词级别的时间戳也不能做到开箱即用(out-of-the-box). 此外,他们在处理长音频时通过缓冲转录
whisper
上一篇:
<Rust>egui部件学习:如何在egui窗口中添加按钮button以及标签label部件?
下一篇:
ExcelToDB2:批量导入Excel到IBM DB2数据库的自动化工具
相关推荐
吱夏cz
4 天前
安装whisper
whisper
Jay星晴
5 天前
Whisper-large-v3语音识别效果对比:与Whisper v2/v1在中文长语音场景差异
whisper
·
语音识别
·
asr
·
星图gpu
FishPotatoChen
8 天前
【OpenAI】Whisper 模型架构详解
whisper
weixin_44626085
9 天前
[特殊字符] Insanely Fast Whisper - 超快音频转录工具!
whisper
·
音视频
x-cmd
10 天前
[260326] x-cmd v0.8.10:跨 Shell 统一配置命令短名;自动装好依赖运行 WhisperLiveKit 实时语音转写
linux
·
人工智能
·
ai
·
whisper
·
shortcut
·
x-cmd
ughome
20 天前
我做了一个本地字幕提取工具:软字幕优先 + Whisper 转写回退(支持链接/本地文件)
whisper
·
视频字幕提取
PengShuaiD5
25 天前
【AI编码】用ChatGPT基于Whisper+ffmpeg实现一个根据视频字幕执行自动化裁剪本地小工具
人工智能
·
chatgpt
·
ffmpeg
·
whisper
susu1083018911
2 个月前
OpenAI Whisper 把mp3语音转文字
whisper
lili-felicity
2 个月前
CANN加速Whisper语音识别推理:流式处理与实时转录优化
人工智能
·
whisper
·
语音识别
阿里巴啦
2 个月前
python+yt-dlp开源项目,支持 YouTube, Bilibili, TikTok/抖音,快手 等多个平台的视频/音频/字幕下载/ai摘要等功能
python
·
ffmpeg
·
whisper
·
音视频
·
视频处理
·
ai摘要
·
音视频转录
热门推荐
01
GitHub 镜像站点
02
Qwen3.5-Omni与Qwen3.6模型全面解析(含测评/案例/使用教程)
03
OpenClaw 请求超时 llm request timed out 怎么解决?3 种方案实测,附完整排查流程
04
VMware Workstation Pro 17 虚拟机完整安装教程(2026最新)
05
【技术干货】Gemma 4 上手深度指南:本地多模态大模型的新基线
06
最新更新版本,OpenClaw v2026.4.2 深度解读剖析:Task Flow 重磅回归与安全架构的全面硬化
07
纯 HTML/CSS/JS 实现的高颜值登录页,还会眨眼睛!少女心爆棚!
08
AI 编程效率翻倍:Superpowers Skills 上手清单 + 完整指南
09
“wsl --install -d Ubuntu-22.04”下载慢,中国地区离线安装 Ubuntu 22.04 WSL方法(亲测2025年5月6日)
10
UV安装并设置国内源