技术栈
【Whisper】WhisperX: Time-Accurate Speech Transcription of Long-Form Audio
Dovake
2024-07-17 21:07
Abstract
Whisper 的跨语言语音识别取得了很好的结果,但是对应的时间戳往往不准确,而且单词级别的时间戳也不能做到开箱即用(out-of-the-box). 此外,他们在处理长音频时通过缓冲转录
whisper
上一篇:
<Rust>egui部件学习:如何在egui窗口中添加按钮button以及标签label部件?
下一篇:
ExcelToDB2:批量导入Excel到IBM DB2数据库的自动化工具
相关推荐
susu1083018911
20 天前
OpenAI Whisper 把mp3语音转文字
whisper
lili-felicity
23 天前
CANN加速Whisper语音识别推理:流式处理与实时转录优化
人工智能
·
whisper
·
语音识别
阿里巴啦
25 天前
python+yt-dlp开源项目,支持 YouTube, Bilibili, TikTok/抖音,快手 等多个平台的视频/音频/字幕下载/ai摘要等功能
python
·
ffmpeg
·
whisper
·
音视频
·
视频处理
·
ai摘要
·
音视频转录
普通网友
25 天前
极致压缩:Whisper.cpp 量化版本清单与 ggml 格式模型下载
whisper
天空中最亮的一颗星
25 天前
如何下载、安装whisper、faster_whisper?
whisper
runner365.git
1 个月前
ffmpeg8.0合入whisper,语音识别模型终于进入ffmpeg
ffmpeg
·
whisper
·
语音识别
Blossom.118
1 个月前
从单点工具到智能流水线:企业级多智能体AI开发工作流架构实战
人工智能
·
笔记
·
python
·
深度学习
·
神经网络
·
架构
·
whisper
Blossom.118
1 个月前
从“金鱼记忆“到“超级大脑“:2025年AI智能体记忆机制与MoE架构的融合革命
人工智能
·
python
·
算法
·
架构
·
自动化
·
whisper
·
哈希算法
Blossom.118
1 个月前
把大模型塞进蓝牙耳机:1.46MB 的 Whisper-Lite 落地全记录
人工智能
·
笔记
·
python
·
深度学习
·
神经网络
·
chatgpt
·
whisper
热门推荐
01
GitHub 镜像站点
02
OpenClaw 使用和管理 MCP 完全指南
03
OpenClaw + 飞书(Feishu)环境搭建指南
04
【OpenClaw 本地实战 Ep.3】突破瓶颈:强制修改 openclaw.json 解锁 32k 上下文记忆
05
Claude Code + GLM4.7 避坑指南:解决 Unable to connect to Anthropic services
06
OpenClaw优化飞书API 额度已耗尽问题
07
小黑课堂计算机二级WPSoffice题库软件下载安装教程(2026年3月最新版)
08
Clawdbot部署教程:解决‘gateway token missing’授权问题的完整步骤
09
Window 10部署openclaw报错node.exe : npm error code 128
10
OpenClaw大龙虾机器人完整安装教程