技术栈
【Whisper】WhisperX: Time-Accurate Speech Transcription of Long-Form Audio
Dovake
2024-07-17 21:07
Abstract
Whisper 的跨语言语音识别取得了很好的结果,但是对应的时间戳往往不准确,而且单词级别的时间戳也不能做到开箱即用(out-of-the-box). 此外,他们在处理长音频时通过缓冲转录
whisper
上一篇:
<Rust>egui部件学习:如何在egui窗口中添加按钮button以及标签label部件?
下一篇:
ExcelToDB2:批量导入Excel到IBM DB2数据库的自动化工具
相关推荐
杜连涛
21 小时前
5分钟部署Whisper语音识别:多语言大模型一键启动Web服务
whisper
·
语音识别
·
ai应用
·
多语言处理
siv77
4 天前
一站式 AI 视频翻译的技术架构:ASR → NMT → TTS → 字幕压制的全链路设计
whisper
·
tts
·
asr
·
nmt
·
ai视频翻译
·
视频翻译架构
·
字幕压制
Fantasy237
5 天前
whisper语音转文字配置
whisper
·
工具使用
searchforAI
6 天前
AI多模态技术:从语音识别到AI结构化笔记是怎么实现的
人工智能
·
经验分享
·
笔记
·
gpt
·
whisper
·
语音识别
搬砖的小码农_Sky
7 天前
如何用Nvidia Geforce RTX 5060 Ti显卡进行本地Whisper语音转文字任务?
人工智能
·
ai
·
whisper
·
gpu算力
abigriver
9 天前
打造 Linux 离线大模型级语音输入法:Whisper.cpp + 3090 显卡加速与 Rime 中英混输终极调优指南
linux
·
运维
·
whisper
J心流
14 天前
89ms实时Whisper,显存还降48%
whisper
iDao技术魔方
18 天前
whisper.cpp 深度解析:从边缘设备到实时语音识别
人工智能
·
whisper
·
语音识别
Gc9umsbL1
22 天前
从FLAC到WAV:whisper.cpp中的FFmpeg音频预处理全解析
ffmpeg
·
whisper
·
音视频
Bofu-
25 天前
【音频测试】03-WPF 实现声道自动验证 + Whisper 语音识别录音检测
c#
·
whisper
·
wpf
·
音视频
·
音频测试
·
naudio 声道控制
热门推荐
01
GitHub 镜像站点
02
DeepSeek V4 + Claude Code thinking mode 400 错误修复方案
03
【AI】2026 年具身智能模型和世界模型总结
04
【踩坑记录 | 第一篇】微软商店无法使用时,如何手动安装 OpenAI Codex?附`.msix`文件系统错误解决方法
05
Codex 接入 DeepSeek API 完整配置文档
06
裂开!ChatGPT 居然开始要手机号验证,附详细解决方法
07
CC-Switch & Claude 基于 Linux 服务器安装使用指南
08
几个好用的ip纯净度检测网站
09
CC-Switch 全平台下载、安装与使用全指南(Windows/macOS/Linux)
10
API Key 登录 Codex 也能用插件了,还支持会话删除和导出