技术栈
【Whisper】WhisperX: Time-Accurate Speech Transcription of Long-Form Audio
Dovake
2024-07-17 21:07
Abstract
Whisper 的跨语言语音识别取得了很好的结果,但是对应的时间戳往往不准确,而且单词级别的时间戳也不能做到开箱即用(out-of-the-box). 此外,他们在处理长音频时通过缓冲转录
whisper
上一篇:
<Rust>egui部件学习:如何在egui窗口中添加按钮button以及标签label部件?
下一篇:
ExcelToDB2:批量导入Excel到IBM DB2数据库的自动化工具
相关推荐
Micheal_Dad
15 天前
【尝试】基于openai-whisper进行语音转文字windows版本
whisper
Micheal_Dad
15 天前
【尝试】本地部署openai-whisper,通过 http请求识别
whisper
andyguo
18 天前
语音识别的速度革命:从 Whisper 到 Whisper-CTranslate2,我经历了什么?
人工智能
·
学习
·
ai
·
whisper
·
语音识别
·
xcode
·
ai测评
番茄老夫子
19 天前
OpenAI推出的语音识别系统Whisper简析
人工智能
·
whisper
·
语音识别
A-刘晨阳
21 天前
语音转文字「本地化」新解!Whisper Web+cpolar实现零服务器部署与远程操作
服务器
·
前端
·
whisper
云空
1 个月前
《Whisper模型版本及下载链接》
whisper
苗杨
1 个月前
【Faster-Whisper】离线识别本地视频并生成字幕
python
·
whisper
·
音视频
云空
1 个月前
《Whisper:OpenAI的先进语音识别模型》
人工智能
·
whisper
·
语音识别
企鹅侠客
1 个月前
19|Whisper+ChatGPT:请AI代你听播客
人工智能
·
ai
·
chatgpt
·
whisper
落沐萧萧
2 个月前
本地多语言 AI 字幕组:Whisper 实战教程
人工智能
·
whisper
热门推荐
01
Qwen3-Coder 快速上手教程 | Qwen Code + Claude Code
02
全球最强模型Grok4,国内已可免费使用!(附教程)
03
MSPM0G3507——读取引脚的高低电平方法(数字信号循迹模块)
04
Coze 开源了,送上保姆级私有化部署方案【建议收藏】
05
腾讯还是太全面了,限时免费!超全CodeBuddy IDE保姆级教程!(附案例)
06
扣子开源本地部署教程 丨Coze智能体小白喂饭级指南
07
KGG转MP3工具|非KGM文件|解密音频
08
coze 开源版本地部署及踩过的坑【喂饭级教程】
09
【手把手攻略】国家育儿补贴正式开领!一键算清你能拿多少钱?附补贴领取计算器
10
VMware Workstation Pro虚拟机的下载和安装图文保姆级教程(附下载链接)