技术栈
【Whisper】WhisperX: Time-Accurate Speech Transcription of Long-Form Audio
Dovake
2024-07-17 21:07
Abstract
Whisper 的跨语言语音识别取得了很好的结果,但是对应的时间戳往往不准确,而且单词级别的时间戳也不能做到开箱即用(out-of-the-box). 此外,他们在处理长音频时通过缓冲转录
whisper
上一篇:
<Rust>egui部件学习:如何在egui窗口中添加按钮button以及标签label部件?
下一篇:
ExcelToDB2:批量导入Excel到IBM DB2数据库的自动化工具
相关推荐
菜鸟的日志
2 天前
【音频字幕】构建一个离线视频字幕生成系统:使用 WhisperX 和 Faster-Whisper 的 Python 实现
python
·
whisper
·
音视频
AidLux
7 天前
犀牛派A1上使用Faster Whisper完成音频转文字
人工智能
·
语言模型
·
whisper
·
音视频
ZHOU_WUYI
8 天前
whisper-large-v3 模型
llm
·
whisper
llrraa2010
17 天前
python whisper生成字幕
开发语言
·
python
·
whisper
weixin_44626085
1 个月前
本地WSL部署接入 whisper + ollama qwen3:14b 总结字幕校对增强版
whisper
青山师
1 个月前
Docker部署whisper转写模型
docker
·
容器
·
whisper
Micheal_Dad
2 个月前
【尝试】基于openai-whisper进行语音转文字windows版本
whisper
Micheal_Dad
2 个月前
【尝试】本地部署openai-whisper,通过 http请求识别
whisper
andyguo
2 个月前
语音识别的速度革命:从 Whisper 到 Whisper-CTranslate2,我经历了什么?
人工智能
·
学习
·
ai
·
whisper
·
语音识别
·
xcode
·
ai测评
番茄老夫子
2 个月前
OpenAI推出的语音识别系统Whisper简析
人工智能
·
whisper
·
语音识别
热门推荐
01
UV安装并设置国内源
02
2025 年高教社杯全国大学生数学建模竞赛C 题 NIPT 的时点选择与胎儿的异常判定 完整成品思路模型代码分享,全网首发高质量!!!
03
2025年数学建模国赛C题超详细解题思路
04
A股预测还能更准?开源大模型Kronos带你跑通预测+回测全流程
05
不再让Windows更新!&Edge游戏助手卸载及关闭自动更新
06
KGG转MP3工具|非KGM文件|解密音频
07
UV 工具安装与国内镜像源配置指南
08
Linux下V2Ray安装配置指南
09
突破百度网盘的下载限速,两种方法教会你【超详细】
10
教你如何认证 Gemini 教育优惠的二次验证,薅个 1年的 Gemini Pro 会员