技术栈
【Whisper】WhisperX: Time-Accurate Speech Transcription of Long-Form Audio
Dovake
2024-07-17 21:07
Abstract
Whisper 的跨语言语音识别取得了很好的结果,但是对应的时间戳往往不准确,而且单词级别的时间戳也不能做到开箱即用(out-of-the-box). 此外,他们在处理长音频时通过缓冲转录
whisper
上一篇:
<Rust>egui部件学习:如何在egui窗口中添加按钮button以及标签label部件?
下一篇:
ExcelToDB2:批量导入Excel到IBM DB2数据库的自动化工具
相关推荐
engchina
3 天前
vLLM 部署 openai whisper 模型实现语音转文字
人工智能
·
python
·
whisper
gs80140
4 天前
Faster-Whisper —— 为语音识别加速的利器
人工智能
·
whisper
·
语音识别
charles_vaez
10 天前
开源模型应用落地-语音转文本-whisper模型-AIGC应用探索(五)
深度学习
·
whisper
·
aigc
Mark White
20 天前
开箱即用的whisper-service服务
whisper
Python数据分析与机器学习
1 个月前
基于fast-whisper模型的语音识别工具的设计与实现
大数据
·
人工智能
·
python
·
搜索引擎
·
whisper
·
语音识别
·
课程设计
不喝可乐_
1 个月前
在win11 中 whisper-large-v3-turbo 的简单使用
whisper
毛毛的毛毛
2 个月前
如何使用OPENAI的Whisper功能进行音频字母提取功能
whisper
Secede.
2 个月前
Whisper+T5-translate实现python实时语音翻译
开发语言
·
python
·
whisper
烤鸭的世界我们不懂
2 个月前
Python + WhisperX:解锁语音识别的高效新姿势
python
·
whisper
·
语音识别
落杉丶
2 个月前
[ASR]faster-whisper报错Could not locate cudnn_ops64_9.dll
python
·
whisper
热门推荐
01
我决定放弃搞 Java 了
02
DeepSeek各版本说明与优缺点分析
03
如何在WPS和Word/Excel中直接使用DeepSeek功能
04
RAG 实践- Ollama+RagFlow 部署本地知识库
05
本地化部署AI知识库:基于Ollama+DeepSeek+AnythingLLM保姆级教程
06
从零安装 LLaMA-Factory 微调 Qwen 大模型成功及所有的坑
07
如何本地部署AI智能体平台,带你手搓一个AI Agent
08
苍穹外卖面试总结
09
DeepSeek RAGFlow构建本地知识库系统
10
【芯片封测学习专栏 -- D2D 和 C2C 之间的区别】