技术栈
【Whisper】WhisperX: Time-Accurate Speech Transcription of Long-Form Audio
Dovake
2024-07-17 21:07
Abstract
Whisper 的跨语言语音识别取得了很好的结果,但是对应的时间戳往往不准确,而且单词级别的时间戳也不能做到开箱即用(out-of-the-box). 此外,他们在处理长音频时通过缓冲转录
whisper
上一篇:
<Rust>egui部件学习:如何在egui窗口中添加按钮button以及标签label部件?
下一篇:
ExcelToDB2:批量导入Excel到IBM DB2数据库的自动化工具
相关推荐
Bofu-
1 天前
【音频测试】03-WPF 实现声道自动验证 + Whisper 语音识别录音检测
c#
·
whisper
·
wpf
·
音视频
·
音频测试
·
naudio 声道控制
JK Chen
4 天前
faster_whisper,视频转文字,并生成字幕文件
python
·
whisper
·
音视频
工作log
6 天前
10分钟搭建本地语音识别服务 (Whisper large-v3-turbo)
人工智能
·
whisper
·
语音识别
shao918516
7 天前
第10章 Streaming(上):初级音频应用(1)——项目三:自建服务器的Mini-Omni实时语音聊天机器人
ffmpeg
·
whisper
·
asr
·
mini-omni
·
自建语音服务器
code_pgf
12 天前
MNN Whisper 实时 ASR 工程实现
人工智能
·
whisper
·
mnn
独占的甜蜜
15 天前
从FLAC到WAV:whisper.cpp中的FFmpeg音频预处理全解析过程
ffmpeg
·
whisper
·
音视频
独占的甜蜜
15 天前
从FLAC到WAV:whisper.cpp中的FFmpeg音频预处理全解析
ffmpeg
·
whisper
·
音视频
阿里巴啦
19 天前
一个 Python 视频处理工具链实战:下载、转录、摘要、字幕、诊断全打通 (已开源)
人工智能
·
python
·
whisper
·
视频下载
·
视频处理工具
qq_31683775
20 天前
使用 whisper OpenCC 从音频文件生成字幕
whisper
skywalk8163
1 个月前
DuMate帮着在Windows10 编译安装Whisper-CPP
人工智能
·
whisper
热门推荐
01
要裂开了!ChatGPT要手机号验证了?注册Codex要求验证电话号码怎么办?2026年登陆Codex要手机号验证的解决办法
02
GitHub 镜像站点
03
Codex 接入 DeepSeek API 完整配置文档
04
零基础教你claude code 接入 deepseek V4
05
Linux 核弹级高危漏洞 CVE-2026-31431 完整修复指南
06
CVE-2026-31431 (Copy Fail) 漏洞复现与验证记录
07
CC-Switch & Claude 基于 Linux 服务器安装使用指南
08
裂开!ChatGPT 居然开始要手机号验证,附详细解决方法
09
【AI】2026 年具身智能模型和世界模型总结
10
2026 年 AI 辅助编程工具全景对比:Copilot、Cursor、Claude Code 与 Codex 深度解析