技术栈
【Whisper】WhisperX: Time-Accurate Speech Transcription of Long-Form Audio
Dovake
2024-07-17 21:07
Abstract
Whisper 的跨语言语音识别取得了很好的结果,但是对应的时间戳往往不准确,而且单词级别的时间戳也不能做到开箱即用(out-of-the-box). 此外,他们在处理长音频时通过缓冲转录
whisper
上一篇:
<Rust>egui部件学习:如何在egui窗口中添加按钮button以及标签label部件?
下一篇:
ExcelToDB2:批量导入Excel到IBM DB2数据库的自动化工具
相关推荐
手揽回忆怎么睡
2 天前
Java集成whisper.cpp
java
·
开发语言
·
whisper
YXWik6
3 天前
Linux安装Whisper(C++版)音频解析文本
linux
·
c++
·
whisper
普通网友
4 天前
解决下载慢!Whisper 模型国内镜像源汇总与各版本快速获取
whisper
minhuan
7 天前
大模型应用:语音转文本(ASR)实践:OpenAI Whisper精准转录解析.21
whisper
·
asr
·
多模态模型
·
语音转文本应用
·
语音大模型应用
DARLING Zero two♡
13 天前
浏览器里跑 AI 语音转写?Whisper Web + cpolar让本地服务跑遍全网
前端
·
人工智能
·
whisper
johnny233
15 天前
OpenAI Whisper:生态
whisper
不解不惑
23 天前
OpenAI whisper 语音识别服务器搭建
服务器
·
whisper
·
语音识别
许泽宇的技术分享
24 天前
用 OpenAI Whisper + pyannote.audio 打造“谁在说什么”的全栈语音理解系统
macos
·
whisper
·
xcode
这儿有一堆花
1 个月前
使用 Whisper 转写语音的完整教学
人工智能
·
ai
·
whisper
数据饕餮
2 个月前
Faster-Whisper命令和意图识别程序设计调优:上下文感知和领域词汇增强
whisper
热门推荐
01
GitHub 镜像站点
02
UV安装并设置国内源
03
Linux下V2Ray安装配置指南
04
在VSCode配置Java开发环境的保姆级教程(适配各类AI编程IDE)
05
安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口(持续更新)
06
BongoCat - 跨平台键盘猫动画工具
07
【AutoGLM部署】本地私有化部署AI手机Agent
08
Open-AutoGLM Windows 安装部署教程
09
Labelme从安装到标注:零基础完整指南
10
CentOS的ISO镜像下载