ASR工业化语音模型总结

1、wenet模型:WeNet语音识别实战-CSDN博客

git地址:GitHub - wenet-e2e/wenet: Production First and Production Ready End-to-End Speech Recognition Toolkit

生产应用方式为:使用pytorch训练,使用c++部署。

相关推荐
瓷tun4 天前
小白也能懂:Qwen3-ASR-0.6B语音识别入门教程
语音识别·asr·qwen3·星图gpu
Luke Ewin7 天前
Fun-ASR-Nano实时语音识别并区分说话人 | FunASR | 开源实时语音识别模型
人工智能·语音识别·asr·fun-asr
siv777 天前
一站式 AI 视频翻译的技术架构:ASR → NMT → TTS → 字幕压制的全链路设计
whisper·tts·asr·nmt·ai视频翻译·视频翻译架构·字幕压制
从孑开始22 天前
manyspeech-cli 语音识别命令行工具
人工智能·语音识别·工具·asr
shao9185161 个月前
第10章 Streaming(上):初级音频应用(1)——项目三:自建服务器的Mini-Omni实时语音聊天机器人
ffmpeg·whisper·asr·mini-omni·自建语音服务器
iwgh1 个月前
OddAsr更新:将默认模型从moonshine改回paraformer
asr·paraformer·语音转写·stt·moonshine·oddasr
antzou2 个月前
字幕视频合成
onnx·tts·asr·vad·paraformer
antzou2 个月前
语音识别 (ASR)
人工智能·语音识别·onnx·asr·paraformer
Jay星晴2 个月前
Whisper-large-v3语音识别效果对比:与Whisper v2/v1在中文长语音场景差异
whisper·语音识别·asr·星图gpu
诸神缄默不语2 个月前
自动写会议纪要:语音转文字→整理录音稿→生成会议纪要
ai·prompt·提示词·提示工程·asr·语音转文字·会议纪要