ASR工业化语音模型总结

1、wenet模型:WeNet语音识别实战-CSDN博客

git地址:GitHub - wenet-e2e/wenet: Production First and Production Ready End-to-End Speech Recognition Toolkit

生产应用方式为:使用pytorch训练,使用c++部署。

相关推荐
水龙吟啸6 天前
机器学习安全:图像多分类任务的测试时对抗样本转移攻击实战(一)
机器学习·图像分类·安全性测试·asr·混淆矩阵·auc·转移攻击
云山雾村18 天前
零基础也能用!科哥版Paraformer语音识别WebUI保姆级教程
语音识别·asr·星图gpu·中文语音转文字
瓷tun24 天前
小白也能懂:Qwen3-ASR-0.6B语音识别入门教程
语音识别·asr·qwen3·星图gpu
Luke Ewin1 个月前
Fun-ASR-Nano实时语音识别并区分说话人 | FunASR | 开源实时语音识别模型
人工智能·语音识别·asr·fun-asr
siv771 个月前
一站式 AI 视频翻译的技术架构:ASR → NMT → TTS → 字幕压制的全链路设计
whisper·tts·asr·nmt·ai视频翻译·视频翻译架构·字幕压制
从孑开始1 个月前
manyspeech-cli 语音识别命令行工具
人工智能·语音识别·工具·asr
shao9185162 个月前
第10章 Streaming(上):初级音频应用(1)——项目三:自建服务器的Mini-Omni实时语音聊天机器人
ffmpeg·whisper·asr·mini-omni·自建语音服务器
iwgh2 个月前
OddAsr更新:将默认模型从moonshine改回paraformer
asr·paraformer·语音转写·stt·moonshine·oddasr
antzou2 个月前
字幕视频合成
onnx·tts·asr·vad·paraformer
antzou2 个月前
语音识别 (ASR)
人工智能·语音识别·onnx·asr·paraformer