ASR工业化语音模型总结

1、wenet模型:WeNet语音识别实战-CSDN博客

git地址:GitHub - wenet-e2e/wenet: Production First and Production Ready End-to-End Speech Recognition Toolkit

生产应用方式为:使用pytorch训练,使用c++部署。

相关推荐
木亦汐丫11 天前
【ASR】基于分块非自回归模型的流式端到端语音识别
语音识别·asr·端到端·流式·nar非自回归·分块注意力·mask-ctc
放羊郎11 天前
从零实现本地语音识别(FunASR)
人工智能·语音识别·asr·funasr·语音转文字
allnlei13 天前
whisper相关的开源项目 (asr)
whisper·asr
shao9185161 个月前
Gradio全解20——Streaming:流式传输的多媒体应用(3)——实时语音识别技术
人工智能·ffmpeg·语音识别·transformers·gradio·asr
Luke Ewin2 个月前
一个基于OpenAI Whisper开发的音视频字幕文件生成工具
人工智能·whisper·音视频·语音识别·asr·语音转写·视频字幕生成
uncle_ll2 个月前
达摩院Paraformer-ONNX模型:一站式高精度中文语音识别工业级解决方案
人工智能·nlp·语音识别·asr
玩电脑的辣条哥2 个月前
AI-Sphere-Butler之Ubuntu服务器如何部署FunASR服务
服务器·人工智能·ubuntu·asr·funasr
玩电脑的辣条哥2 个月前
AI-Sphere-Butler之如何使用腾讯云ASR语音识别服务
人工智能·腾讯云·语音识别·asr
Luke Ewin4 个月前
根据音频中的不同讲述人声音进行分离音频 | 基于ai的说话人声音分离项目
人工智能·python·音视频·语音识别·声纹识别·asr·3d-speaker
Luke Ewin5 个月前
解决安装pynini和WeTextProcessing报错问题
python·大模型·llm·语音识别·语音合成·tts·asr