ASR工业化语音模型总结

1、wenet模型:WeNet语音识别实战-CSDN博客

git地址:GitHub - wenet-e2e/wenet: Production First and Production Ready End-to-End Speech Recognition Toolkit

生产应用方式为:使用pytorch训练,使用c++部署。

相关推荐
Luke Ewin11 天前
一个基于OpenAI Whisper开发的音视频字幕文件生成工具
人工智能·whisper·音视频·语音识别·asr·语音转写·视频字幕生成
uncle_ll18 天前
达摩院Paraformer-ONNX模型:一站式高精度中文语音识别工业级解决方案
人工智能·nlp·语音识别·asr
玩电脑的辣条哥1 个月前
AI-Sphere-Butler之Ubuntu服务器如何部署FunASR服务
服务器·人工智能·ubuntu·asr·funasr
玩电脑的辣条哥1 个月前
AI-Sphere-Butler之如何使用腾讯云ASR语音识别服务
人工智能·腾讯云·语音识别·asr
Luke Ewin2 个月前
根据音频中的不同讲述人声音进行分离音频 | 基于ai的说话人声音分离项目
人工智能·python·音视频·语音识别·声纹识别·asr·3d-speaker
Luke Ewin4 个月前
解决安装pynini和WeTextProcessing报错问题
python·大模型·llm·语音识别·语音合成·tts·asr
十八年后又是一条好汉5 个月前
选择使用whisper.cpp进行语音转文字
whisper·语音识别·asr·stt
Ephemeroptera6 个月前
聚类算法的代码解析与实现
算法·数据挖掘·聚类·asr
Eric.Lee20217 个月前
whisper 实现语音识别 ASR - python 实现
算法·whisper·语音识别·asr·语言转文字
残诗7 个月前
制作一个能对话能跳舞的otto机器人
机器人·语音识别·asr·大模块