技术栈

mini-omni

shao918516
17 天前
ffmpeg·whisper·asr·mini-omni·自建语音服务器
第10章 Streaming(上):初级音频应用(1)——项目三:自建服务器的Mini-Omni实时语音聊天机器人由于流式传输内容较多,因此将其分为初级音频应用、高级音频应用和视频应用三部分。本章音频应用部分包括自动语音识别技术(ASR),自建服务器的Mini-Omni模型的对话式聊天机器人,Groq与带自动语音检测功能的多模态Gradio应用,Mistral实现流式传输音频的魔力8号球。除了拆解音频应用,还会详细介绍并实战大模型库Whisper、Mini-Omni、Groq和Mistral。此外,本章还会详细讲解用到的其他技术:@ricky0123/vad-web实现语音活动检测功能,Groq高速大模型调用库,Li
wxl781227
2 年前
macos·mini-omni·qwen2-0.5b·end to end
Mac M1下运行端到端语音模型Mini-OmniMini-Omni的贡献是让任意大模型都可以具有“听”和“说”的能力。✅实时语音到语音对话能力。不需要额外的ASR或TTS模型。
engchina
2 年前
本地部署·mini-omni
本地部署 mini-omni使用浏览器打开 http://localhost:8501/ 进行访问。使用浏览器打开 http://localhost:7860/ 进行访问。
我是有底线的