mini-omni

第10章 Streaming（上）：初级音频应用（1）——项目三：自建服务器的Mini-Omni实时语音聊天机器人由于流式传输内容较多，因此将其分为初级音频应用、高级音频应用和视频应用三部分。本章音频应用部分包括自动语音识别技术（ASR），自建服务器的Mini-Omni模型的对话式聊天机器人，Groq与带自动语音检测功能的多模态Gradio应用，Mistral实现流式传输音频的魔力8号球。除了拆解音频应用，还会详细介绍并实战大模型库Whisper、Mini-Omni、Groq和Mistral。此外，本章还会详细讲解用到的其他技术：@ricky0123/vad-web实现语音活动检测功能，Groq高速大模型调用库，Li

Mac M1下运行端到端语音模型Mini-OmniMini-Omni的贡献是让任意大模型都可以具有“听”和“说”的能力。✅实时语音到语音对话能力。不需要额外的ASR或TTS模型。

本地部署 mini-omni使用浏览器打开 http://localhost:8501/ 进行访问。使用浏览器打开 http://localhost:7860/ 进行访问。

我是有底线的