OpenMAIC:清华出品开源多 Agent 互动课堂!一键生成课程+5种交互模式+AI教师语音克隆+白板协作+OpenClaw集成,让被动听课变主动探索!
💡 清华 MAIC 团队出品,MIT 开源,JCST'26 论文收录。不是又一个 AI 课件生成器------而是一个真正沉浸式的多 Agent 互动课堂。输入任意主题或文档,AI 自动生成完整课程(大纲→幻灯片→测验→交互仿真→PBL 项目),AI 教师和 AI 同学实时授课、讨论、画白板、语音讲解;深度交互模式提供 3D 可视化/物理仿真/知识游戏/思维导图/在线编程 5 种动手学习体验;VoxCPM2 语音克隆让每个 Agent 都有独特声音;OpenClaw 集成让你从飞书/Slack/Telegram 直接生成课堂;导出 PPTX/HTML/ZIP 三种格式,离线也能用。

📌 目录
- [1. OpenMAIC 是什么?](#1. OpenMAIC 是什么?)
- [2. 核心设计理念](#2. 核心设计理念)
- [3. 一键课程生成](#3. 一键课程生成)
- [4. 四大课堂组件](#4. 四大课堂组件)
- [5. 深度交互模式:5 种动手学习](#5. 深度交互模式:5 种动手学习)
- [6. 多 Agent 互动](#6. 多 Agent 互动)
- [7. TTS 语音与 VoxCPM2 克隆](#7. TTS 语音与 VoxCPM2 克隆)
- [8. OpenClaw 集成](#8. OpenClaw 集成)
- [9. 快速上手](#9. 快速上手)
- [10. 模型与部署](#10. 模型与部署)
- [11. 竞品对比](#11. 竞品对比)
- [12. 总结与推荐](#12. 总结与推荐)
1. OpenMAIC 是什么?
OpenMAIC(Open Multi-Agent Interactive Classroom)是清华 MAIC 团队出品的开源多 Agent 互动课堂平台。
- 🔗 项目地址:https://github.com/THU-MAIC/OpenMAIC
- 🌐 在线演示:https://open.maic.chat/
- 📄 论文:JCST 2026(DOI)
- 👤 团队:清华大学 MAIC
- 🛠️ 技术栈:Next.js 16 / React 19 / TypeScript 5 / LangGraph 1.1 / Tailwind CSS 4
- 🔄 最新:v0.2.2(2026-06-02)
- 🏠 高级版:MAIC-UI
一句话总结
OpenMAIC = 清华出品开源多 Agent 互动课堂
= MIT 协议 + JCST'26 论文
= 一键课程生成(主题/文档 → 大纲 → 幻灯片/测验/仿真/PBL)
= 多 Agent 课堂(AI 教师 + AI 同学)
= 深度交互模式(3D/仿真/游戏/思维导图/编程)
= 白板 + TTS 语音 + VoxCPM2 语音克隆
= OpenClaw 集成(飞书/Slack/Telegram 直接生成课堂)
= 导出 PPTX / HTML / ZIP(离线可用)
= 15+ LLM Provider + Lemonade 本地
= MinerU 文档解析 + VoxCPM2 TTS
= i18n 7 语言 + 暗色模式
= Vercel 一键部署 / Docker
2. 核心设计理念
🎓 不只是看课 → 动手探索
"Play is the highest form of research." --- Einstein
🤖 不只是 AI 讲 → 多 Agent 互动
AI 教师 + AI 同学 + 你 = 真实课堂体验
🧪 不只是幻灯片 → 5 种交互模式
3D / 仿真 / 游戏 / 思维导图 / 在线编程
🔊 不只是文字 → 语音+白板
AI 教师口语讲解 + 实时白板画图
📤 不只在线看 → 到处可用
PPTX / HTML / ZIP 导出,离线也能用
💬 不只浏览器 → 聊天 App 也能用
OpenClaw 集成,飞书/Slack/Telegram 直接生成
3. 一键课程生成
两阶段 Pipeline:
阶段一:Outline(大纲)
→ AI 分析你的输入(主题 or 文档)
→ 生成结构化课程大纲
→ v0.2.2 支持生成前编辑大纲
阶段二:Scenes(场景)
→ 每个大纲项 → 丰富场景
→ 幻灯片 / 测验 / 交互仿真 / PBL 项目
v0.2.2 新增:MAIC Editor (v0) Pro Mode,可编辑已生成的幻灯片!
4. 四大课堂组件
🎓 Slides(幻灯片)
✅ AI 教师授课 + 语音旁白
✅ Spotlight 聚光灯效果
✅ Laser pointer 激光笔动画
✅ 就像真实课堂!
🧪 Quiz(测验)
✅ 单选 / 多选 / 简答
✅ 实时 AI 批改 + 反馈
✅ 课程完成页 + 持久化测验状态(v0.2.1)
🔬 Interactive Simulation(交互仿真)
✅ HTML 交互实验
✅ 物理仿真器 / 流程图 / 可视化
✅ 动手操作,不是被动看
🏗️ PBL(项目式学习)
✅ 选择角色
✅ 与 AI Agent 协作
✅ 里程碑 + 交付物
✅ 真实项目体验
5. 深度交互模式:5 种动手学习
v0.2.0 旗舰功能!被动听课 ❌ → 动手探索 ✅
| 类型 | 说明 |
|---|---|
| 🌐 3D 可视化 | 三维展示抽象结构,直觉理解 |
| ⚙️ 仿真 | 物理仿真/实验环境,观察动态变化 |
| 🎮 游戏 | 知识小游戏,互动挑战强化记忆 |
| 🧭 思维导图 | 结构化知识组织,构建概念框架 |
| 💻 在线编程 | 浏览器内编码+即时运行,写测迭代 |
AI 教师主动引导
✅ 高亮关键区域
✅ 设置实验条件
✅ 提供提示
✅ 在正确时刻引导注意力
→ AI 教师可以主动操作 UI!
全设备响应式
✅ Desktop / iPad / Mobile
✅ 生成交互 UI 自适应
6. 多 Agent 互动
💬 Classroom Discussion
→ Agent 主动发起讨论
→ 你可以随时加入或被点名
🎙️ Roundtable Debate
→ 多个不同人格 Agent 圆桌讨论
→ 白板实时插图
❓ Q&A Mode
→ 自由提问
→ AI 教师用幻灯片/图表/白板回答
✏️ Whiteboard
→ AI Agent 实时画白板
→ 逐步解题 / 画流程图 / 可视化概念
7. TTS 语音与 VoxCPM2 克隆
多 TTS Provider
✅ OpenAI TTS
✅ MiniMax TTS
✅ VoxCPM2(开源语音克隆)
✅ Lemonade(本地 TTS)
VoxCPM2 三种语音模式
| 模式 | 说明 |
|---|---|
| Auto Voice(默认) | 根据 Agent 人设自动生成声音提示,零配置 |
| Prompt Voice | 自然语言描述声音,如"温暖女教师,平稳鼓励,中音调" |
| Clone Voice | 上传/录制短音频克隆声音 |
三种 VoxCPM 后端部署方式:
| 后端 | 端点 | 适用场景 |
|---|---|---|
| vLLM-Omni | /v1/audio/speech |
GPU 服务器 |
| Python API | /tts/upload |
官方 FastAPI 运行时 |
| Nano-vLLM | /generate |
轻量级部署 |
语音识别(ASR)
✅ 浏览器麦克风输入
✅ Azure STT(v0.2.2 新增)
✅ Lemonade 本地 ASR
8. OpenClaw 集成
🐾 从聊天 App 直接生成课堂,零终端操作!
支持:飞书 / Slack / Discord / Telegram / WhatsApp / 20+ App
安装:
clawhub install openmaic
或告诉你的 Claw "install OpenMAIC skill"
两种模式:
Hosted → 获取 access code,无需本地部署
Self-hosted → 技能引导你 clone/config/startup
使用:
告诉助手 "teach me quantum physics" → 完成!
9. 快速上手
本地运行
bash
# 1. Clone & Install
git clone https://github.com/THU-MAIC/OpenMAIC.git
cd OpenMAIC
pnpm install
# 2. Configure
cp .env.example .env.local
# 编辑 .env.local,填入至少一个 LLM API Key
# 3. Run
pnpm dev
# 打开 http://localhost:3000
Vercel 一键部署
→ 点击 Deploy with Vercel 按钮
→ 配置环境变量(至少一个 LLM Key)
→ 完成!
Docker 部署
bash
cp .env.example .env.local
# 编辑 .env.local
docker compose up --build
可选配置
ACCESS_CODE=your-secret-code # 站点级密码保护
PDF_MINERU_BASE_URL=... # MinerU 高级文档解析
TTS_VOXCPM_BASE_URL=... # VoxCPM2 语音克隆
LEMONADE_BASE_URL=... # 本地 LLM/TTS/ASR/图片
10. 模型与部署
15+ LLM Provider
OpenAI / Anthropic / Google Gemini / DeepSeek / Qwen
Kimi / MiniMax / Grok (xAI) / OpenRouter / Doubao
Tencent Hunyuan/TokenHub / Xiaomi MiMo / GLM (Zhipu)
Ollama(本地)/ Lemonade(本地 LLM+图片+TTS+ASR)
任何 OpenAI 兼容 API
推荐模型
🏆 Gemini 3 Flash --- 质量与速度最佳平衡
🏆 Gemini 3.1 Pro --- 最高质量(较慢)
🏆 MiniMax M2.7-highspeed --- 国内高速
导出格式
| 格式 | 说明 |
|---|---|
| PPTX | 可编辑幻灯片,含图片/图表/LaTeX |
| HTML | 自包含交互网页 |
| ZIP | 完整课堂导出(课程结构+媒体) |
| 离线 ZIP | v0.2.2 外部资源内联为 data:URI,断网可用 |
11. 竞品对比
| 对比维度 | OpenMAIC | Khanmigo | Duolingo Max | Coursera AI |
|---|---|---|---|---|
| 开源 | ✅ MIT | ❌ | ❌ | ❌ |
| 多 Agent | ✅ 教师+同学 | ❌ 单 Agent | ❌ | ❌ |
| 深度交互 | ✅ 5种模式 | ❌ | 有限 | 有限 |
| 白板 | ✅ 实时协作 | ❌ | ❌ | ❌ |
| TTS 语音 | ✅ 多 Provider+克隆 | ✅ | ✅ | ✅ |
| 自定义主题 | ✅ 任意主题 | 有限 | 语言限定 | 课程限定 |
| OpenClaw | ✅ | ❌ | ❌ | ❌ |
| 导出 | ✅ PPTX/HTML/ZIP | ❌ | ❌ | 证书 |
| 自托管 | ✅ | ❌ | ❌ | ❌ |
| 论文 | ✅ JCST'26 | ❌ | ❌ | ❌ |
| 本地模型 | ✅ Ollama/Lemonade | ❌ | ❌ | ❌ |
最大差异化
1. 多 Agent 互动课堂:AI 教师 + AI 同学 + 你,真实课堂体验
2. 5 种深度交互:3D/仿真/游戏/思维导图/编程,不是被动看
3. VoxCPM2 语音克隆:每个 Agent 独特声音
4. AI 教师主动引导:操作 UI 高亮关键区、设置条件
5. OpenClaw 集成:从聊天 App 直接生成课堂
6. MIT 开源 + JCST 论文:学术 + 开源双背书
7. 离线导出:ZIP 内联资源,断网也能用
12. 总结与推荐
推荐指数:⭐⭐⭐⭐⭐
| 维度 | 评分 | 说明 |
|---|---|---|
| 创新 | ⭐⭐⭐⭐⭐ | 多 Agent 课堂 + 5 种交互模式,独有 |
| 学术 | ⭐⭐⭐⭐⭐ | JCST'26 论文 + 清华团队 |
| 开源 | ⭐⭐⭐⭐⭐ | MIT 协议,商用零顾虑 |
| 易用 | ⭐⭐⭐⭐⭐ | 一键生成 + Vercel 一键部署 |
| 生态 | ⭐⭐⭐⭐⭐ | 15+ Provider + OpenClaw + ClawHub |
| 体验 | ⭐⭐⭐⭐⭐ | 语音 + 白板 + 3D + 游戏,沉浸感拉满 |
一句话推荐
如果你想让 AI 教育从"看课件"变成"动手探索",
OpenMAIC 是目前最完整、最创新的开源方案。
MIT 开源 + 清华学术背书,
多 Agent 课堂让你体验真实课堂氛围,
5 种深度交互让你不是在看课而是在玩课,
VoxCPM2 语音克隆让每个 AI 都有独特声音,
OpenClaw 集成让你从聊天 App 一句话开课,
离线导出让知识走到哪里都能用。
被动听课的时代结束了。
OpenMAIC,让学习成为探索。
📢 项目地址:https://github.com/THU-MAIC/OpenMAIC
🌐 在线体验:https://open.maic.chat/
📄 论文:JCST 2026
💬 Discord:https://discord.gg/p8Pf2r3SaG
标签:#OpenMAIC #清华大学 #多Agent #互动课堂 #AI教育 #开源 #MIT #VoxCPM #语音克隆 #3D交互 #PBL #OpenClaw #LangGraph #NextJS #白板
分类:原创文章