OpenMAIC:清华出品开源多 Agent 互动课堂!

OpenMAIC:清华出品开源多 Agent 互动课堂!一键生成课程+5种交互模式+AI教师语音克隆+白板协作+OpenClaw集成,让被动听课变主动探索!

💡 清华 MAIC 团队出品,MIT 开源,JCST'26 论文收录。不是又一个 AI 课件生成器------而是一个真正沉浸式的多 Agent 互动课堂。输入任意主题或文档,AI 自动生成完整课程(大纲→幻灯片→测验→交互仿真→PBL 项目),AI 教师和 AI 同学实时授课、讨论、画白板、语音讲解;深度交互模式提供 3D 可视化/物理仿真/知识游戏/思维导图/在线编程 5 种动手学习体验;VoxCPM2 语音克隆让每个 Agent 都有独特声音;OpenClaw 集成让你从飞书/Slack/Telegram 直接生成课堂;导出 PPTX/HTML/ZIP 三种格式,离线也能用。

📌 目录

  • [1. OpenMAIC 是什么?](#1. OpenMAIC 是什么?)
  • [2. 核心设计理念](#2. 核心设计理念)
  • [3. 一键课程生成](#3. 一键课程生成)
  • [4. 四大课堂组件](#4. 四大课堂组件)
  • [5. 深度交互模式:5 种动手学习](#5. 深度交互模式:5 种动手学习)
  • [6. 多 Agent 互动](#6. 多 Agent 互动)
  • [7. TTS 语音与 VoxCPM2 克隆](#7. TTS 语音与 VoxCPM2 克隆)
  • [8. OpenClaw 集成](#8. OpenClaw 集成)
  • [9. 快速上手](#9. 快速上手)
  • [10. 模型与部署](#10. 模型与部署)
  • [11. 竞品对比](#11. 竞品对比)
  • [12. 总结与推荐](#12. 总结与推荐)

1. OpenMAIC 是什么?

OpenMAIC(Open Multi-Agent Interactive Classroom)是清华 MAIC 团队出品的开源多 Agent 互动课堂平台。

一句话总结

复制代码
OpenMAIC = 清华出品开源多 Agent 互动课堂
  = MIT 协议 + JCST'26 论文
  = 一键课程生成(主题/文档 → 大纲 → 幻灯片/测验/仿真/PBL)
  = 多 Agent 课堂(AI 教师 + AI 同学)
  = 深度交互模式(3D/仿真/游戏/思维导图/编程)
  = 白板 + TTS 语音 + VoxCPM2 语音克隆
  = OpenClaw 集成(飞书/Slack/Telegram 直接生成课堂)
  = 导出 PPTX / HTML / ZIP(离线可用)
  = 15+ LLM Provider + Lemonade 本地
  = MinerU 文档解析 + VoxCPM2 TTS
  = i18n 7 语言 + 暗色模式
  = Vercel 一键部署 / Docker

2. 核心设计理念

复制代码
🎓 不只是看课 → 动手探索
   "Play is the highest form of research." --- Einstein

🤖 不只是 AI 讲 → 多 Agent 互动
   AI 教师 + AI 同学 + 你 = 真实课堂体验

🧪 不只是幻灯片 → 5 种交互模式
   3D / 仿真 / 游戏 / 思维导图 / 在线编程

🔊 不只是文字 → 语音+白板
   AI 教师口语讲解 + 实时白板画图

📤 不只在线看 → 到处可用
   PPTX / HTML / ZIP 导出,离线也能用

💬 不只浏览器 → 聊天 App 也能用
   OpenClaw 集成,飞书/Slack/Telegram 直接生成

3. 一键课程生成

两阶段 Pipeline:

复制代码
阶段一:Outline(大纲)
  → AI 分析你的输入(主题 or 文档)
  → 生成结构化课程大纲
  → v0.2.2 支持生成前编辑大纲

阶段二:Scenes(场景)
  → 每个大纲项 → 丰富场景
  → 幻灯片 / 测验 / 交互仿真 / PBL 项目

v0.2.2 新增:MAIC Editor (v0) Pro Mode,可编辑已生成的幻灯片!


4. 四大课堂组件

🎓 Slides(幻灯片)

复制代码
✅ AI 教师授课 + 语音旁白
✅ Spotlight 聚光灯效果
✅ Laser pointer 激光笔动画
✅ 就像真实课堂!

🧪 Quiz(测验)

复制代码
✅ 单选 / 多选 / 简答
✅ 实时 AI 批改 + 反馈
✅ 课程完成页 + 持久化测验状态(v0.2.1)

🔬 Interactive Simulation(交互仿真)

复制代码
✅ HTML 交互实验
✅ 物理仿真器 / 流程图 / 可视化
✅ 动手操作,不是被动看

🏗️ PBL(项目式学习)

复制代码
✅ 选择角色
✅ 与 AI Agent 协作
✅ 里程碑 + 交付物
✅ 真实项目体验

5. 深度交互模式:5 种动手学习

v0.2.0 旗舰功能!被动听课 ❌ → 动手探索 ✅

类型 说明
🌐 3D 可视化 三维展示抽象结构,直觉理解
⚙️ 仿真 物理仿真/实验环境,观察动态变化
🎮 游戏 知识小游戏,互动挑战强化记忆
🧭 思维导图 结构化知识组织,构建概念框架
💻 在线编程 浏览器内编码+即时运行,写测迭代

AI 教师主动引导

复制代码
✅ 高亮关键区域
✅ 设置实验条件
✅ 提供提示
✅ 在正确时刻引导注意力
→ AI 教师可以主动操作 UI!

全设备响应式

复制代码
✅ Desktop / iPad / Mobile
✅ 生成交互 UI 自适应

6. 多 Agent 互动

复制代码
💬 Classroom Discussion
  → Agent 主动发起讨论
  → 你可以随时加入或被点名

🎙️ Roundtable Debate
  → 多个不同人格 Agent 圆桌讨论
  → 白板实时插图

❓ Q&A Mode
  → 自由提问
  → AI 教师用幻灯片/图表/白板回答

✏️ Whiteboard
  → AI Agent 实时画白板
  → 逐步解题 / 画流程图 / 可视化概念

7. TTS 语音与 VoxCPM2 克隆

多 TTS Provider

复制代码
✅ OpenAI TTS
✅ MiniMax TTS
✅ VoxCPM2(开源语音克隆)
✅ Lemonade(本地 TTS)

VoxCPM2 三种语音模式

模式 说明
Auto Voice(默认) 根据 Agent 人设自动生成声音提示,零配置
Prompt Voice 自然语言描述声音,如"温暖女教师,平稳鼓励,中音调"
Clone Voice 上传/录制短音频克隆声音

三种 VoxCPM 后端部署方式:

后端 端点 适用场景
vLLM-Omni /v1/audio/speech GPU 服务器
Python API /tts/upload 官方 FastAPI 运行时
Nano-vLLM /generate 轻量级部署

语音识别(ASR)

复制代码
✅ 浏览器麦克风输入
✅ Azure STT(v0.2.2 新增)
✅ Lemonade 本地 ASR

8. OpenClaw 集成

复制代码
🐾 从聊天 App 直接生成课堂,零终端操作!

支持:飞书 / Slack / Discord / Telegram / WhatsApp / 20+ App

安装:
  clawhub install openmaic
  或告诉你的 Claw "install OpenMAIC skill"

两种模式:
  Hosted → 获取 access code,无需本地部署
  Self-hosted → 技能引导你 clone/config/startup

使用:
  告诉助手 "teach me quantum physics" → 完成!

9. 快速上手

本地运行

bash 复制代码
# 1. Clone & Install
git clone https://github.com/THU-MAIC/OpenMAIC.git
cd OpenMAIC
pnpm install

# 2. Configure
cp .env.example .env.local
# 编辑 .env.local,填入至少一个 LLM API Key

# 3. Run
pnpm dev
# 打开 http://localhost:3000

Vercel 一键部署

复制代码
→ 点击 Deploy with Vercel 按钮
→ 配置环境变量(至少一个 LLM Key)
→ 完成!

Docker 部署

bash 复制代码
cp .env.example .env.local
# 编辑 .env.local
docker compose up --build

可选配置

复制代码
ACCESS_CODE=your-secret-code     # 站点级密码保护
PDF_MINERU_BASE_URL=...          # MinerU 高级文档解析
TTS_VOXCPM_BASE_URL=...          # VoxCPM2 语音克隆
LEMONADE_BASE_URL=...            # 本地 LLM/TTS/ASR/图片

10. 模型与部署

15+ LLM Provider

复制代码
OpenAI / Anthropic / Google Gemini / DeepSeek / Qwen
Kimi / MiniMax / Grok (xAI) / OpenRouter / Doubao
Tencent Hunyuan/TokenHub / Xiaomi MiMo / GLM (Zhipu)
Ollama(本地)/ Lemonade(本地 LLM+图片+TTS+ASR)
任何 OpenAI 兼容 API

推荐模型

复制代码
🏆 Gemini 3 Flash --- 质量与速度最佳平衡
🏆 Gemini 3.1 Pro --- 最高质量(较慢)
🏆 MiniMax M2.7-highspeed --- 国内高速

导出格式

格式 说明
PPTX 可编辑幻灯片,含图片/图表/LaTeX
HTML 自包含交互网页
ZIP 完整课堂导出(课程结构+媒体)
离线 ZIP v0.2.2 外部资源内联为 data:URI,断网可用

11. 竞品对比

对比维度 OpenMAIC Khanmigo Duolingo Max Coursera AI
开源 ✅ MIT
多 Agent ✅ 教师+同学 ❌ 单 Agent
深度交互 ✅ 5种模式 有限 有限
白板 ✅ 实时协作
TTS 语音 ✅ 多 Provider+克隆
自定义主题 ✅ 任意主题 有限 语言限定 课程限定
OpenClaw
导出 ✅ PPTX/HTML/ZIP 证书
自托管
论文 ✅ JCST'26
本地模型 ✅ Ollama/Lemonade

最大差异化

复制代码
1. 多 Agent 互动课堂:AI 教师 + AI 同学 + 你,真实课堂体验
2. 5 种深度交互:3D/仿真/游戏/思维导图/编程,不是被动看
3. VoxCPM2 语音克隆:每个 Agent 独特声音
4. AI 教师主动引导:操作 UI 高亮关键区、设置条件
5. OpenClaw 集成:从聊天 App 直接生成课堂
6. MIT 开源 + JCST 论文:学术 + 开源双背书
7. 离线导出:ZIP 内联资源,断网也能用

12. 总结与推荐

推荐指数:⭐⭐⭐⭐⭐

维度 评分 说明
创新 ⭐⭐⭐⭐⭐ 多 Agent 课堂 + 5 种交互模式,独有
学术 ⭐⭐⭐⭐⭐ JCST'26 论文 + 清华团队
开源 ⭐⭐⭐⭐⭐ MIT 协议,商用零顾虑
易用 ⭐⭐⭐⭐⭐ 一键生成 + Vercel 一键部署
生态 ⭐⭐⭐⭐⭐ 15+ Provider + OpenClaw + ClawHub
体验 ⭐⭐⭐⭐⭐ 语音 + 白板 + 3D + 游戏,沉浸感拉满

一句话推荐

复制代码
如果你想让 AI 教育从"看课件"变成"动手探索",
OpenMAIC 是目前最完整、最创新的开源方案。

MIT 开源 + 清华学术背书,
多 Agent 课堂让你体验真实课堂氛围,
5 种深度交互让你不是在看课而是在玩课,
VoxCPM2 语音克隆让每个 AI 都有独特声音,
OpenClaw 集成让你从聊天 App 一句话开课,
离线导出让知识走到哪里都能用。

被动听课的时代结束了。
OpenMAIC,让学习成为探索。

📢 项目地址:https://github.com/THU-MAIC/OpenMAIC

🌐 在线体验:https://open.maic.chat/

📄 论文:JCST 2026

💬 Discord:https://discord.gg/p8Pf2r3SaG


标签:#OpenMAIC #清华大学 #多Agent #互动课堂 #AI教育 #开源 #MIT #VoxCPM #语音克隆 #3D交互 #PBL #OpenClaw #LangGraph #NextJS #白板

分类:原创文章