TheoremExplainAgent – AI教学双智能体，数理化定理自动转动画

❤️ 如果你也关注 AI 的发展现状，且对 AI 应用开发感兴趣，我会每日分享大模型与 AI 领域的开源项目和应用，提供运行实例和实用教程，帮助你快速上手AI技术！

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 尽在微信公众号 -> 搜一搜：蚝油菜花 🥦

🎥 "AI教学新革命！数理化定理秒变动画，滑铁卢大学开源神器TheoremExplainAgent"

大家好，我是蚝油菜花。你是否也曾为以下问题困扰：

👉 数学定理抽象难懂，文字解释枯燥乏味
👉 物理公式推导复杂，视觉化理解困难
👉 化学反应机制难以想象，学习效率低下

今天介绍的 TheoremExplainAgent，正是为解决这些问题而生！这个由滑铁卢大学和 Votee AI 等机构开发的多模态代理系统，能够将复杂的数学、物理、化学和计算机科学定理自动转化为长篇动画视频，结合文本、动画和语音，帮助你轻松理解抽象概念。不仅如此，它还能通过自动错误诊断和系统化评估，确保生成内容的准确性和逻辑性。接下来，让我们一起探索这个AI教学神器的强大功能和技术原理！

🚀 快速阅读

TheoremExplainAgent 是一个基于多模态技术的AI系统，旨在通过生成动画视频帮助用户更好地理解数学和科学定理。

核心功能：支持生成长篇视频、多模态解释、自动错误诊断和跨学科通用性。
技术原理：采用规划代理和编码代理的双智能体架构，结合链式思维和检索增强生成技术，确保视频的逻辑连贯性和准确性。

TheoremExplainAgent 是什么

TheoremExplainAgent（TEA）是由滑铁卢大学、Votee AI 等机构联合开发的多模态代理系统，旨在通过生成动画视频帮助用户更好地理解数学和科学定理。该系统支持生成超过5分钟的教育视频，涵盖数学、物理、化学和计算机科学等多个STEM领域。

为评估生成视频的质量，研究团队推出了 TheoremExplainBench（TEB）基准数据集，包含240个定理，从准确性、深度、逻辑流程、视觉相关性和元素布局等多个维度进行评估。实验表明，TheoremExplainAgent 在生成长篇视频的成功率上表现优异，能够揭示文本解释中容易遗漏的深层次推理错误，为AI生成教育内容提供了新的思路。

TheoremExplainAgent 的主要功能

生成长篇视频：根据输入的定理生成超过5分钟的解释视频，涵盖数学、物理、化学和计算机科学等多个学科。
多模态解释：结合文本、动画和语音，基于视觉化的方式增强对抽象概念的理解。
自动错误诊断：基于视频形式暴露推理错误，帮助开发者更清晰地诊断模型的逻辑漏洞。
跨学科通用性：支持不同难度级别的定理（从高中到研究生水平），适用于多种STEM领域。
系统化评估：基于 TheoremExplainBench 基准和多维度评估指标，系统地衡量生成视频的质量和准确性。

TheoremExplainAgent 的技术原理

规划代理：负责根据输入的定理生成视频的整体计划，包括场景划分、每个场景的目标、内容描述及视觉布局。采用链式思维（Chain-of-Thought）和程序化思维（Program-of-Thought）等技术，确保视频内容的逻辑连贯性和深度。
编码代理：根据规划代理生成的详细计划，使用 Manim（一个用于创建数学动画的Python库）生成动画脚本。基于检索增强生成（RAG）技术，使用 Manim 文档作为知识库，动态检索代码片段和API文档，提高代码生成的准确性和效率。在代码生成过程中，自动检测和修复错误，确保视频正确渲染。
多模态融合：视频内容结合文本叙述、动画演示和语音解说，基于视觉化的方式增强对定理的理解。使用图像处理技术和自然语言处理模型（如 GPT-4o 和 Gemini 2.0 Flash）对生成的视频进行多维度评估，确保内容的准确性和视觉质量。
系统化评估：引入 TheoremExplainBench 基准，包含240个定理，覆盖多个学科和难度级别。推出五个自动评估指标（准确性、视觉相关性、逻辑流程、元素布局和视觉一致性），全面衡量AI生成视频的质量。

如何运行 TheoremExplainAgent

1. 设置环境

首先，创建一个 conda 环境并安装依赖：

shell 复制代码

conda create --name tea python=3.12.8
conda activate tea
pip install -r requirements.txt

2. 安装 Manim 依赖

根据 Manim 官方文档安装 LaTeX 和其他依赖。

3. 下载 Kokoro 模型

下载 Kokoro 模型和语音文件以启用 TTS 服务：

shell 复制代码

mkdir -p models && wget -P models https://github.com/thewh1teagle/kokoro-onnx/releases/download/model-files/kokoro-v0_19.onnx && wget -P models https://github.com/thewh1teagle/kokoro-onnx/releases/download/model-files/voices.bin

4. 配置环境变量

创建 .env 文件并填写 API 密钥：

shell 复制代码

# OpenAI
OPENAI_API_KEY=""

# Azure OpenAI
AZURE_API_KEY=""
AZURE_API_BASE=""
AZURE_API_VERSION=""

# Google Vertex AI
VERTEXAI_PROJECT=""
VERTEXAI_LOCATION=""
GOOGLE_APPLICATION_CREDENTIALS=""

# Google Gemini
GEMINI_API_KEY=""

5. 生成视频

使用以下命令生成视频：

shell 复制代码

python generate_video.py \
      --model "openai/o3-mini" \
      --helper_model "openai/o3-mini" \
      --output_dir "output/my_exp_name" \
      --topic "Big O notation" \
      --context "most common type of asymptotic notation in computer science used to measure worst case complexity" \

资源

项目主页 ：tiger-ai-lab.github.io/TheoremExpl...
GitHub 仓库 ：github.com/TIGER-AI-La...
HuggingFace 模型库 ：huggingface.co/datasets/TI...

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 尽在微信公众号 -> 搜一搜：蚝油菜花 🥦