面向中小学私有化多智能体 AI 备课平台:全栈技术架构与完整功能实现方案

导读:教育 AI 早已不是教师个人娱乐工具,公办校、民办学校信息化建设现在面临一个绕不开的工程难题:通用公有 AI 备课工具数据合规不达标、单模型生成内容粗糙无校验、全校教学资源无法统一沉淀。 市面上绝大多数轻量化 AI 备课产品仅简单封装 LLM 接口,没有面向校园组织级的调度、审核、资产管控架构。本文基于云迈私有化 AI 教学创作中台(solution/44),从 LangGraph 多智能体底层调度、交互式课件渲染引擎、向量校本知识库、私有化安全部署、全链路审计后台五大模块拆解完整技术实现,附带业务流程、分层架构、落地适配方案。 本文适合教育信息化研发、ToB 产品架构师、学校信息中心运维、大模型应用落地工程师阅读,可直接作为私有化教育 AI 项目设计参考文档。

摘要

当前教育数字化转型进入深水区,公办中小学、民办院校普遍面临教师备课效率低、教学资源无法沉淀、公有 AI 数据不合规、课件缺乏课堂交互能力四大痛点。通用单模型 AI 工具仅能完成简单文本生成,无法满足校级统一管理、校本知识沉淀、内网数据隔离等硬性需求。

本文基于云迈科技私有化 AI 教学资源创作平台(solution/44),从底层多智能体调度引擎、前端课件交互引擎、校级资源知识库、私有化安全部署、后台管控体系五大维度,完整拆解平台技术架构、核心实现逻辑与全量业务功能,为教育行业私有化 AI 教研中台落地提供可落地技术参考。

一、行业技术痛点分析

1.1 传统 PPT 备课工具技术短板

  1. 静态文件无专属交互渲染内核:理化仿真、数学动态推演依赖第三方插件,教室终端兼容性差,无法原生运行交互式课堂组件;
  2. 无结构化知识底座:课件以独立文件散落在教师本地电脑,缺少统一知识点标签、向量索引体系,难以实现跨年级、跨学科检索复用;
  3. 无 AI 流水线生产能力:单次大模型调用只能输出纯文本,缺失需求解析、大纲拆解、内容校验、交互组件生成完整工作流,教师二次改造成本极高。

1.2 公有 SaaS 类 AI 备课产品架构硬伤

  1. 数据跨公网传输:校本课件、校内教研资料、课程设计上传第三方云端,违反《教育数据安全管理办法》、未成年人隐私保护、等保 2.0 合规要求;
  2. 模型密钥统一托管:平台垄断大模型接入通道,学校无法自主切换服务商、精细化管控 Token 消耗,长期使用成本不可控;
  3. 无组织级管控设计:产品面向 C 端教师设计,缺少账号分级、资源人工审核、全校用量预算、教学资产归档等校级管理能力。

1.3 校内自研简易 AI 工具普遍缺陷

很多学校信息化团队自研轻量化 AI 工具,仅封装基础 LLM 调用接口,工程层面存在明显短板:

  • 任务无状态持久化,长耗时课件生成中断后无法续跑;
  • 单层内容校验,无知识点、学段、版权三重审核逻辑,生成错题、超纲内容频发;
  • 缺少标准化资源入库链路,AI 产出内容无法沉淀为可复用校级数字资产。

针对以上行业共性痛点,平台采用LangGraph 多智能体协同调度 + 内网私有化容器部署 + 自研 HTML 交互式课件渲染引擎 + 分布式向量校本知识库 四层核心底座,搭建覆盖创作、审核、存储、管控、审计全链路的校级 AI 教研中台。

二、整体五层分层技术架构设计

整套架构完全隔离公网,适配校园内网、本地私有云、物理服务器部署,自上而下分层解耦,便于分模块迭代维护:

  1. 应用接入层:教师 Web 工作台、校级管理后台、离线课件预览终端、多媒体投屏适配端;
  2. 业务编排层:LangGraph 多智能体任务调度引擎、课件生成工作流、资源审核流程引擎、积分规则计算引擎;
  3. 核心能力层:交互式课件渲染引擎、校本知识库向量检索引擎、LLM 统一代理网关、数据看板聚合计算引擎;
  4. 数据持久层:结构化业务数据库、知识点向量库、全链路审计日志库、课件素材对象存储;
  5. 基础设施层:Docker 容器集群、内网加密传输网关、定时全量备份系统、校内权限统一认证服务。

三、底层核心:LangGraph 多智能体协同调度引擎

3.1 引擎核心技术实现原理

摒弃传统单次 LLM 请求模式,基于 LangGraph 构建有向无环任务图,支持智能体串行、并行、分支流转、人工阻断节点,三大核心技术特性:

  1. 任务全状态持久化 所有课件生成任务写入本地事务数据库,实时记录当前执行节点、输入上下文、中间素材产物,支持任务手动暂停、保存快照、断点续跑、异常失败自动重试,解决大篇幅课件生成丢失问题。
  2. 学科化可视化流程编排 管理后台提供可视化流程图编辑器,支持按小学 / 初中 / 高中分学科独立配置智能体执行顺序、触发条件、人工审核拦截节点;配置模板支持版本快照、一键批量下发全校所有账号。
  3. 可配置人工干预节点 在大纲生成、内容校验、资源匹配关键节点嵌入人工确认步骤,AI 输出内容必须经教师确认后,才能流转至下一生产环节,从流程层面规避错误课件直接产出、入库。

3.2 八大教学专用智能体分工与执行逻辑

完整流水线由 8 个解耦独立 Agent 组成,各司其职,便于单独迭代优化,完整任务流转伪代码示意:

python

运行

复制代码
# 多智能体调度简易伪代码
graph = LangGraph()
graph.add_node("demand_agent", DemandParseAgent())
graph.add_node("knowledge_retrieve_agent", KnowledgeRetrieveAgent())
graph.add_node("outline_agent", OutlineGenAgent())
graph.add_node("page_gen_agent", MultiPageAsyncAgent())
graph.add_node("component_agent", InteractiveComponentAgent())
graph.add_node("audit_agent", ContentAuditAgent())
graph.add_node("optimize_agent", SinglePageOptAgent())
graph.add_node("storage_agent", ResourceArchiveAgent())

# 任务流转链路
graph.add_edge("demand_agent", "knowledge_retrieve_agent")
graph.add_edge("knowledge_retrieve_agent", "outline_agent")
graph.add_edge("outline_agent", "page_gen_agent")
graph.add_edge("page_gen_agent", "component_agent")
graph.add_edge("component_agent", "audit_agent")
# 校验不通过回流优化节点
graph.add_conditional_edge("audit_agent", judge_content_error, "optimize_agent", "storage_agent")
  1. 需求解析 Agent 输入源:自然语言备课描述、上传 PDF/Word/PPT 教材、实拍教材图片 OCR 文本; 核心能力:LLM 实体抽取 + 正则分类,自动提取学科、年级、课时、课程类型(常规课 / 实验课 / 复习课)、教学重难点,输出标准化结构化 JSON 上下文,作为全流程统一入参。
  2. 私有知识库检索 Agent 检索机制:向量相似度检索 + 标签精确匹配双引擎; 执行逻辑:优先检索校内私有知识库匹配课件、习题、教学素材,校内无匹配资源时调取合规公共素材池,自动过滤侵权、版权风险图文素材。
  3. 课程大纲生成 Agent 入参:结构化需求 + 匹配校本知识点向量; 输出标准化树形课堂框架:课程导入→新知讲解→实验演示→随堂测验→课堂总结→课后拓展,前端支持拖拽调整层级、增删章节。
  4. 多页面并行生成 Agent 采用异步协程并发调度,多页面生成任务并行推送至 LLM 代理网关,批量生成每页图文、例题、配套素材,大幅压缩完整课件生产耗时。
  5. 内容质量审查 Agent 三重校验链路并行执行:知识点匹配校验、学段难度分级校验、图文版权检测;内置错题知识库,自动标记公式错误、史实偏差、超纲内容,生成结构化修改建议返回前端。
  6. 交互组件生成 Agent 基于学科标签匹配对应交互组件模板,自动生成理化仿真、拖拽匹配、在线试题、轻量化 3D 动画配置 JSON,交付前端渲染引擎可视化展示。
  7. 内容优化 Agent 独立轻量化 LLM 调用通道,支持单页面定向微调指令:降低难度、增加分组互动、补充拓展案例、简化课堂话术等,仅局部重生成,无需重建整套课件,节省 Token 开销。
  8. 资源归档入库 Agent 课件编辑完成后自动提取学科、年级、知识点多维度标签,标准化格式化存储,同步写入校本资源向量库、更新创作者积分统计数据。

四、前端应用层:教师工作台与自研交互式课件渲染引擎

4.1 教师工作台核心模块技术实现

  1. 多格式教学素材解析模块 内置 PDF、Word、PPT 专用解析器,提取文档文字、表格、矢量公式、图片素材,转换为平台统一结构化素材;集成图片 OCR 能力,支持纸质教材拍照提取文字作为生成参考。
  2. 树形大纲可视化编辑组件 基于拖拽交互框架实现,支持增删章节、调换页面顺序、修改课时目标,操作实时同步至后端任务上下文。
  3. 单页局部 AI 调优接口 独立轻量 LLM 通道,缓存页面历史编辑快照,支持一键回滚任意历史版本,减少全局重算带来的算力消耗。
  4. 个人资源分类存储系统 基于分布式对象存储划分草稿箱、已发布课件、收藏资源、原创作品四大分类;前端本地缓存高频使用课件,提升页面加载速度。

4.2 自研 HTML 交互式课件渲染引擎(平台差异化核心)

区别于传统导出 PPT 静态文件方案,平台自研原生网页交互渲染内核,核心技术特性:

  1. 六大内置交互组件独立渲染器
  • 理化仿真模拟器:Canvas 前端实时物理运算,拖拽参数动态展示力学、光学、电学实验效果;
  • 拖拽连线组件:前端事件绑定,课堂实时匹配答题,本地离线存储作答记录;
  • 在线测验渲染器:统一适配单选、多选、填空、简答题型,无网络环境可本地判分;
  • WebGL 轻量化 3D 教学动画:理科结构、地理地形模型流畅渲染,低配教室主机无卡顿;
  • 课堂互动小游戏组件:知识点闯关、分组课堂竞赛逻辑封装;
  • 定点标记视频播放器:支持课件内视频精准跳转教学节点。
  1. 离线 HTML 打包导出技术 将课件静态资源、交互运算 JS 脚本、仿真逻辑统一打包为独立 HTML 文件夹,全部交互逻辑本地运行,无需依赖后端接口,适配无网络多媒体教室。
  2. 16:9 投影自适应响应式布局 布局引擎自动适配教室投影仪、教学触控大屏、教师办公电脑多终端尺寸,无需手动调整缩放。
  3. 标准化 JSON 存储规范 课件页面、文字内容、交互组件、配置参数全部序列化 JSON 持久化,便于 AI 二次读取重构、跨课件复用交互组件。

五、业务核心:校级结构化校本知识库系统

5.1 双库底层架构:课标知识库 + 课件资源库

  1. 课标知识点向量库 存储 K12 全学科、全年级知识点、重难点结构化数据,文本向量化后构建高速相似度检索索引;管理员后台支持批量导入、编辑、版本化管理课标内容。 AI 生成内容强制绑定知识点唯一 ID,保障所有课件贴合本校统一教学标准。
  2. 全校课件资源对象库 教师提交课件统一入库,系统自动打上学科、年级、知识点、星级多维度标签;提供多条件复合检索接口,支持跨年级、跨教研组资源一键复用。

5.2 资源审核与教学资产沉淀完整流程

  1. 教师提交课件 → 质量审查 Agent 自动 AI 初审 → 教研组长人工复核;
  2. 审核通过标记校级认证优质资源,同步更新全局向量检索索引;
  3. 资源永久存储校内对象存储集群,不受教师离职、账号注销影响,实现学校教学资产永久沉淀;
  4. 批量导入工具支持存量历史 PPT、老旧教案一键上传,AI 自动转换为标准化互动课件入库。

5.3 校内积分流通独立规则引擎

独立计算引擎,管理后台可视化配置全部积分规则:

  • 原创课件审核通过自动发放创作积分;
  • 下载复用他人认证课件扣除对应积分;
  • 定时统计积分排行榜,同步至全校数据可视化看板。

六、校级管控后台:组织级运维与全链路审计体系

面向学校信息中心、教研主任设计,全操作日志本地持久留存,满足教育审计要求。

6.1 用户分级权限管理模块

  1. 支持账号批量导入、CRUD 接口,按年级、学科、教研组划分用户分组;
  2. 三级权限体系:普通教师、教研组长、系统管理员;
  3. 细粒度权限控制:资源上传审核权限、AI 生成额度、知识库编辑权限、后台全局配置权限;
  4. 账号启用、禁用、权限变更全流程操作日志留痕,支持检索导出。

6.2 LLM 统一代理网关与用量管控

  1. 私有化 LLM 代理网关,统一纳管学校自主录入的各大厂商 API Key,统一转发 AI 调用请求;
  2. 全局 Token 消耗聚合计算引擎,按全校、教研组、教师、学科多维度统计用量;
  3. 预算阈值自定义配置:可为各教研组设置月度 Token 消耗上限,用量临近阈值自动站内消息告警;
  4. 异常调用识别算法:识别短时间高频请求、超大 Token 消耗行为,自动限流拦截,避免 AI 成本失控。

6.3 内容审核管理系统

  1. 待审核资源实时推送列表,支持在线预览课件、一键通过 / 驳回、填写修改意见;
  2. 违规内容标记、低质量资源下架、批量清理接口;
  3. 认证资源星级评定配置,高价值校本资源加权优先展示。

6.4 全链路日志审计模块(校园合规刚需)

所有行为日志本地数据库持久存储,留存周期自定义配置,日志覆盖全场景:

  • AI 课件生成全流程日志(需求原文、中间输出、最终课件内容);
  • 资源上传、下载、复用、入库操作日志;
  • 用户登录、权限变更、积分变动记录;
  • LLM 调用 Token 消耗、模型请求完整记录; 支持按时间、用户、资源类型多条件检索、Excel 批量导出,适配等保、教育数据审计检查。

6.5 可视化数据统计看板

后端定时任务聚合全局业务数据,前端可视化图表展示:

  1. 全校课件总量、认证优质资源、互动实验、配套题库素材总量统计;
  2. 教师创作排行榜、各学科资源产出月度趋势;
  3. LLM 月度消耗曲线、预算使用率、各部门成本排行;
  4. 校本资源复用次数统计,自动识别校内高价值教学课件。

七、私有化部署安全技术体系(校园场景核心差异化优势)

整套系统容器化打包,部署在校内物理服务器、校园私有云,全程数据不流出内网,核心安全技术点:

  1. 全链路内网物理隔离 无对外公网第三方依赖,课件、知识库、AI 调用日志、模型密钥全部存储校内存储设备,不跨公网传输,从底层杜绝校外数据泄露风险。
  2. 传输 + 存储双层加密机制 内网接口统一 HTTPS 加密传输;数据库敏感字段(模型 API 密钥、审计日志关键信息)AES 对称加密存储,即使数据库文件泄露也无法解密核心敏感信息。
  3. 模型资源完全自主管控 平台不托管、不截留学校大模型密钥,仅作为代理网关转发请求;学校可自主新增、删除、切换任意大模型厂商 API,完全自主掌控 AI 算力与成本。
  4. 本地定时自动备份机制 内置定时备份脚本,全量数据库、课件对象存储自动打包备份,支持校内异地备份节点,防止硬件故障丢失教学资产。
  5. 适配合规标准:《教育数据安全管理办法》、未成年人个人信息保护规范、网络安全等级保护 2.0。

八、标准化课件生成完整业务技术流转

  1. 需求输入阶段:前端上传教学素材 / 自然语言描述,解析模块输出结构化需求 JSON;
  2. 知识库匹配阶段:检索 Agent 拉取校内匹配知识点、配套课件素材;
  3. 大纲生成阶段:大纲 Agent 输出树形课程框架,教师前端手动调整并确认;
  4. 并行生成阶段:多页面 Agent 异步批量生成课件图文、基础教学素材;
  5. 交互组件注入阶段:交互 Agent 根据学科标签生成仿真、试题、动画配置数据;
  6. 内容自动校验阶段:审查 Agent 检测知识点、学段、版权问题,标记异常内容;
  7. 人工精细化编辑阶段:教师单页 AI 定向调优、拖拽排版、调整交互组件;
  8. 双分支交付流程
    • 分支 A:导出离线 HTML 课件,直接用于教室多媒体课堂投影;
    • 分支 B:提交校本资源库,触发 AI 复审、教研人工审核、积分发放、向量索引重建流程。

九、多场景落地技术适配方案

  1. 公办中小学 私有化内网隔离部署、全量日志审计、校级统一知识库、分级教师权限体系,完整满足教育局数据合规检查;支持多年级、多教研组资源互通共享。
  2. 民办院校 / 连锁教培机构 多校区配置同步能力、分校区独立 AI 预算管控、标准化课程批量生成接口,快速统一全校区教学内容标准,降低新教师培训成本。
  3. 区县教研院所 批量课件生成开放接口、区域知识库导入导出、统一教研成果归档,支撑区域教育均衡数字化建设。
  4. 职业院校 / 企业内部培训 实训仿真组件批量生成、内部培训私有知识库、部门独立 AI 用量预算管控,适配技能类实训课程生产。

十、总结与行业落地展望

当前市面上绝大多数 AI 备课产品仅停留在前端交互与单层 LLM 接口封装层面,缺少面向学校、机构组织级的底层架构设计,无法解决教学资产沉淀、校内数据合规、全局统一管控三大工程核心问题。

本文介绍的私有化多智能体 AI 备课平台,以 LangGraph 多智能体调度引擎为底层核心,搭配自研交互式课件渲染引擎、结构化向量校本知识库、全链路审计管理后台与内网私有化安全架构,完整覆盖教师课件创作、校级统一管控、数据安全隔离、教学资产沉淀全流程技术需求。

对于教育信息化研发团队、学校信息中心选型、ToB 教育产品架构工程师而言,私有化内网部署、多智能体流水线生成、结构化向量知识底座将是未来校内 AI 教研系统三大核心技术发展方向,能够在满足政策合规硬性约束的前提下,规模化落地 AI 赋能全校教研生产。

产品后续迭代技术方向

  1. 新增多人在线协同备课编辑模块;
  2. 对接校园统一身份认证(LDAP / 校园单点登录);
  3. 支持本地私有化大模型对接,完全断网离线运行 AI 能力;
  4. 拓展学情数据联动分析模块,根据班级学情自动生成分层课件。