针对销售培训 "理论与实操脱节、新人上手慢、培训效果难量化" 的核心痛点,我们计划在销售 AI 培训智能体中引入互动视频培训模式。但传统视频单向传播、无交互,定制化互动视频又存在开发周期长、复用性差、内容与交互逻辑耦合的问题,导致迭代慢、运维成本高。为此,本文基于 "视频层与交互层分离" 核心架构,结合 JSON 配置化、动态解析、Apollo 配置托管等技术,实现互动视频低代码配置、高复用与高效维护。
传统互动视频的三大瓶颈
-
**交互体验单一:**传统视频采用 "内容输出 - 用户接收" 的单向传播模式,用户只能被动观看,无法参与剧情分支选择、关键信息探索等深度交互;
-
**开发成本高企:**定制化互动视频需针对每个项目重复开发交互逻辑(如按钮渲染、事件绑定、分支跳转),开发周期长、复用性差,无法支撑多场景、高频次的内容生产需求;
-
维护效率低下: 视频内容与交互逻辑深度耦合,一旦需要更新交互节点(如调整按钮位置、新增剧情分支),需重新修改代码并部署发版,迭代响应速度慢,运维成本高。
优化思路:分离架构 + JSON 配置驱动

-
**分层设计:**将视频播放核心(video 层)与交互元素(DOM 层)完全分离,视频层负责基础播放、进度监听,交互层独立承载按钮、动图等交互组件,两者通过时间轴事件联动;
-
**配置驱动:**通过 JSON 文件标准化描述所有交互节点信息(时间区间、样式、事件逻辑),替代硬编码开发;
-
**动态解析:**开发专属引擎,自动解析 JSON 配置,根据视频播放进度动态渲染交互 DOM,绑定点击等事件 ;
-
**云端托管:**视频资源与交互 JSON 配置统一托管于 Apollo 配置中心,支持动态更新,无需前端发版即可完成交互节点的修改与迭代。
互动效果演示

详细实现方案
1. 视频渲染:基于 HTML5 Video 的基础播放能力
采用 HTML5 原生video标签作为视频渲染载体,视频播放地址通过 Apollo 配置动态拉取,无需修改前端代码。

2. 交互区域计算
视频采用object-fit: contain模式,实际展示区域会因屏幕尺寸不同而变化,交互元素需基于视频实际渲染区域计算坐标,而非容器尺寸,核心实现步骤如下:
-
获取视频实际渲染区域 视频实际展示区域的宽高由容器尺寸与视频原始宽高比共同决定,计算得到真实的left、top、width、height;
-
交互层 宽高设置为实际渲染视频区域宽高,通过position定位的方式,覆盖在视频上层,后续解析的JSON都绘制在交互层里。
3. 交互 JSON 配置:标准化交互节点描述
JSON 配置文件是交互逻辑的核心载体,由业务方提供交互需求(如 "00:05-00:10 显示'选择分支A'按钮,点击后跳转至视频 1 分 30 秒位置"),研发同学将其转化为标准化 JSON 格式,包含以下核心字段:
JSON 配置示例:

4. JSON 解析与 DOM 生成:引擎驱动的动态渲染
交互引擎核心模块,负责 JSON 配置解析、DOM 元素生成与事件绑定,流程如下:
-
引擎初始化时,从 Apollo 拉取交互 JSON 配置;
-
遍历 JSON 中的interactiveEvents数组,根据type字段生成对应 DOM 元素;
-
将style字段中的配置转化为内联样式,设置 DOM 元素的位置、尺寸、颜色等;
-
根据click_on字段绑定事件(如jumpTime触发视频跳转到指定时间);
-
初始状态下,所有交互 DOM 设置为display:none,等待视频播放至指定时间触发显示。
5. 视频进度监听与交互触发
通过监听video的timeupdate事件(实时触发,返回当前播放时间currentTime),实现交互元素的精准显示与隐藏:
-
每一次timeupdate触发时,遍历所有交互事件,对比currentTime与事件的start、end;
-
当满足start < currentTime < end,通过eventId找到对应的DOM节点,设置display:block,显示交互元素;
-
触发事件时(如点击分支按钮),引擎控制视频暂停,执行跳转到指定播放时间等逻辑后,自动恢复播放。
6. 播放进度上报与断点续播
为提升用户体验与数据监控能力,增加进度上报与断点续播功能,我们还做了以下优化:
-
每隔 5 秒,通过接口上报当前视频currentTime等信息,存储至后端数据库;
-
用户退出页面后重新进入时,从接口拉取该用户对应视频的最新上报进度;
-
若存在有效进度(如未播放完成),设置video.currentTime,跳转到指定位置开始播放;若已播放完成,则从视频开头重新播放。
项目收益
本文采用 "视频分层 + 配置驱动" 的核心架构,成功破解传统互动视频开发与落地的核心痛点。在配置化驱动模式下,所有交互逻辑均通过 JSON 标准化描述,不仅降低了开发门槛、支持非技术人员直接配置互动节点,还实现了 "无需定制开发、无需版本发布,仅通过配置即可完成互动视频交付" 的高效落地。

目前该互动视频项目已上线并用于业务培训场景,取得了显著成效:
-
培训效率提升约30%,大幅缩短了销售培训周期;
-
新视频互动配置效率提升75%,平均耗时从2人日降至0.5人日;
-
运维成本显著降低,通过配置更新减少90%的前端发版需求;
整体来看,该架构既实现了互动视频培训模式的低成本落地与快速迭代,又通过技术赋能切实解决了业务培训的核心诉求,为销售培训体系的规模化、高效化升级提供了可靠支撑。
作者简介
