下面提供从 0 到 1 的完整流程,包含豆包 API 申请、MiGPT 部署、配置与使用,确保你能顺利让小爱音箱 Pro 用上豆包的强大能力。
一、准备工作(必做)

二、申请豆包 API 密钥(关键步骤)
豆包 API 需通过火山引擎方舟平台申请,以下是详细步骤:
1. 注册与实名认证
- 访问火山引擎官网:https://www.volcengine.com/
- 注册账号并完成实名认证(个人 / 企业均可)
- 登录后进入方舟大模型平台
2. 创建 API 密钥与推理接入点
- 进入控制台 → API 密钥管理 → 点击 "创建密钥",保存Access Key ID 和Secret Access Key
- 进入在线推理 → 创建推理接入点 :
- 名称:自定义(如 "小爱音箱豆包")
- 模型选择:豆包系列(推荐 Doubao-seed-1.6-flash,响应快)
- 地域:选择cn-beijing(国内延迟低)
- 等待状态变为 "运行中",记录接入点 ID(格式:ep-xxxxxxxxxxxxxx)
三、部署 MiGPT(推荐 Docker 方式,零门槛)
1. 安装 Docker
- Windows/macOS:下载Docker Desktop并安装
- Linux:执行
sudo apt-get install docker.io(Ubuntu)
1.1、安装前必做:检查前置条件(避免安装失败)
Docker Desktop 在 Windows 上依赖WSL2(适用于 Linux 的 Windows 子系统),必须先满足以下条件:
| 检查项 | 要求 | 验证方法 |
|---|---|---|
| 系统版本 | Win10 64 位(Build 19044+)/ Win11 | 按下Win+R输入winver,查看版本号 |
| 硬件虚拟化 | 已开启(CPU 支持 VT-x/AMD-V) | 一般默认开启,若报错需进 BIOS 开启(品牌机按 F2/Del 进入) |
步骤 1:开启 WSL2(核心依赖,必做)
-
按下
Win+X,选择「Windows 终端(管理员)」(注意必须是管理员权限); -
执行以下命令,一键开启 WSL2 和虚拟机平台:
wsl --install -
命令执行后会提示「需要重启电脑」,点击「重启」(重启后会自动下载 Ubuntu 子系统,无需手动操作);
-
重启后等待 Ubuntu 子系统安装完成(首次开机可能会弹窗设置 Ubuntu 用户名 / 密码,随便设置即可,不影响 Docker 使用);
-
验证 WSL2 是否安装成功:重新打开终端,执行:
wsl --list --verbose✅ 正常输出:能看到「Ubuntu」且「VERSION」列显示「2」(不是 1)。
1.2、下载并安装 Docker Desktop
步骤 1:下载安装包
- 访问 Docker 官方下载页:https://www.docker.com/products/docker-desktop/
- 点击「Download for Windows」,下载安装包(约 500MB,耐心等待);
步骤 2:安装 Docker(关键选项别错)
- 双击下载的
Docker Desktop Installer.exe,开始安装; - 安装界面勾选以下选项(重中之重 ):
- ✅ Use WSL 2 instead of Hyper-V(优先用 WSL2,避免 Hyper-V 冲突);
- ✅ Add shortcut to desktop(桌面创建快捷方式,方便后续打开);
- 点击「OK」开始安装,等待 2-5 分钟(安装过程会自动配置环境变量);
- 安装完成后,勾选「Start Docker Desktop」,点击「Finish」。
步骤 3:首次启动 Docker
- 启动后会弹出「Service Agreement」(服务协议),点击「Accept」;
- 等待 Docker 初始化(桌面右下角会出现「鲸鱼图标」,图标无红色叉号 即正常);
- 首次启动可能会提示「WSL2 is not installed」,说明之前 WSL2 没装成功,回到第一步重新执行
wsl --install。
- 首次启动可能会提示「WSL2 is not installed」,说明之前 WSL2 没装成功,回到第一步重新执行
1.3、验证 Docker 是否安装并正常运行(三步必查)
安装完成后,按以下步骤验证,全部通过即说明安装 OK:
步骤 1:检查 Docker 版本
打开「Windows 终端」(普通权限即可),执行:
docker --version
✅ 正常输出示例(版本号可能不同):
Docker version 25.0.3, build 4debf41
❌ 异常:提示「'docker' 不是内部或外部命令」→ 重启电脑(让环境变量生效),或重新安装 Docker。
步骤 2:检查 Docker 服务状态
- 看桌面右下角的「鲸鱼图标」:
- 右键图标 → 选择「Settings」能正常打开 → 服务运行中;
- 若图标有红色叉号 → 右键选择「Restart Docker」重启。
步骤 3:运行测试容器(最终验证)
执行 Docker 官方的「hello-world」测试容器,这是最权威的验证方式:
docker run hello-world
✅ 正常输出(关键看最后一行):
Hello from Docker!
This message shows that your installation appears to be working correctly.
❌ 异常:提示「pull access denied」→ 网络问题,后续配置国内镜像源即可
2. 创建配置文件
在电脑上新建migpt文件夹,创建以下两个文件:
(1).migpt.js(小爱音箱配置)
module.exports = {
speaker: {
userId: "你的小米账号", // 必须修改
password: "你的小米密码", // 必须修改
did: "小爱音箱Pro", // 必须与米家App设备名称一致
ttsCommand: [5, 1], // 小爱音箱Pro专用参数,不可改
wakeUpCommand: [5, 3], // 小爱音箱Pro专用参数,不可改
monitorCommand: [3, 1, 1], // 小爱音箱Pro专用参数,不可改
callAIKeywords: ["豆包", "请", "你"] // 触发豆包AI的关键词
}
}
(2).env(豆包 API 配置)
# 豆包配置
DOUBAO_API_KEY=你的Access Key ID:Secret Access Key # 格式如AK:SK
DOUBAO_MODEL=接入点ID # 如ep-xxxxxxxxxxxxxx
DOUBAO_BASE_URL=https://ark.cn-beijing.volces.com/api/v3 # 固定值
DOUBAO_REGION=cn-beijing # 与接入点地域一致
# 其他设置(可选)
BOT_NAME=豆包 # 回答时的称呼
TTS_TYPE=xiaomi # 使用小爱原生TTS,也可改为doubao使用豆包音色
3. 启动 MiGPT 服务
打开终端 / 命令提示符,执行以下命令(替换本地路径):
docker run -d \
-v /本地migpt文件夹路径:/app/config \
-p 3000:3000 \
--name mi-gpt \
idootop/mi-gpt:latest
具体如下: 
查看所有容器:
4. 验证部署
- 访问http://localhost:3000,看到 MiGPT 界面即部署成功
- 检查日志:
docker logs mi-gpt,无报错即可使用
四、使用豆包 AI 功能(超简单)
1. 基础使用
- 对小爱音箱说:" 小爱同学,豆包,什么是人工智能?"(关键词触发)
- 或:" 小爱同学,请帮我写一首关于春天的诗 "
- MiGPT 会自动拦截问题,调用豆包生成回答,通过音箱播报
2. 高级玩法
| 功能 | 语音指令示例 |
|---|---|
| 连续对话 | "小爱同学,豆包,开启连续对话",之后可直接提问 |
| 角色设定 | "小爱同学,豆包,你现在是小学数学老师,帮我辅导孩子作业" |
| 内容生成 | "小爱同学,豆包,写一篇关于超级跑车的作文"(适合孩子兴趣) |
| 知识问答 | "小爱同学,豆包,解释一下相对论" |
五、常见问题与解决方案(避坑指南)
| 问题 | 原因 | 解决方法 |
|---|---|---|
| MiGPT 无法连接音箱 | 小米账号两步验证开启 / 密码错误 | 关闭两步验证;确认账号密码正确;设备名称与米家 App 一致 |
| 豆包回答延迟高 | 网络差 / 模型选择不当 | 切换国内模型(如 Doubao-seed-1.6-flash);优化网络 |
| 语音播报异常 | TTS 参数错误 | 确认 ttsCommand 为 [5,1](小爱音箱 Pro 专用) |
| API 调用失败 | 密钥错误 / 接入点未运行 | 检查 API 密钥与接入点 ID;确认接入点状态为 "运行中" |
| 部分问题不触发豆包 | 关键词未匹配 | 修改.callAIKeywords,添加常用触发词(如 "帮我"、"解释") |
六、两种接入方式对比(官方 vs 豆包)
| 对比项 | 官方内置大模型 | 豆包 AI(MiGPT) |
|---|---|---|
| 功能 | 基础问答、内容生成 | 全功能豆包,支持连续对话、角色设定、多轮记忆 |
| 响应速度 | 快(本地模型) | 中(网络调用,国内模型约 1-3 秒) |
| 定制化 | 有限 | 高度自定义(角色、回答风格、关键词) |
| 适合场景 | 普通用户、便捷使用 | 技术爱好者、有孩子家庭(可定制教育角色) |
