
Project AIRI是一个开源的AI虚拟伴侣系统,旨在让每个人都能拥有自己的数字伙伴。它不仅仅是一个聊天机器人,而是一个具备感知、思考、表达和行动能力的虚拟存在。
一、项目深度解析
1. 项目背景与愿景
AIRI(アイリ)全称Project AIRI,定位为"AI虚拟伴侣/数字角色的灵魂容器",灵感来源于知名AI VTuber Neuro-sama。项目由Moeru AI团队开发,采用MIT开源协议,目标是解决闭源AI虚拟主播"下播即失联"的痛点,让用户能够完全掌控自己的数字生命。
2. 核心功能特性
AIRI采用生物感知系统架构,分为四个核心模块:
| 模块 | 功能 | 技术实现 |
|---|---|---|
| 大脑(Brain) | 逻辑处理、游戏策略、记忆管理 | 支持OpenAI、Claude、DeepSeek、Ollama等30+主流LLM;内置DuckDB/PGlite浏览器数据库;支持Minecraft、Factorio游戏互动 |
| 耳朵(Ears) | 音频输入处理 | 浏览器麦克风/Discord音频流输入;客户端语音识别(ASR);实时说话检测(VAD) |
| 嘴巴(Mouth) | 语音合成输出 | ElevenLabs TTS集成;支持多种语音服务商 |
| 身体(Body) | 视觉呈现 | Live2D/VRM模型支持;自动眨眼、眼神追踪、空闲动作;WebGL/WebGPU渲染 |
3. 技术架构亮点
- 跨平台支持:网页版(Stage Web)、桌面版(Stage Tamagotchi)、移动版(Stage Pocket)
- 技术栈:Vue 3 + TypeScript + Pinia(前端);Three.js(3D渲染);WebAudio API + Web Workers(音频);ONNX Runtime + Transformers.js(模型推理);Hono API + Drizzle ORM(后端)
- 性能优化:桌面版支持NVIDIA CUDA和Apple Metal加速;WebGPU支持图形性能优化
二、部署安装详细步骤
环境准备
最低配置要求:
- 显卡:NVIDIA 16G显存以上(推荐3090/4070及以上)
- CPU:8核16线程以上
- 内存:32G以上
- 硬盘:50G以上空闲空间
- 系统:Windows 10/11或Ubuntu 22.04 LTS
必备软件:
- Git最新版
- Node.js 18.x或更高版本
- Python 3.10.x
- pnpm包管理器
- CUDA 11.8及以上(如需GPU加速)
部署方式一:本地开发环境(推荐开发者)
- 克隆项目代码
bash
git clone https://github.com/moeru-ai/airi.git
cd airi
- 安装依赖
bash
# 安装pnpm(如未安装)
npm install -g pnpm
# 安装项目依赖
pnpm install
- 启动不同版本
bash
# 启动网页版(浏览器访问)
pnpm dev
# 启动桌面版(Tamagotchi)
pnpm dev:tamagotchi
# 启动移动版(PWA)
pnpm dev:pocket
部署方式二:Windows一键安装(小白友好)
从GitHub Releases下载AIRI_0.7.1_windows_amd64-setup.exe,安装后任务栏会出现AIRI图标,右键可调整位置,设置中绑定API后即可对话。
部署方式三:Docker容器化
bash
# 构建Docker镜像
docker build -t airi-app -f apps/stage-web/Dockerfile .
# 运行容器
docker run -d -p 3000:80 --name airi-container airi-app
部署方式四:NAS部署
支持Synology或树莓派,通过Node.js环境运行。注意WebGPU加速在NAS上可能受限。
三、配置与使用指南
1. LLM模型配置
首次启动后需要配置LLM API:
- 在设置页面选择"OpenAI兼容API"作为服务来源
- 填入API信息:
- API Base URL :如使用蓝耘平台为
https://maas-api.lanyun.net/v1 - API Key:你的API密钥
- Model :如
deepseek-v3-2-exp
- API Base URL :如使用蓝耘平台为
支持的LLM提供商:
- OpenAI系列(GPT-4o、GPT-4等)
- Claude系列
- 国产模型:DeepSeek、通义千问、智谱、月之暗面、SiliconFlow等
- 本地模型:Ollama(支持Llama、Mistral等)
2. 语音功能配置
TTS(语音合成)配置:
-
免费方案:使用openai-edge-tts(开源OpenAI TTS仿真器)
bash# 安装openai-edge-tts pip install openai-edge-tts # 启动服务 python -m openai_edge_tts.server在AIRI语音设置中填入
http://localhost:5050/v1,API密钥可随意填写。 -
付费方案:配置ElevenLabs、Azure Speech、Minimax等TTS服务
ASR(语音识别)配置:
- 浏览器端:使用Web Speech API
- 客户端:可配置Whisper large-v3等本地模型
3. 角色卡定制
在设置中配置角色卡(System Prompt),定义AI的个性、背景和行为:
你是一个温柔体贴的女生,名叫小艾,喜欢二次元和编程,
说话带点撒娇的语气,会主动关心对方的状态...
4. 游戏功能配置
Minecraft集成:
- 安装Minecraft Java版
- 配置Minecraft服务器地址
- AIRI可通过自然语言指令控制游戏角色,如"帮我建个木屋"或"收集10个钻石"
Factorio集成:
- 安装Factorio游戏
- 加载autorio模组
- AI可协助自动化生产链,如"优化电力供应"或"扩展铁矿运输带"
5. 多平台扩展
- Discord集成:填入Bot Token即可让AIRI在Discord频道中互动
- Telegram集成:配置Telegram Bot API
- 浏览器扩展:支持PWA安装到手机桌面
四、常见问题与优化
性能优化建议
- 显存不足:换用更小模型(如Qwen-4B-Chat)或开启量化模式
- 响应速度慢:接入第三方LLM API(如DeepSeek)或优化本地模型推理
- 内存占用高:调整模型参数或禁用非必要模块
隐私与安全
- 所有数据本地存储,使用DuckDB-WASM嵌入式数据库
- API密钥存储在本地配置文件中,避免上传到公共仓库
- 支持本地加密保存敏感数据
五、进阶玩法与扩展
1. 自定义功能开发
AIRI采用模块化设计,支持通过插件系统扩展功能:
- 游戏插件:为其他游戏开发集成模块
- 技能扩展:通过Skill API添加新功能(控制智能家居、查询天气等)
- 模型集成:支持自定义ASR/TTS模型
2. 生产环境部署
对于需要7x24小时运行的用户,建议:
- 使用Docker Compose或Kubernetes部署
- 配置健康检查和监控
- 实现蓝绿部署确保零停机更新