ProjectAIRI：是一个开源的AI虚拟数字人伴侣

Project AIRI是一个开源的AI虚拟伴侣系统，旨在让每个人都能拥有自己的数字伙伴。它不仅仅是一个聊天机器人，而是一个具备感知、思考、表达和行动能力的虚拟存在。

一、项目深度解析

1. 项目背景与愿景

AIRI（アイリ）全称Project AIRI，定位为"AI虚拟伴侣/数字角色的灵魂容器"，灵感来源于知名AI VTuber Neuro-sama。项目由Moeru AI团队开发，采用MIT开源协议，目标是解决闭源AI虚拟主播"下播即失联"的痛点，让用户能够完全掌控自己的数字生命。

2. 核心功能特性

AIRI采用生物感知系统架构，分为四个核心模块：

模块	功能	技术实现
大脑（Brain）	逻辑处理、游戏策略、记忆管理	支持OpenAI、Claude、DeepSeek、Ollama等30+主流LLM；内置DuckDB/PGlite浏览器数据库；支持Minecraft、Factorio游戏互动
耳朵（Ears）	音频输入处理	浏览器麦克风/Discord音频流输入；客户端语音识别（ASR）；实时说话检测（VAD）
嘴巴（Mouth）	语音合成输出	ElevenLabs TTS集成；支持多种语音服务商
身体（Body）	视觉呈现	Live2D/VRM模型支持；自动眨眼、眼神追踪、空闲动作；WebGL/WebGPU渲染

3. 技术架构亮点

跨平台支持：网页版（Stage Web）、桌面版（Stage Tamagotchi）、移动版（Stage Pocket）
技术栈：Vue 3 + TypeScript + Pinia（前端）；Three.js（3D渲染）；WebAudio API + Web Workers（音频）；ONNX Runtime + Transformers.js（模型推理）；Hono API + Drizzle ORM（后端）
性能优化：桌面版支持NVIDIA CUDA和Apple Metal加速；WebGPU支持图形性能优化

二、部署安装详细步骤

环境准备

最低配置要求：

显卡：NVIDIA 16G显存以上（推荐3090/4070及以上）
CPU：8核16线程以上
内存：32G以上
硬盘：50G以上空闲空间
系统：Windows 10/11或Ubuntu 22.04 LTS

必备软件：

Git最新版
Node.js 18.x或更高版本
Python 3.10.x
pnpm包管理器
CUDA 11.8及以上（如需GPU加速）

部署方式一：本地开发环境（推荐开发者）

克隆项目代码

bash 复制代码

git clone https://github.com/moeru-ai/airi.git
cd airi

安装依赖

bash 复制代码

# 安装pnpm（如未安装）
npm install -g pnpm

# 安装项目依赖
pnpm install

启动不同版本

bash 复制代码

# 启动网页版（浏览器访问）
pnpm dev

# 启动桌面版（Tamagotchi）
pnpm dev:tamagotchi

# 启动移动版（PWA）
pnpm dev:pocket

部署方式二：Windows一键安装（小白友好）

从GitHub Releases下载AIRI_0.7.1_windows_amd64-setup.exe，安装后任务栏会出现AIRI图标，右键可调整位置，设置中绑定API后即可对话。

部署方式三：Docker容器化

bash 复制代码

# 构建Docker镜像
docker build -t airi-app -f apps/stage-web/Dockerfile .

# 运行容器
docker run -d -p 3000:80 --name airi-container airi-app

部署方式四：NAS部署

支持Synology或树莓派，通过Node.js环境运行。注意WebGPU加速在NAS上可能受限。

三、配置与使用指南

1. LLM模型配置

首次启动后需要配置LLM API：

在设置页面选择"OpenAI兼容API"作为服务来源
填入API信息：
- API Base URL ：如使用蓝耘平台为https://maas-api.lanyun.net/v1
- API Key：你的API密钥
- Model ：如deepseek-v3-2-exp

支持的LLM提供商：

OpenAI系列（GPT-4o、GPT-4等）
Claude系列
国产模型：DeepSeek、通义千问、智谱、月之暗面、SiliconFlow等
本地模型：Ollama（支持Llama、Mistral等）

2. 语音功能配置

TTS（语音合成）配置：

免费方案：使用openai-edge-tts（开源OpenAI TTS仿真器）
bash 复制代码
```
# 安装openai-edge-tts
pip install openai-edge-tts
# 启动服务
python -m openai_edge_tts.server
```
在AIRI语音设置中填入http://localhost:5050/v1，API密钥可随意填写。
付费方案：配置ElevenLabs、Azure Speech、Minimax等TTS服务

ASR（语音识别）配置：

浏览器端：使用Web Speech API
客户端：可配置Whisper large-v3等本地模型

3. 角色卡定制

在设置中配置角色卡（System Prompt），定义AI的个性、背景和行为：

复制代码

你是一个温柔体贴的女生，名叫小艾，喜欢二次元和编程，
说话带点撒娇的语气，会主动关心对方的状态...

4. 游戏功能配置

Minecraft集成：

安装Minecraft Java版
配置Minecraft服务器地址
AIRI可通过自然语言指令控制游戏角色，如"帮我建个木屋"或"收集10个钻石"

Factorio集成：

安装Factorio游戏
加载autorio模组
AI可协助自动化生产链，如"优化电力供应"或"扩展铁矿运输带"

5. 多平台扩展

Discord集成：填入Bot Token即可让AIRI在Discord频道中互动
Telegram集成：配置Telegram Bot API
浏览器扩展：支持PWA安装到手机桌面

四、常见问题与优化

性能优化建议

显存不足：换用更小模型（如Qwen-4B-Chat）或开启量化模式
响应速度慢：接入第三方LLM API（如DeepSeek）或优化本地模型推理
内存占用高：调整模型参数或禁用非必要模块

隐私与安全

所有数据本地存储，使用DuckDB-WASM嵌入式数据库
API密钥存储在本地配置文件中，避免上传到公共仓库
支持本地加密保存敏感数据

五、进阶玩法与扩展

1. 自定义功能开发

AIRI采用模块化设计，支持通过插件系统扩展功能：

游戏插件：为其他游戏开发集成模块
技能扩展：通过Skill API添加新功能（控制智能家居、查询天气等）
模型集成：支持自定义ASR/TTS模型

2. 生产环境部署

对于需要7x24小时运行的用户，建议：

使用Docker Compose或Kubernetes部署
配置健康检查和监控
实现蓝绿部署确保零停机更新