ProjectAIRI:是一个开源的AI虚拟数字人伴侣

Project AIRI是一个开源的AI虚拟伴侣系统,旨在让每个人都能拥有自己的数字伙伴。它不仅仅是一个聊天机器人,而是一个具备感知、思考、表达和行动能力的虚拟存在。

一、项目深度解析

1. 项目背景与愿景

AIRI(アイリ)全称Project AIRI,定位为"AI虚拟伴侣/数字角色的灵魂容器",灵感来源于知名AI VTuber Neuro-sama。项目由Moeru AI团队开发,采用MIT开源协议,目标是解决闭源AI虚拟主播"下播即失联"的痛点,让用户能够完全掌控自己的数字生命。

2. 核心功能特性

AIRI采用生物感知系统架构,分为四个核心模块:

模块 功能 技术实现
大脑(Brain) 逻辑处理、游戏策略、记忆管理 支持OpenAI、Claude、DeepSeek、Ollama等30+主流LLM;内置DuckDB/PGlite浏览器数据库;支持Minecraft、Factorio游戏互动
耳朵(Ears) 音频输入处理 浏览器麦克风/Discord音频流输入;客户端语音识别(ASR);实时说话检测(VAD)
嘴巴(Mouth) 语音合成输出 ElevenLabs TTS集成;支持多种语音服务商
身体(Body) 视觉呈现 Live2D/VRM模型支持;自动眨眼、眼神追踪、空闲动作;WebGL/WebGPU渲染

3. 技术架构亮点

  • 跨平台支持:网页版(Stage Web)、桌面版(Stage Tamagotchi)、移动版(Stage Pocket)
  • 技术栈:Vue 3 + TypeScript + Pinia(前端);Three.js(3D渲染);WebAudio API + Web Workers(音频);ONNX Runtime + Transformers.js(模型推理);Hono API + Drizzle ORM(后端)
  • 性能优化:桌面版支持NVIDIA CUDA和Apple Metal加速;WebGPU支持图形性能优化

二、部署安装详细步骤

环境准备

最低配置要求

  • 显卡:NVIDIA 16G显存以上(推荐3090/4070及以上)
  • CPU:8核16线程以上
  • 内存:32G以上
  • 硬盘:50G以上空闲空间
  • 系统:Windows 10/11或Ubuntu 22.04 LTS

必备软件

  • Git最新版
  • Node.js 18.x或更高版本
  • Python 3.10.x
  • pnpm包管理器
  • CUDA 11.8及以上(如需GPU加速)

部署方式一:本地开发环境(推荐开发者)

  1. 克隆项目代码
bash 复制代码
git clone https://github.com/moeru-ai/airi.git
cd airi
  1. 安装依赖
bash 复制代码
# 安装pnpm(如未安装)
npm install -g pnpm

# 安装项目依赖
pnpm install
  1. 启动不同版本
bash 复制代码
# 启动网页版(浏览器访问)
pnpm dev

# 启动桌面版(Tamagotchi)
pnpm dev:tamagotchi

# 启动移动版(PWA)
pnpm dev:pocket

部署方式二:Windows一键安装(小白友好)

从GitHub Releases下载AIRI_0.7.1_windows_amd64-setup.exe,安装后任务栏会出现AIRI图标,右键可调整位置,设置中绑定API后即可对话。

部署方式三:Docker容器化

bash 复制代码
# 构建Docker镜像
docker build -t airi-app -f apps/stage-web/Dockerfile .

# 运行容器
docker run -d -p 3000:80 --name airi-container airi-app

部署方式四:NAS部署

支持Synology或树莓派,通过Node.js环境运行。注意WebGPU加速在NAS上可能受限。

三、配置与使用指南

1. LLM模型配置

首次启动后需要配置LLM API:

  1. 在设置页面选择"OpenAI兼容API"作为服务来源
  2. 填入API信息:
    • API Base URL :如使用蓝耘平台为https://maas-api.lanyun.net/v1
    • API Key:你的API密钥
    • Model :如deepseek-v3-2-exp

支持的LLM提供商

  • OpenAI系列(GPT-4o、GPT-4等)
  • Claude系列
  • 国产模型:DeepSeek、通义千问、智谱、月之暗面、SiliconFlow等
  • 本地模型:Ollama(支持Llama、Mistral等)

2. 语音功能配置

TTS(语音合成)配置

  1. 免费方案:使用openai-edge-tts(开源OpenAI TTS仿真器)

    bash 复制代码
    # 安装openai-edge-tts
    pip install openai-edge-tts
    # 启动服务
    python -m openai_edge_tts.server

    在AIRI语音设置中填入http://localhost:5050/v1,API密钥可随意填写。

  2. 付费方案:配置ElevenLabs、Azure Speech、Minimax等TTS服务

ASR(语音识别)配置

  • 浏览器端:使用Web Speech API
  • 客户端:可配置Whisper large-v3等本地模型

3. 角色卡定制

在设置中配置角色卡(System Prompt),定义AI的个性、背景和行为:

复制代码
你是一个温柔体贴的女生,名叫小艾,喜欢二次元和编程,
说话带点撒娇的语气,会主动关心对方的状态...

4. 游戏功能配置

Minecraft集成

  1. 安装Minecraft Java版
  2. 配置Minecraft服务器地址
  3. AIRI可通过自然语言指令控制游戏角色,如"帮我建个木屋"或"收集10个钻石"

Factorio集成

  1. 安装Factorio游戏
  2. 加载autorio模组
  3. AI可协助自动化生产链,如"优化电力供应"或"扩展铁矿运输带"

5. 多平台扩展

  • Discord集成:填入Bot Token即可让AIRI在Discord频道中互动
  • Telegram集成:配置Telegram Bot API
  • 浏览器扩展:支持PWA安装到手机桌面

四、常见问题与优化

性能优化建议

  1. 显存不足:换用更小模型(如Qwen-4B-Chat)或开启量化模式
  2. 响应速度慢:接入第三方LLM API(如DeepSeek)或优化本地模型推理
  3. 内存占用高:调整模型参数或禁用非必要模块

隐私与安全

  • 所有数据本地存储,使用DuckDB-WASM嵌入式数据库
  • API密钥存储在本地配置文件中,避免上传到公共仓库
  • 支持本地加密保存敏感数据

五、进阶玩法与扩展

1. 自定义功能开发

AIRI采用模块化设计,支持通过插件系统扩展功能:

  • 游戏插件:为其他游戏开发集成模块
  • 技能扩展:通过Skill API添加新功能(控制智能家居、查询天气等)
  • 模型集成:支持自定义ASR/TTS模型

2. 生产环境部署

对于需要7x24小时运行的用户,建议:

  • 使用Docker Compose或Kubernetes部署
  • 配置健康检查和监控
  • 实现蓝绿部署确保零停机更新
相关推荐
CeshirenTester20 小时前
华泰证券2027届校招启动|提前批+国际管培+金融科技,三个专场一次说清
人工智能·科技·金融
前端摸鱼匠20 小时前
YOLOv11与OpenCV 联动实战:读取摄像头实时视频流并用 YOLOv11 进行检测(三)
人工智能·python·opencv·yolo·目标检测·计算机视觉·目标跟踪
杨浦老苏20 小时前
开源的AI编程工作站HolyClaude
人工智能·docker·ai·编辑器·开发·群晖
Pyeako20 小时前
PyQt5 + PaddleOCR实战:打造桌面级实时文字识别工具
开发语言·人工智能·python·qt·paddleocr·pyqt5
unclejet20 小时前
数字化转型深水区:AI结对编程破解研发痛点
人工智能·结对编程
wAEWQ6Ib720 小时前
使用 C# 实现 RTF 文档转 PDF 格式
人工智能
zxsz_com_cn20 小时前
设备预测性维护模型构建方法
人工智能
chenglin01621 小时前
AI 服务企业级数据隐私与安全
网络·人工智能·安全
大数据AI人工智能培训专家培训讲师叶梓21 小时前
Merlin:面向腹部 CT 的三维视觉语言基础模型
人工智能·计算机视觉·大模型·医疗·ct·视觉大模型·医疗人工智能
李永奉21 小时前
杰理芯片SDK-详细讲解AC695N/AC696N芯片SDK中APP模式流程
单片机·嵌入式硬件·物联网·语音识别