随着AI技术在企业场景的深度渗透,单一功能的IM聊天机器人已无法满足企业知识沉淀、岗位代班、组织协同的多元化需求。cloneman-ai作为一款"能说能做"的AI数字分身平台,基于主流Java技术栈构建,实现了数字分身的可控化、可追溯与可持续成长,本文将从项目定位、核心架构、技术实现、功能模块及实操部署等方面,对其进行全面技术解析,为开发者提供参考。
一、项目核心信息与定位
1.1 基础信息
项目名称:cloneman-ai(AI数字分身平台)
作者:James-Zou
开源协议:GPL-3.0 License
技术栈:JDK 17、Spring Boot 3.2.0、Spring Web、Spring Data JPA、MySQL 8.0+、Milvus、LangChain4j、OpenAI ChatModel、Apache PDFBox、Apache POI等
后续升级方向:Self-Govern-AI(个体自治AI),项目地址:https://github.com/James-Zou/self-govern-ai
1.2 核心定位
cloneman-ai的核心定位并非单一IM聊天机器人,而是面向企业场景的AI数字分身平台,核心目标是将"人"的知识、表达方式与执行能力结构化,构建可控、可追溯、可持续成长的数字分身系统,实现"能说+能做"的双重能力,具体体现在:
-
知识层面:通过RAG+Prompt Engineering实现自学习、自成长,沉淀企业知识资产;
-
执行层面:通过SkillsBoot与技能导入体系,实现自动化任务执行与流程编排;
-
交互层面:支持IM、手机、电脑、机器人等多载体无感交互,不绑定单一IM平台;
-
场景层面:覆盖企业工作(岗位代班、知识沉淀)与关系延续(陪伴搭子)双场景。
二、核心架构设计与技术实现
cloneman-ai采用分层架构设计,基于Java生态主流技术栈构建,兼顾稳定性、可扩展性与可维护性,以下从架构概览、核心技术选型、关键模块实现三个维度展开解析。
2.1 架构概览
平台整体采用分层架构,自上而下分为交互层、接口层、业务服务层、数据存储层,同时包含独立的合规校验模块与科技感展示模块,架构流程图如下(基于Mermaid实现):
各层核心职责:
-
交互层:提供Web管理台、Skills技能页面、脑机接口展示模块等前端入口,支持中英文国际化切换;
-
接口层:基于Spring Boot API构建,提供分身管理、知识导入、对话交互、IM接入等核心接口;
-
业务服务层:包含Avatar Service(分身管理)、Conversation Service(对话服务)、Prompt Service(提示词服务)、RAG Service(检索增强生成服务)、IM Gateway(IM网关)等核心服务;
-
数据存储层:采用MySQL+Milvus双存储架构,分别承担结构化数据与向量数据的存储与检索;
-
辅助模块:合规校验模块负责授权确认、隐私保护,脑机接口模块负责科技感场景演示。
2.2 核心技术选型解析
结合项目场景需求,技术选型聚焦"稳定性、可扩展性、落地性",核心技术选型及应用场景如下:
-
后端框架:Spring Boot 3.2.0 + Spring Web + Spring Data JPA,提供快速开发能力,简化数据库操作,支持RESTful接口设计;
-
数据库:MySQL 8.0+,用于存储分身主数据、导入审计记录、风格样本、聊天消息等结构化数据,支持事务一致性与分页查询;
-
向量数据库:Milvus,用于存储每个分身的知识向量与语气样本向量,支持高效向量检索,实现精准知识匹配;
-
AI能力:LangChain4j + OpenAI ChatModel,支撑RAG检索增强生成与Prompt工程,实现数字分身的自学习与对话能力;
-
文档处理:Apache PDFBox、Apache POI,用于解析PDF、DOCX、TXT、MD等多格式文档,实现知识自动导入与分片;
-
容错与重试:Resilience4j + Spring Retry,提升系统稳定性,应对接口调用失败、数据查询异常等场景;
-
IM适配:自定义IM Gateway,适配企业微信、钉钉、飞书、Microsoft Teams、Slack等主流IM平台,统一webhook入口与消息路由。
2.3 关键模块技术实现
2.3.1 分身管理模块
该模块是平台核心,负责数字分身的全生命周期管理,关键实现要点:
-
数据建模:基于Spring Data JPA设计AvatarProfile实体类,包含身份ID、性别、身份角色、部门、人格画像等核心字段,支持租户隔离,同租户下分身姓名唯一;
-
授权校验:创建分身前强制校验合法授权,通过前端勾选确认、后端接口校验双重保障,避免未授权数据录入;
-
成长可视化:基于分身资料完整度、知识条目数量、语气样本、互动量,动态计算IQ/EQ分数,通过折线图展示近7天成长趋势,核心计算逻辑结合加权算法,确保分数合理性;
-
状态推测:基于当前日期时间、近7天对话密度、最近一次对话时间,实现心情、活动状态的动态推测,加入状态衰减逻辑,提升拟人化体验。
2.3.2 RAG知识沉淀模块
该模块实现企业知识的自动化导入、向量存储与精准检索,核心流程:
-
文档导入:支持PDF、DOCX、TXT、MD等格式,通过Apache PDFBox、Apache POI解析文档内容,自动分片为短句,避免长文本检索偏差;
-
向量生成:通过LangChain4j结合OpenAI Embedding模型,将分片后的文本转化为向量;
-
双存储持久化:文本原文与向量ID同步存入MySQL,向量数据存入Milvus,按tenantId + employeeId + type自动分collection,实现多分身独立知识库隔离;
-
检索匹配:对话时,通过RAG Service检索Milvus中的相关向量,结合Prompt Engineering生成回复,确保回复来源可控,降低幻觉风险。
2.3.3 IM适配模块
该模块实现多IM平台的统一接入,关键技术点:
-
统一网关设计:基于IM Gateway封装不同IM平台的适配器,提供统一的webhook入口与消息路由逻辑,通过externalBotId反查具体分身;
-
签名校验:针对不同IM平台的校验机制,实现对应的签名校验、AES解密、challenge回包逻辑(如企业微信AES解密、钉钉签名校验、飞书SHA-256校验等);
-
消息分发:接收IM平台的进线消息,路由至对应数字分身处理,处理完成后通过对应IM适配器发送回复,实现无感交互。
2.3.4 合规与隐私保护模块
针对企业级场景,合规性是核心需求,模块实现要点:
-
数据收集约束:明确最小化数据收集原则,导入聊天记录、文档前需确认合法使用权;
-
敏感信息管控:禁止在代码仓库、配置文件中提交真实密钥、数据库密码、个人数据等敏感信息;
-
审计追溯:所有分身操作、知识导入、聊天消息均记录审计日志,支持分页查询,实现责任可追溯;
-
法律提示:内置合规声明与侵权风险提示,明确脑机接口模块仅用于技术演示,不得作为医疗器械或诊断工具。
三、核心功能模块详解
基于上述架构与技术实现,cloneman-ai提供了丰富的可落地功能,覆盖分身管理、知识沉淀、对话交互、后台管理等核心场景,以下重点解析关键功能模块。
3.1 分身管理模块
核心功能包括分身的创建、更新、查询,以及分身详情可视化、技能导入与管理:
-
技能管理:新增独立Skills页面,支持技能的录入、JSON导入导出、目录化管理,分身管理列表支持"条目级导入技能",可从技能库选择技能绑定至具体分身;
-
详情展示:展示分身身份信息、已学习技能及使用成熟度、IQ/EQ分数及趋势、24小时作息时间线、心情与活动状态等;
-
状态管理:支持预览模式与正式代班模式切换,可通过请假、离职等事件触发代班开关,实现岗位无感替换。
3.2 知识与风格学习模块
-
知识导入:支持多格式文档上传,自动完成解析、分片、向量化与存储,支持多分身独立知识库;
-
风格学习:导入聊天记录后,自动提取高频口头禅与表达习惯,同步存入MySQL与Milvus,对话过程中实现增量学习,确保分身语气与用户高度一致。
3.3 对话与双模式运营模块
-
对话能力:基于RAG+Prompt实现可控对话,知识不足时自动拒答,降低幻觉风险;
-
双模式支持:工作模式(请假、离职、轮岗代班)与陪伴模式(饭搭子、聊天搭子等),满足不同场景需求;
-
聊天审计:所有对话消息统一沉淀,支持分页查询,便于企业管理与追溯。
3.4 后台数据管理与科技感展示模块
-
后台管理:提供分身资料、导入记录、聊天消息的分页查询功能,与前端控制台联动,实现全局管控;
-
脑机接口模块:展示数字孪生、思维同步、脑信号可视化、人格仪表盘等概念场景,支持4种情绪脑机接入场景,用于技术演示与研发验证。
四、项目部署与快速启动
4.1 环境准备
-
基础环境:JDK 17、Maven 3.9+;
-
数据存储:MySQL 8.0+、Milvus 2.4+;
-
可选依赖:Docker、Docker Compose(用于一键部署)。
4.2 部署步骤
创建数据库:执行以下SQL语句创建项目数据库,指定字符集与排序规则,确保中文支持:
CREATE DATABASE cloneman_ai DEFAULT CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
配置环境变量:修改配置文件,填写MySQL、OpenAI、Milvus等相关配置,
核心配置示例: MYSQL_URL=jdbc:mysql://localhost:3306/cloneman_ai?useUnicode=true&characterEncoding=utf8&serverTimezone=Asia/Shanghai
&allowPublicKeyRetrieval=true&useSSL=false MYSQL_USERNAME=root MYSQL_PASSWORD=replace-with-real-password OPENAI_API_KEY=
your_openai_key MILVUS_HOST=localhost MILVUS_PORT=19530
启动项目:
手动启动:执行mvn clean package编译项目,再执行mvn spring-boot:run启动应用;
脚本启动:macOS/Linux执行scripts/start.sh,Windows执行scripts\start.bat;
Docker Compose启动:执行docker compose up --build,一键拉起MySQL、Milvus、
应用等所有依赖。
数据库升级(可选):若已有数据库,需新增性别字段,
执行以下SQL: ALTER TABLE avatar_profile ADD COLUMN gender VARCHAR(16) DEFAULT NULL AFTER employee_name;
4.3 页面入口与发布包构建
-
核心页面入口:
-
发布包构建:执行mvn clean package -DskipTests,生成target/cloneman-ai-1.0.0.tar,解压后包含bin(启停脚本)、conf(配置文件)、lib(依赖包)、log(日志目录),修改配置后执行bin/restart.sh即可生效。
五、技术升级方向与路线图
5.1 技术升级:Self-Govern-AI(个体自治AI)
cloneman-ai后续将从当前的RAG+Prompt主线,逐步升级为Self-Govern-AI技术,该技术的核心是构建可持续运行的个体智能架构,而非单纯依赖更大的模型,核心架构包括:
-
身份内核(Identity Kernel):定义使命、价值向量、边界条件与人格先验;
-
记忆织体(Lifelong Memory Fabric):管理情景记忆、语义记忆、置信度与时间衰减;
-
宪法治理层(Constitution + Governor):通过Java内建规则实现准入、评分、否决与解释;
-
自学习循环(Self-Learning Loop):将行为反馈转化为参数/策略更新,支持版本回滚;
-
具身执行层(Embodied Runtime):连接机器人/数字人输入输出与动作执行。
5.2 项目路线图
-
短期(即将上线):生活模式升级,支持声纹、面容、身体特征、社会关系图谱录入,完善拟人化画像;
-
中期:技能执行引擎升级,从前端演示升级为后端可编排、可审计、可回放的技能运行框架;
-
长期:实现多终端承载,将分身能力扩展至手机端、桌面端与机器人终端,构建云边端协同的主权智能体系。
六、总结与展望
cloneman-ai作为一款可落地的AI数字分身平台,基于Java主流技术栈,实现了"能说+能做"的核心需求,通过分层架构设计、双存储模式、多IM适配,兼顾了企业级场景的稳定性、合规性与可扩展性。其核心优势在于将数字分身从"聊天工具"升级为"价值载体",既能够帮助企业沉淀知识资产、提升协同效率,也能够延续人与人之间的情感联结,同时为后续升级为个体自治AI奠定了坚实基础。
对于开发者而言,该项目提供了完整的技术框架与实操案例,涵盖RAG、向量存储、IM适配、合规校验等关键技术点,可作为企业级AI数字分身项目的参考模板。未来,随着Self-Govern-AI技术的落地与多终端适配的完善,cloneman-ai有望在人形机器人、数字人等场景实现更广泛的应用,推动人机协同进入新的阶段。

作者与联系方式
-
Author: James-Zou
-
Contact: 18301545237@163.com
cloneman-ai 通过数字分身实现无感人类替换
