22.从0到1搭建AI运营助手——最小可运行版本(v1)

AI 运营助手将从 v1-v3 演进,项目 git 地址:ai-ops-assistant-lab

🧠 一、为什么需要v1?

在前两篇我们讲了:

但有一个关键问题:

❗ 如果不能跑起来,那一切架构都是"纸上设计"

所以 v1 的目标非常明确:

👉 先跑通一条最小链路:自然语言 → SQL → 数据 → 报告


💥 二、v1的核心目标(非常重要)

🎯 v1只做一件事:

text 复制代码
用户问题 → SQL → mock数据 → 分析 → 输出报告

❌ 不做:

  • 不做语义层
  • 不做多Agent协作
  • 不做SQL优化
  • 不接Doris(先mock)

✅ 只做:

👉 一个"能跑通闭环的AI分析系统"


🧩 三、v1整体架构


text 复制代码
用户输入
   ↓
Query Agent(理解问题)
   ↓
SQL Agent(生成SQL)
   ↓
Mock Data Service
   ↓
Analysis Agent(分析)
   ↓
Report Agent(输出Markdown)

🧠 四、v1系统本质

💥 一句话总结:

👉 v1是一个"AI驱动的SQL查询 + 报告生成系统"


🧩 五、技术栈(v1)

🐍 Python

  • camel-ai(Agent能力)
  • 简单函数编排

📦 数据层

  • mock data(字典/CSV)

🧠 LLM

  • OpenAI / Claude / 本地模型(通过LangChain或API)

🧠 六、核心模块设计

🟢 1️⃣ Query Agent(问题理解)

🎯 输入:

text 复制代码
最近7天用户流失情况如何?

🎯 输出:

json 复制代码
{
  "intent": "churn_analysis",
  "time_range": "7d"
}

🟡 2️⃣ SQL Agent(核心)

🎯 输入:

json 复制代码
{
  "intent": "churn_analysis"
}

🎯 输出:

sql 复制代码
SELECT COUNT(DISTINCT user_id)
FROM user_table
WHERE last_active >= NOW() - INTERVAL 7 DAY

🔵 3️⃣ Mock Data Service

🎯 职责:

模拟 Doris / MySQL 查询

python 复制代码
def query(sql):
    return {
        "active_users": 1234,
        "churn_users": 321
    }

🟣 4️⃣ Analysis Agent

🎯 输入:

json 复制代码
{
  "active_users": 1234,
  "churn_users": 321
}

🎯 输出:

text 复制代码
最近7天用户活跃数为1234,流失321人,流失率约20%。

⚫ 5️⃣ Report Agent

🎯 输出:

Markdown报告

markdown 复制代码
# 用户流失分析报告

## 核心指标
- 活跃用户:1234
- 流失用户:321

## 结论
流失率较高,建议优化用户留存策略。

🧠 七、完整执行链路(必须理解)

text 复制代码
User Input
   ↓
Query Agent
   ↓
SQL Agent
   ↓
Mock Data
   ↓
Analysis Agent
   ↓
Report Agent

🧠 八、Prompt设计(v1核心)

🟢 Query Prompt

text 复制代码
你是一个数据分析助手,请识别用户问题中的业务意图和时间范围。

🟡 SQL Prompt

text 复制代码
请根据用户意图生成SQL查询语句,只允许使用以下字段:
- user_id
- last_active
- order_count

🔵 Analysis Prompt

text 复制代码
请根据数据结果生成业务分析结论,语言简洁清晰。

🧠 九、main.py(v1核心入口)

💥 示例结构:

python 复制代码
def run():
    question = "最近7天用户流失情况如何?"

    intent = query_agent(question)
    sql = sql_agent(intent)
    data = mock_query(sql)
    analysis = analysis_agent(data)
    report = report_agent(analysis)

    print(report)

🧠 十、v1的意义(非常重要)

💥 v1解决的问题:

👉 验证AI运营助手的"最小闭环可行性"

💥 v1没有解决的问题:

  • 没有语义层
  • 没有真实数据
  • 没有SQL优化
  • 没有Agent协作

🧠 十一、v1的本质

💥 一句话总结:

👉 v1本质是一个"LLM驱动的轻量数据分析流水线",用于验证自然语言到数据分析的可行性。


🧠 十二、v1 → v2 → v3的演进意义(埋伏笔)

🟢 v1:

👉 能跑通流程

🟡 v2:

👉 接入真实数据系统(Doris)

🔴 v3:

👉 引入语义层(核心升级)


🚀 下一篇预告

👉 Multi-Agent不是聊天:如何拆分Data / Strategy / Report Agent

相关推荐
飞Link5 小时前
iOS 27 开启“AI 开放时代”:Siri 驱动可更换背后的技术范式迁移
人工智能·ios
AllData公司负责人5 小时前
通过Postgresql同步到Doris,全视角演示AllData数据中台核心功能效果,涵盖:数据入湖仓,数据同步,数据处理,数据服务,BI可视化驾驶舱
java·大数据·数据库·数据仓库·人工智能·python·postgresql
飞Link5 小时前
GPT-5.5 Instant 震撼发布:Realtime-2 API 如何重新定义多模态交互?
人工智能·gpt·microsoft·交互·语音识别
飞Link5 小时前
具身智能港亮相深圳:从“大脑”到“身体”,开启人形机器人产业新纪元
人工智能·机器人
IT谢彪5 小时前
记录Dify 安装与使用过程
人工智能
飞Link5 小时前
AI 与能源的双向奔赴:深度解读 2026《双向赋能》行动方案
人工智能·能源
机器之心5 小时前
这样问DeepSeek,能「偷」到数据?
人工智能·openai
桃花键神6 小时前
Bright Data Web Scraping指南 2026: 使用 MCP + Dify 自动采集海外社交媒体数据
大数据·前端·人工智能
岁月标记6 小时前
RLHF 基于人类反馈的强化学习简介
人工智能
Ian在掘金6 小时前
从零实现一个 PDF 智能问答系统
人工智能·langchain