支持 DeepSeek、OpenAI、Claude,但数据流向要看清楚
它支持自定义 base_url 和 api_key,这意味着你可以接入任何兼容 OpenAI SDK 接口的服务。如果主要考虑调用成本,DeepSeek Chat 通常更适合作为高频查询的入门配置;如果更看重复杂数据库逻辑的理解能力,可以再对比 GPT-4o 或 Claude 系列。
数据流向与 API 依赖提醒:
虽然项目代码跑在你的本地服务器上,但并不等于"完全断网闭环"。一般情况下,它主要把表结构、字段信息、用户问题和生成 SQL 所需的上下文发送给外部模型 API,而不是直接上传整份原始数据。但不同配置下,是否会携带查询结果摘要,需要以实际运行日志为准。对极其敏感的财务或医疗数据,依然建议先做物理脱敏,或尝试接入本地部署的开源大模型。
和 Metabase、Superset 相比,它更像轻量 AI 查询助手
很多人会把它和传统的 BI 工具比较。先说清楚定位差异:Metabase 和 Superset 是成熟的 BI 平台,适合团队协作、看板共享和细粒度权限管理,但搭建成本和学习曲线摆在那里。
Data-Analysis-Agent 目前更像是一个个人或小团队用的轻量级查询辅助工具,目前还没有可共享的固定看板体系(该功能还在后续规划中)。如果你的需求只是临时查数、生成图表,而不是搭建完整的数据中台,它更适合作为一个轻量级的查数入口。

Data-Analysis-Agent 本地跑起来不难,但仍然需要一点技术基础
Data-Analysis-Agent是个开源项目,对于有 Python 基础的用户,上手难度不算高,可以通过 pip 或直接 clone 仓库运行。
Mac 等本地环境排障提醒:
如果你平时会用 Mac mini、NAS 或内网服务器跑自动化脚本,也可以把它作为一个长期运行的内部查数入口。不过首次运行时,Mac 的安全策略可能会拦截 start.command,需要右键手动选择"打开",或者在终端执行 xattr -d com.apple.quarantine start.command 来解除隔离。
现阶段限制:别把它当成成熟 BI 平台
Data-Analysis-Agent这个工具虽然看着省事,但如果准备把它作为日常核心工具,有几个客观的限制需要提前有个底:
- **准确率依赖模型与表结构:**面对命名极不规范的老旧数据库或复杂的嵌套表,AI 生成的 SQL 还是有几率出现幻觉。最终用于核心决策的数据,依然需要人工复核底层查询逻辑。
- **状态保存较弱:**目前每次分析更像是一次独立会话,生成的图表存在本地目录中,服务重启后之前对话里的链接可能会失效。
- **大规模数据支持还在规划中:**目前更适合中小规模数据集,对 DuckDB 和 Spark 的支持还在官方的开发路线图中。
所以说,Data-Analysis-Agent 不一定适合所有团队直接上生产环境,但它适合拿来验证"自然语言查数据库"这类工作流,看看它在你的数据结构和业务问题里到底能不能省事。
Data-Analysis-Agent 项目地址
**免责声明:**本文基于 GitHub 仓库公开说明整理。私有化部署时,大模型 API 调用依然会产生外部数据交互与调用费用。具体的数据流向边界、隐私合规以及在企业生产环境中的部署安全性,请务必以项目官方最新的源代码、日志审查和许可证限制为准。