从「能问数」到「像分析师写报告」：AI+经营分析落地技术分享

作者：杜志伟枫清科技技术架构师

开篇：先看两个回答，问的是同一个问题

用户问：X月公司营收表现如何？

回答A：

X月公司营业收入为 X 亿元，预算达成率95.5%，较预算差额 -X 千万元。同比增长11.4%，环比下降 4.2%。

按事业部营收排名：事业部A占35.0%，事业部B占24.2%，事业部C占 20.2%，事业部D占18.9%，其他占1.7%。

回答B：

1.营收总额与预算达成

X月营收未达预算目标，预算差额为 -X 千万元，达成率 95.5%。值得注意的是，同比去年同期增长超过 11%，说明业务整体仍在扩张；但环比上月下滑约 4%，节奏较预算计划偏慢。同比涨了，预算却没达------这一组数据的张力，是本月营收分析的核心线索。

2.营收结构下钻

4个核心事业部合计覆盖营收 98% 以上，其中事业部 A（35%）和事业部 B（24%）贡献超过半数，是营收的主要承压方，也是差距的主要来源。

3.结论与建议

本月预算缺口并非需求萎缩导致（同比仍增长），更可能源于季节性节奏偏差和部分订单的延迟交付，建议优先排查头部事业部的产能调配和交付达成情况。

两份回答，数据来源完全一样。差距在哪？

回答A 把数字报了一遍 ，读完知道发生了什么；回答 B 识别出「同比涨了但没达预算」这个数据内在的张力 ，解释了背后的逻辑，还给出了方向------读完知道接下来要做什么。

这中间经历了将近半年的迭代，这篇文章讲的就是这段过程。

一、从需求到产品形态：一开始谁都没谱

做AI项目，很多企业一开始对最终长什么样、好到什么程度 ，心里是没谱的------这往往并不是需求方不专业，而是经营分析与大模型结合 这件事，行业里本就没有多少可照搬的成熟范式：客户与实施方在很大程度上是同时第一次 在真实业务里「尝鲜」，用 AI 去支撑一类此前很少被完整产品化过 的能力。没有现成剧本，就意味着需求、效果与边界都要在共创里逐步显影；对团队而言，这也意味着要在开放场景下持续消化不确定性、把链路走通 ，本身就是对交付与工程能力的考验。

另一方面，大模型并非确定性系统：输出带随机性，幻觉与越界在开放域里难以根除。要把这样的能力用在严肃经营口径与可追责结论 上------本质上是在做一件事：驯服模型 ，让它在既定业务与数据边界内可靠工作。下文所述的迭代，也是把模型行为逐步压进可审计、可复用系统能力的过程。没有先例可循时，能否把业务、数据与工程拧成一股绳，决定了这类项目能不能真正落地 ；我们在项目中的做法，正是围绕这一前提展开。

在此前提下，我们配合业务咨询，把需求从面上那层大方向往能落地、能验收 里收：营收、毛利、净利、成本、费用......既有经营分析里通用的一套东西 ，也要叠上行业（如：半导体制造）这类行业语境 ，再加上客户公司自己的 分析口径和关注点。

需求理清楚之后，反而更难的一件事来了：产品形态和效果只能先妥协成「迭代」 ------第一版不可能一步到位，但每一版都得对得起「真的有人在用」这件事。

二、两版迭代：问数能跑，

但「答得好」和「跑得通」不是一回事

我们当时的直觉是：workflow能串起来就行。于是第一版很直白：

背后是把咨询梳理结果固化成「分析模板」：指标取数配置+ 提示词 ，再叠上我们已有的「指标问数」能力，把多条问数结果拼成一段回答。

这套模板库知识不是凭空来的------业务咨询阶段花了将近1~2 人/月 ，跨了经营、财务、运营多个业务条线，最终沉淀了100 多个分析模板 。每个模板的结构参考了Plan-Execute 类Agent few-shot 的写法，目的是让大模型能学着客户自己的分析方式来回答，而不是套通用话术。

这一版在「小范围、偏演示」的场景里其实还行 ------尤其是早期对接的多是公司管理层视角的咨询反馈，问题相对收敛。

一上线，真实用户一上来，画风就变了：

问题更口语、更发散， 模板只能盖住一小撮；很多回答显得「固定套路」，容易答非所问。

模板覆盖不了的时候，召回逻辑又是选或不选 ，没有「当参考用」的中间态，结果还是硬套，用户体感就是：一点也不AI 。

所以我们很快加了一条自由分析链路 ，缓解回答容易「跑偏」

模板匹配度高 ：走原来的「多指标问数+ 润色」。

模板匹配度低 ：先召回业务梳理过的知识，把问题拆成多条自然语言的问数，再走「多指标问数+ 润色」。

第二版抱怨少了些，但焦虑没消。 客户那边其实相当包容------他们没有简单地说「这东西不好用」，而是认真地提出了自己从经营管理视角 看报告的诉求：管理层要的不是「把数念一遍再总结两句」，而是一份真正能辅助决策的解读。这个反馈让我们意识到，问题不是链路有没有跑通，而是回答的深度和方式根本就不对 ------就像开篇里的「回答 A」，数字都对，但不是管理层想要的那种回答。

三、转折点：调参优化到头了，路线要换

那阵子我们很多时间花在：调模板召回、调问数准确率、调提示词------链条拆开看，每一段都能优化 ；但改完一环之后，客户的焦虑并没有跟着消散。

转折点发生在一次例会后。客户在群里分享了她自己用ChatGPT 做经营分析的完整步骤和效果截图，大意说了一句：「大模型越来越聪明，你看 ChatGPT 回答的思路就很好，为什么我们这个做不到？」

这句话当时挺刺的，但也是真正说清楚了问题所在------客户要的是垂直领域的经营分析知识 ，而不只是一个能接指标的问答框。通用大模型在经营分析领域的知识积累，在某些问题上确实比我们当时的产品更接近「分析师思维」。

这件事之后我们意识到两件事：

1.要对模型做系统性评测 ，而不是凭感觉调提示词------找到真正具备经营分析知识的模型（或通过知识注入的方式强化）；

2.整体路线要调整 ，不能只靠「模板+ 润色」的方式做到「像分析师写报告」的效果，需要让系统具备经营分析师的思维框架 。

跟客户往深聊之后，目标反而变清晰了：

1.输出要符合经营分析的思路 ------不是泛泛的问答，而是有方法论支撑的分析框架；

2.受众是经营管理者 ------更像「有个分析师帮你写经营分析报告」。

这就不是「再多接几条问数」能解决的问题了。我们归纳成几件硬条件：

于是路线从「模板为主」转向：自由分析（Agentic RAG）为主，模板为辅 ------整体链路做了比较大的重构。

四、当前主链路长什么样

用一句话概括：先尽量理解用户在经营分析里真正想问什么，再决定走「模板快车道」还是「自由分析链路」 。

模板快车道 还会新增一步：用问数润色结果作为知识，再围绕用户问题做一轮「经营向」的润色 ，让输出更贴管理层语境。

自由分析链路的核心：Plan至少是两步，不是一步

很多人理解的plan 是「大模型出一个分析大纲」，我们实际做下来发现这不够用。Plan 至少要分两个层次：

第一步------建骨骼 ：识别用户在经营分析里的真实意图，在业务允许的范围内发散分析板块，输出回答框架+ 各分析点的思路要点 。这份框架是「分析师视角的报告提纲」，会作为上下文骨架贯穿后续全程。

第二步------填血肉 ：根据框架里的每个分析思路要点，结合我们的指标问数方案，拆解出具体支持取数的标准化提问------这步决定了「想说的话」能不能被数据真正撑起来。

这两个步骤是通用的报告写作方法，但想要驾驭住大模型发挥的效果贴合用户的实际业务来做分析，那就需要两大法宝了：业务咨询的产物转成Plan-Execute类智能体fews-hot风格的业务分析知识作为缰绳、业务与指标关系的总览知识是马镫 ，这样我们在运行的道路上才不至于效果翻车。

业务咨询的产物 不只是模板，还有一批按CoT 结构转换的业务分析知识（带分析逻辑的结构化知识），这批知识在 Agentic RAG 路线里被召回，作为 plan生成的参考依据，让系统的分析思路能贴近客户自己的业务分析方法，而不是大模型凭空发散。

不过Plan 做得再好，前提是入口先对------分词和意图识别 的质量直接决定后续所有环节的上限，这块坑我们单独放下一篇 内容详细说。

智能体流程是在业务方法论 之上做自动化回答规划------技术链路和业务叙事需要能互相对上，才不会变成「技术自嗨」。

五、来点真实感受：再来一个case 拆解

以下内容已脱敏，具体数字和维度值仅作示意。

Case 1：库存归因分析------Agentic RAG怎么做「因果链」追溯

这个case 更能体现 Agentic RAG 方式的价值。用户问的是：「X 月公司库存增长的主要原因是什么？」

归因类问题以前最难处理------模板很难预设「答案是交付问题还是产能问题还是需求问题」，逻辑分支太多。

Plan第一步------先建因果框架

系统根据咨询的公司分析知识+ 通用的经营知识 识别出这是「产销存闭环」归因分析，plan 给出分析路径：

库存增长 ≈ 产量 − 发货量，分析要从三个方向追：生产端、销售端、交付端。

Plan 第二步------拆成三组取数

取数结果一步步「收口」到根因

步骤1：库存金额环比增长约 X%，主要集中在原材料类和几个核心事业部；

步骤2：订单需求量 > 实际发货量，缺口数十万片------市场需求是有的，****不是卖不出去；****

步骤3：多个核心事业部交付计划达成率偏低，部分重点客户（客户 A、客户 B）达成率极低，在 30% 以下------产品生产出来了，但出不了库。

最终结论水落石出：不是生产过量，不是需求不足，而是交付环节卡住了。

>（参考效果见下图，非产品截图）

如果没有先把「产销存闭环」这条因果逻辑铺出来，系统可能只会给一张库存汇总表。有了框架，取数顺序、成文叙事都跟着因果链走，最终报告读起来像「分析师在帮你排查问题」，而不是「数仓在帮你出报表」。

结语

经营分析这类场景，难的不是技术本身 ，而是业务咨询与技术服务业务需求要并重 ：前者把口径、场景和「经营分析」到底解决什么问题想清楚，后者把这些变成能跑、能迭代的链路。车轮缺一边，另一边再使劲也容易变成空转。真正把这事儿往前推的，是在这条路上持续跟客户对齐他们的高要求 ：多轮沟通、反复验收，产品才能一步步演进；当然，笨功夫也省不了------一遍遍测、改、回归，一点点给技术链路补上血肉。