GEO 效果看什么指标：从提及、引用到推荐的判断框架

判断 GEO 效果，先不要把发稿量、截图、收录、流量、咨询放进同一个分数里。

更稳的做法，是按固定问法建立一张回查表。每一列只回答一个问题：AI 有没有提到你、有没有讲准、引用了什么来源、结果是否稳定、业务前端有没有接上。

按刘佬的复盘口径，发稿量是工作量，不是结果面。结果面要回到真实问题里的回答变化。

第一轮可以先用这张表。

指标	记录字段	说明	不要误判成
工作量	新增页面数、更新页面数、回查次数	团队是否推进项目	GEO 已经有效
提及	固定问法下是否出现品牌 / 公司 / 产品	AI 是否开始把你放进答案	稳定推荐
准确度	服务范围、适配条件、案例事实、边界是否正确	AI 是否讲准你	业务已经转化
来源	标题、URL、站点、摘要、页面类型	回答是否有可追材料	来源一定高质量
稳定性	连续几次回查是否一致	结果是否不是单次偶然	所有平台都一致
业务动作	咨询、表单、电话、销售追问	前端是否接住回答变化	全部由 GEO 带来

这张表的重点是分层。一个指标只能证明一层，不要越级解释。

不要只问品牌词。

品牌词适合检查 AI 是否认识你，但不适合判断 GEO 效果。效果回查要用不带品牌名的真实问题。

示例：

每个问题都按同一平台、同一时间间隔回查。不要今天换问题，明天换平台，后天换提示词，然后把结果放在一起比较。

提到你，只是第一列。

还要记录它怎么讲你：

如果这一列不做，周报里很容易出现"被提到了，所以有效"。实际上，讲错的提及比不提还麻烦。

GEO 的效果要看来源。

国内联网搜索和开放域搜索产品的公开说明里，常见返回对象包括标题、URL、站点、摘要、原始链接、相关性或覆盖类指标。执行层不需要把这些文档背下来，但要理解一件事：AI 回答不是只有一句结果，背后还有来源和片段。

记录来源时，建议至少写 5 列：

如果 AI 引用的是旧简介，先改旧简介。

如果引用的是首页泛介绍，先补服务页和案例页。

如果来源打不开，先处理页面可访问性。

如果来源正确但回答仍然错，再看页面里适配条件和边界是否写清。

不要用单张截图验收。

AI Search 可见度测量研究里有一个很直白的提醒：不要只测一次。回答会受到运行次数、提示词和时间影响。

落到执行表里，就是：

可以用下面的状态：

咨询、线索、成交要看，但不要和回答层混在一起。

如果 AI 已经讲准，客户仍然没有动作，问题可能在这些地方：

所以业务层建议单独记录：

不要看到咨询没变，就直接归因 GEO 无效。先检查回答层和承接层是否已经跑通。

第一轮做到下面程度，可以算"开始跑起来"：

还没达到这些条件，不建议只看发稿量或截图报喜。

结论：GEO 效果指标的核心不是"数字越多越好"，而是固定问题里 AI 有没有更准确、更稳定地讲清你。表格做到这一步，下一轮才知道该补页面、补案例、统一资料，还是检查业务承接。