【验证技能树】从验证视角，真正理解 AMBA CHI 03 -- 从一次 Load Miss，看懂 CHI 的一致性交易

聚焦 RISC-V / CPU / SoC 验证实践。

所有结论，默认都------得验。

对很多工程师来说，CHI 最难的地方不在于概念，而在于：
"这些概念，怎么在一次真实访问中连起来？"

所以这一篇，我们不谈设计哲学，也不铺协议全景，

只做一件事：

👉 完整走一遍：一次 Load Miss，在 CHI 中到底发生了什么。

一、先把场景定死：一个最典型、也最容易出 bug 的情况

我们从一个工程中最常见的场景出发：

Core A 执行一条 Load 指令
目标地址 在本地 L1 / L2 Miss
系统中：
- 其他 Core 可能有这条 Cache Line
- 也可能都没有

这是所有一致性问题的起点。

二、第一步：Request Node 发出 Req ------"我想读这条数据"

当 Core A 发生 Load Miss，它不会"直接去内存要数据"，而是：

👉 通过 Req 通道，向 Home Node 发起一个读请求

这里有两个非常关键的点：

1️⃣ Req 描述的是意图

我要读
我期望的是 Shared 还是 Unique

2️⃣ Req 并不承诺任何结果

不保证马上有数据
不保证一定来自内存

此时，系统只是"知道有人想要这条数据了"。

三、第二步：Home Node 接管问题 ------一致性裁决开始

Req 到达 Home Node 后，真正关键的角色登场了。

Home Node 并不是简单转发请求，而是要做一件事：

"在保证一致性的前提下，决定这次访问该怎么完成。"

这一步，Home Node 会查询 Directory，至少要回答三个问题：

1️⃣ 这条地址，是否被 Cache 持有？

2️⃣ 如果是，被谁持有？Shared 还是 Unique？

3️⃣ 是否必须发起 snoop？

注意：到这里为止，数据仍然没有动。

四、关键分叉点：是否需要 Snoop？

现在，CHI 的"聪明之处"开始体现。

情况 A：Directory 表明，没有任何 Cache 持有数据

这是最简单的情况：

Home Node 不需要 snoop
直接允许这次访问
数据将来自 Memory / LLC

👉 一次"干净"的 Load Miss

情况 B：Directory 表明，其他 Cache 持有这条数据

这时，Home Node 会做出一个非常重要的决定：

向"确定的目标 Cache"发起 Snoop

注意关键词：

👉 确定的目标

这正是 CHI 和广播式协议的本质区别。

五、Snoop：这不是"询问"，而是系统指令

当 Snoop 发出时，需要明确一点：

Snoop 不是请求者的行为，而是系统为了维护一致性发起的内部事务。

被 Snoop 的 Cache，需要通过 SnoopRsp 明确表态：

我有没有这条数据
我的当前状态是什么
是否需要回数据
我的状态将如何变化

这里有一个非常重要的认知：

在一致性意义上，SnoopRsp 的"承诺"，比数据本身更关键。

六、Dat：数据终于开始流动，但路径可能很"反直觉"

当一致性裁决完成后，系统才会安排数据返回。

这时你会看到几个很容易误判的现象：

数据 可能来自 Memory
也可能 直接来自被 Snoop 的 Cache
Dat 返回路径 不一定和 Req 路径一致

这正是 CHI 拆分 Dat 通道的意义：

数据只是"被运送的对象"，而不是协议的主线。

七、Rsp：请求的逻辑完成

在某个时刻，请求方会收到 Rsp，标志着：

这次请求在协议层面已经完成
Cache 状态已经被系统认可
后续访问可以基于新的状态继续

注意顺序关系：

Dat 可以早于 Rsp，也可以晚于 Rsp，
但一致性语义必须始终成立。

这也是验证中经常踩坑的地方。

八、把整条时间线串起来

我们用一句话把整条 Load Miss 流程串起来：

Req 发起意图 → Home Node 裁决 →（必要时）Snoop → Cache 承诺状态 → Dat 送数据 → Rsp 结束事务

如果你发现自己在调试 CHI 问题时，

能清楚地说出：

"现在卡在这条链路的哪一步"

那你对 CHI 的理解，已经超过大多数人了。

九、从验证视角看，这条流程意味着什么？

对验证工程师来说，这个流程至少带来三点启示：

1️⃣ 不要用"请求-响应"思维看 CHI

那会让你误判乱序为 bug。

2️⃣ 一致性问题，优先盯 Snoop / SnoopRsp

很多数据问题，根因其实在状态承诺上。

3️⃣ 验证的重点是"不变量"，不是"时序巧合"

例如：

不回旧数据
不出现两个 Unique
状态转换符合裁决结果

十、小结：CHI 的复杂，是为了让系统"敢乱序"

你可以这样理解 CHI：

CHI 用结构复杂度，换取系统级的确定性。

它允许：

高并发
深流水
多数据源

但前提是：

👉 每一步裁决，都有清晰的责任归属。