编译原理基础：FIRST 集合与 FOLLOW 集合的构造与差异

嗨！学编译原理时，FIRST 集合和 FOLLOW 集合是不是让你有点晕？别急，今天我们要把它们讲清楚，先用一个表格对比它们的区别，再一步步教你怎么构造它们。这篇博客是为基础一般的同学设计的，尽量简单又不失严谨，走起！

简单说：FIRST 是"开头侦察兵"，FOLLOW 是"后续导航员"，它们都只关心终结符（代码里实实在在的符号），不直接管非终结符（推导的中间步骤）。

FIRST 集合就像猜一个故事的开头。比如你在写代码，编译器得知道某个部分（比如表达式）可能以什么打头------是 "id"（变量名）？还是 "("（括号）？FIRST 集合把这些"可能的开头"列出来，帮编译器找方向。

FIRST(A) 是非终结符 A 能推导出的所有字符串的第一个终结符的集合。如果 A 能推导出空串 ε，则 ε ∈ FIRST(A)。

例子：

r 复制代码

S → E
E → T + E | T
T → id | ( E )

FOLLOW 集合像是看一个符号的"后路"。编译器解析到某个部分（比如 T），得知道后面会接啥------是 "+"？";"？还是 ")"？FOLLOW 集合把这些"可能的后续"列出来，帮编译器规划下一步。

FOLLOW(A) 是非终结符 A 在推导中后面可能紧跟的终结符集合。如果 A 是开始符号，$ ∈ FOLLOW(A)。

开始符号：FOLLOW(S) 加 $。
产生式 A → α B β ：
- FIRST(β)（去掉 ε）加到 FOLLOW(B)。
- 如果 β 能推 ε 或为空，把 FOLLOW(A) 加到 FOLLOW(B)。
迭代：直到集合不再变。

例子：

r 复制代码

S → E ;
E → T + E | T
T → id | ( E )

FIRST 和 FOLLOW 是为预测式分析（比如 LL(1)）服务的，编译器最终要处理的 token 是终结符（"id"、"+" 之类），非终结符只是推导的"工具"，所以它们都只收集终结符。

有了开头的表格，你应该能一眼看出 FIRST 和 FOLLOW 的区别了吧！FIRST 管开头，FOLLOW 管后续，都是终结符的"侦察员"。试着拿个小文法算算它们的集合，动手练练就更明白了。加油哦！