编译原理基础:FIRST 集合与 FOLLOW 集合的构造与差异

编译原理基础:FIRST 集合与 FOLLOW 集合的构造与差异

嗨!学编译原理时,FIRST 集合和 FOLLOW 集合是不是让你有点晕?别急,今天我们要把它们讲清楚,先用一个表格对比它们的区别,再一步步教你怎么构造它们。这篇博客是为基础一般的同学设计的,尽量简单又不失严谨,走起!

FIRST vs FOLLOW:一表格看懂差异

特性 FIRST 集合 FOLLOW 集合
关心啥 推导字符串的"开头" 非终结符"后面紧跟"的东西
收集啥 第一个终结符(或 ε) 后面紧跟的终结符(或 $)
位置 看"前" 看"后"
例子 FIRST(T) = { id, ( } FOLLOW(T) = { +, ;, ) }
用途 决定推导从哪开始 决定推导完后下一步是啥

简单说:FIRST 是"开头侦察兵",FOLLOW 是"后续导航员",它们都只关心终结符(代码里实实在在的符号),不直接管非终结符(推导的中间步骤)。

FIRST 集合:开头有哪些可能?

感性理解

FIRST 集合就像猜一个故事的开头。比如你在写代码,编译器得知道某个部分(比如表达式)可能以什么打头------是 "id"(变量名)?还是 "("(括号)?FIRST 集合把这些"可能的开头"列出来,帮编译器找方向。

形式化表达

FIRST(A) 是非终结符 A 能推导出的所有字符串的第一个终结符的集合。如果 A 能推导出空串 ε,则 ε ∈ FIRST(A)。

构造方法

  1. 终结符:FIRST(a) = { a }。
  2. 空串:FIRST(ε) = { ε }。
  3. 非终结符 A (A → X1 X2 ... Xn):
    • 如果 X1 是终结符,加到 FIRST(A)。
    • 如果 X1 是非终结符:
      • 把 FIRST(X1)(去掉 ε)加到 FIRST(A)。
      • 如果 X1 能推 ε,继续看 X2,依次类推。
      • 如果 X1 X2 ... Xn 都能推 ε,则 ε ∈ FIRST(A)。
  4. 迭代:直到集合不再变。

例子

r 复制代码
S → E
E → T + E | T
T → id | ( E )
  • FIRST(T) = { id, ( }(id 和 ( 是开头)。
  • FIRST(E) = FIRST(T) = { id, ( }。
  • FIRST(S) = FIRST(E) = { id, ( }。

FOLLOW 集合:后面跟啥?

感性理解

FOLLOW 集合像是看一个符号的"后路"。编译器解析到某个部分(比如 T),得知道后面会接啥------是 "+"?";"?还是 ")"?FOLLOW 集合把这些"可能的后续"列出来,帮编译器规划下一步。

形式化表达

FOLLOW(A) 是非终结符 A 在推导中后面可能紧跟的终结符集合。如果 A 是开始符号,$ ∈ FOLLOW(A)。

构造方法

  1. 开始符号:FOLLOW(S) 加 $。
  2. 产生式 A → α B β
    • FIRST(β)(去掉 ε)加到 FOLLOW(B)。
    • 如果 β 能推 ε 或为空,把 FOLLOW(A) 加到 FOLLOW(B)。
  3. 迭代:直到集合不再变。

例子

r 复制代码
S → E ;
E → T + E | T
T → id | ( E )
  • FOLLOW(S) = { $ }(开始符号)。
  • FOLLOW(E) = { ;, ) }(S → E ; 得 ;,T → ( E ) 得 ))。
  • FOLLOW(T) = { +, ;, ) }(E → T + E 得 +,E → T 得 FOLLOW(E))。

为啥都只关心终结符?

FIRST 和 FOLLOW 是为预测式分析(比如 LL(1))服务的,编译器最终要处理的 token 是终结符("id"、"+" 之类),非终结符只是推导的"工具",所以它们都只收集终结符。

小结

有了开头的表格,你应该能一眼看出 FIRST 和 FOLLOW 的区别了吧!FIRST 管开头,FOLLOW 管后续,都是终结符的"侦察员"。试着拿个小文法算算它们的集合,动手练练就更明白了。加油哦!

相关推荐
会开花的二叉树5 小时前
彻底搞懂 Linux 基础 IO:从文件操作到缓冲区,打通底层逻辑
linux·服务器·c++·后端
lizhongxuan5 小时前
Spec-Kit 使用指南
后端
会豪5 小时前
工业仿真(simulation)--发生器,吸收器,缓冲区(2)
后端
SamDeepThinking5 小时前
使用Cursor生成【财务对账系统】前后端代码
后端·ai编程·cursor
饭碗的彼岸one5 小时前
C++ 并发编程:异步任务
c语言·开发语言·c++·后端·c·异步
会豪6 小时前
工业仿真(simulation)--仿真引擎,离散事件仿真(1)
后端
Java微观世界6 小时前
匿名内部类和 Lambda 表达式为何要求外部变量是 final 或等效 final?原理与解决方案
java·后端
SimonKing6 小时前
全面解决中文乱码问题:从诊断到根治
java·后端·程序员
几颗流星6 小时前
Java 中使用 CountDownLatch 增加线程竞争,帮助复现并发问题
后端
郑洁文6 小时前
基于SpringBoot的天气预报系统的设计与实现
java·spring boot·后端·毕设