编译原理基础:FIRST 集合与 FOLLOW 集合的构造与差异

编译原理基础:FIRST 集合与 FOLLOW 集合的构造与差异

嗨!学编译原理时,FIRST 集合和 FOLLOW 集合是不是让你有点晕?别急,今天我们要把它们讲清楚,先用一个表格对比它们的区别,再一步步教你怎么构造它们。这篇博客是为基础一般的同学设计的,尽量简单又不失严谨,走起!

FIRST vs FOLLOW:一表格看懂差异

特性 FIRST 集合 FOLLOW 集合
关心啥 推导字符串的"开头" 非终结符"后面紧跟"的东西
收集啥 第一个终结符(或 ε) 后面紧跟的终结符(或 $)
位置 看"前" 看"后"
例子 FIRST(T) = { id, ( } FOLLOW(T) = { +, ;, ) }
用途 决定推导从哪开始 决定推导完后下一步是啥

简单说:FIRST 是"开头侦察兵",FOLLOW 是"后续导航员",它们都只关心终结符(代码里实实在在的符号),不直接管非终结符(推导的中间步骤)。

FIRST 集合:开头有哪些可能?

感性理解

FIRST 集合就像猜一个故事的开头。比如你在写代码,编译器得知道某个部分(比如表达式)可能以什么打头------是 "id"(变量名)?还是 "("(括号)?FIRST 集合把这些"可能的开头"列出来,帮编译器找方向。

形式化表达

FIRST(A) 是非终结符 A 能推导出的所有字符串的第一个终结符的集合。如果 A 能推导出空串 ε,则 ε ∈ FIRST(A)。

构造方法

  1. 终结符:FIRST(a) = { a }。
  2. 空串:FIRST(ε) = { ε }。
  3. 非终结符 A (A → X1 X2 ... Xn):
    • 如果 X1 是终结符,加到 FIRST(A)。
    • 如果 X1 是非终结符:
      • 把 FIRST(X1)(去掉 ε)加到 FIRST(A)。
      • 如果 X1 能推 ε,继续看 X2,依次类推。
      • 如果 X1 X2 ... Xn 都能推 ε,则 ε ∈ FIRST(A)。
  4. 迭代:直到集合不再变。

例子

r 复制代码
S → E
E → T + E | T
T → id | ( E )
  • FIRST(T) = { id, ( }(id 和 ( 是开头)。
  • FIRST(E) = FIRST(T) = { id, ( }。
  • FIRST(S) = FIRST(E) = { id, ( }。

FOLLOW 集合:后面跟啥?

感性理解

FOLLOW 集合像是看一个符号的"后路"。编译器解析到某个部分(比如 T),得知道后面会接啥------是 "+"?";"?还是 ")"?FOLLOW 集合把这些"可能的后续"列出来,帮编译器规划下一步。

形式化表达

FOLLOW(A) 是非终结符 A 在推导中后面可能紧跟的终结符集合。如果 A 是开始符号,$ ∈ FOLLOW(A)。

构造方法

  1. 开始符号:FOLLOW(S) 加 $。
  2. 产生式 A → α B β
    • FIRST(β)(去掉 ε)加到 FOLLOW(B)。
    • 如果 β 能推 ε 或为空,把 FOLLOW(A) 加到 FOLLOW(B)。
  3. 迭代:直到集合不再变。

例子

r 复制代码
S → E ;
E → T + E | T
T → id | ( E )
  • FOLLOW(S) = { $ }(开始符号)。
  • FOLLOW(E) = { ;, ) }(S → E ; 得 ;,T → ( E ) 得 ))。
  • FOLLOW(T) = { +, ;, ) }(E → T + E 得 +,E → T 得 FOLLOW(E))。

为啥都只关心终结符?

FIRST 和 FOLLOW 是为预测式分析(比如 LL(1))服务的,编译器最终要处理的 token 是终结符("id"、"+" 之类),非终结符只是推导的"工具",所以它们都只收集终结符。

小结

有了开头的表格,你应该能一眼看出 FIRST 和 FOLLOW 的区别了吧!FIRST 管开头,FOLLOW 管后续,都是终结符的"侦察员"。试着拿个小文法算算它们的集合,动手练练就更明白了。加油哦!

相关推荐
她的男孩12 小时前
Maven 多模块项目如何避免越写越乱?Forge Admin 的模块边界实践
后端
日月云棠12 小时前
4 高级配置:容错策略、降级保护与流量控制
java·后端
JuiceFS13 小时前
降低数据存储成本:JuiceFS v1.4 分层存储设计解析
运维·后端
无关868814 小时前
Spring Boot 项目标准化部署打包实战
java·spring boot·后端
Qhappy14 小时前
AI逆向实战:从零还原某航空App的AES加密
javascript·后端
tonydf14 小时前
Nginx爆新的RCE漏洞!别担心,平滑升级即可。
后端·nginx
Java编程爱好者14 小时前
JVM GC调优实战:从线上频繁Full GC到RT降低80%的全过程
后端
Master_Azur14 小时前
JavaEE之多线程
后端
阿丰资源14 小时前
基于Spring Boot的酒店客房管理系统
java·spring boot·后端
无籽西瓜a14 小时前
【西瓜带你学Kafka | 第八期】 Kafka的主从同步、消息可靠性、流处理与顺序消费(文含图解)
java·分布式·后端·kafka·消息队列·mq