编译原理基础:FIRST 集合与 FOLLOW 集合的构造与差异

编译原理基础:FIRST 集合与 FOLLOW 集合的构造与差异

嗨!学编译原理时,FIRST 集合和 FOLLOW 集合是不是让你有点晕?别急,今天我们要把它们讲清楚,先用一个表格对比它们的区别,再一步步教你怎么构造它们。这篇博客是为基础一般的同学设计的,尽量简单又不失严谨,走起!

FIRST vs FOLLOW:一表格看懂差异

特性 FIRST 集合 FOLLOW 集合
关心啥 推导字符串的"开头" 非终结符"后面紧跟"的东西
收集啥 第一个终结符(或 ε) 后面紧跟的终结符(或 $)
位置 看"前" 看"后"
例子 FIRST(T) = { id, ( } FOLLOW(T) = { +, ;, ) }
用途 决定推导从哪开始 决定推导完后下一步是啥

简单说:FIRST 是"开头侦察兵",FOLLOW 是"后续导航员",它们都只关心终结符(代码里实实在在的符号),不直接管非终结符(推导的中间步骤)。

FIRST 集合:开头有哪些可能?

感性理解

FIRST 集合就像猜一个故事的开头。比如你在写代码,编译器得知道某个部分(比如表达式)可能以什么打头------是 "id"(变量名)?还是 "("(括号)?FIRST 集合把这些"可能的开头"列出来,帮编译器找方向。

形式化表达

FIRST(A) 是非终结符 A 能推导出的所有字符串的第一个终结符的集合。如果 A 能推导出空串 ε,则 ε ∈ FIRST(A)。

构造方法

  1. 终结符:FIRST(a) = { a }。
  2. 空串:FIRST(ε) = { ε }。
  3. 非终结符 A (A → X1 X2 ... Xn):
    • 如果 X1 是终结符,加到 FIRST(A)。
    • 如果 X1 是非终结符:
      • 把 FIRST(X1)(去掉 ε)加到 FIRST(A)。
      • 如果 X1 能推 ε,继续看 X2,依次类推。
      • 如果 X1 X2 ... Xn 都能推 ε,则 ε ∈ FIRST(A)。
  4. 迭代:直到集合不再变。

例子

r 复制代码
S → E
E → T + E | T
T → id | ( E )
  • FIRST(T) = { id, ( }(id 和 ( 是开头)。
  • FIRST(E) = FIRST(T) = { id, ( }。
  • FIRST(S) = FIRST(E) = { id, ( }。

FOLLOW 集合:后面跟啥?

感性理解

FOLLOW 集合像是看一个符号的"后路"。编译器解析到某个部分(比如 T),得知道后面会接啥------是 "+"?";"?还是 ")"?FOLLOW 集合把这些"可能的后续"列出来,帮编译器规划下一步。

形式化表达

FOLLOW(A) 是非终结符 A 在推导中后面可能紧跟的终结符集合。如果 A 是开始符号,$ ∈ FOLLOW(A)。

构造方法

  1. 开始符号:FOLLOW(S) 加 $。
  2. 产生式 A → α B β
    • FIRST(β)(去掉 ε)加到 FOLLOW(B)。
    • 如果 β 能推 ε 或为空,把 FOLLOW(A) 加到 FOLLOW(B)。
  3. 迭代:直到集合不再变。

例子

r 复制代码
S → E ;
E → T + E | T
T → id | ( E )
  • FOLLOW(S) = { $ }(开始符号)。
  • FOLLOW(E) = { ;, ) }(S → E ; 得 ;,T → ( E ) 得 ))。
  • FOLLOW(T) = { +, ;, ) }(E → T + E 得 +,E → T 得 FOLLOW(E))。

为啥都只关心终结符?

FIRST 和 FOLLOW 是为预测式分析(比如 LL(1))服务的,编译器最终要处理的 token 是终结符("id"、"+" 之类),非终结符只是推导的"工具",所以它们都只收集终结符。

小结

有了开头的表格,你应该能一眼看出 FIRST 和 FOLLOW 的区别了吧!FIRST 管开头,FOLLOW 管后续,都是终结符的"侦察员"。试着拿个小文法算算它们的集合,动手练练就更明白了。加油哦!

相关推荐
Asthenia04127 分钟前
为什么把私钥写在代码里是一个致命错误
后端
程序员一诺13 分钟前
【Flask开发】嘿马文学web完整flask项目第2篇:2.用户认证,Json Web Token(JWT)【附代码文档】
后端·python·flask·框架
Asthenia041217 分钟前
如何在 Java 中正确判空 BigDecimal 等数据类型
后端
冷琅辞30 分钟前
Swift语言的跨平台开发
开发语言·后端·golang
Asthenia041243 分钟前
Pandas期末备考:常见问题解析
后端
今夜有雨.1 小时前
使用C++实现HTTP服务
开发语言·网络·c++·后端·网络协议·tcp/ip·http
东方苾梦1 小时前
Lua语言的安全开发
开发语言·后端·golang
Asthenia04121 小时前
Spring Boot @Conditional 注解分析与实际业务场景应用
后端
慕离桑1 小时前
HTML语言的数据可视化
开发语言·后端·golang
我命由我123451 小时前
C++ - 头文件基础(常用标准库头文件、自定义头文件、头文件引入方式、防止头文件重复包含机制)
服务器·c语言·开发语言·c++·后端·visualstudio·visual studio code