问题
昨天发布了一篇文章《编译原理极简入门:表达式求值》,我们用编译原理的方式实现了表达式求值。有一位朋友说,如何实现阶乘运算呢?我当时在地铁上,只是简单考虑阶乘这个优先级来说,应该是高于乘除法的,那么他应该被定义在 factor 里面。但是深入再想,发现问题并不简单。
首先尝试实现阶乘
在数学公式里面 n 的阶乘被表示为 n!,那么我们先考虑一下如何进化我们的 BNF 让他支持阶乘,之前我们的 BNF 是这样的:
BNF
factor => NUM | ( expression ) | -factor
首先负数是没有阶乘的,直接排除 -factor 这个分支,那我们的阶乘 factor 可以这样进化:
BNF
factor => NUM | NUM! | ( expression ) | (expression)! | -factor
为了简化问题,我们先实现 NUM! 感受一下会发生什么。
代码实现
Python
def factor(i):
if tokens[i].isdigit():
i += 1
if tokens[i] == '!':
n = int(tokens[i])
i += 1
return i, factorial(n)
return i+1, int(tokens[i])
elif tokens[i] == "-":
i += 1
i, a = factor(i)
return i, -1*a
elif tokens[i] == "(":
i += 1
i, a = expression(i)
if tokens[i] == ")":
i += 1
return i, a
else:
raise Exception("SyntaxError: near the '%s'"%(tokens[i]))
else:
raise Exception("SyntaxError: near the '%s'"%(tokens[i]))
# 计算阶乘
def factorial(n):
if n == 0:
return 1
else:
return n * factorial(n-1)
我们发现之前的函数里面,拿到 NUM 就可以直接返回了,现在要多一次判断。而这个 if 看似不起眼,实则影响巨大,他的出现使得 factor 这个函数的过程产生了回溯 。说人话就是,正常情况拿完 NUM 就返回了,但因为阶乘这个后置的一元运算符,使得我们每次处理 + - * /
的时候都要拿出来看一看,如果是阶乘则由 factor 处理,如果不是,则会把这个符号放回待处理交给其他语法去处理。如果括号后面也允许阶乘的话,也要做同样的事情。阶乘作为一个冷门算符,如果为了支持这样一个算符而增加大量的回溯,就非常影响编译的效率了。
因此,所有主流的语言都不会实现后置的一元运算符,像阶乘这样的计算,应该用函数实现。