表达式树的简单实现

来源:互联网 发布:网络电视提示解压失败 编辑:程序博客网 时间:2024/05/16 15:02

表达式树是树结构的一个经典应用,常用于编译器的设计。

在表达式树中,叶子通常是常数值或者变量名,统称为操作数(operands)。而其他非叶子结点则包含各种操作符(operators)。

在不同的词法解析中,表达式树的分支设计也不同。对于简单的诸如表达式求解而言,表达式树往往采用二叉树。这是因为每一个操作符正好对应两个操作数。

而在包含一元操作符(e.g自增自减操作符)或三元操作符的复杂情况下,每个操作符结点拥有的不再是两个孩子结点,此时二叉树便显得不太适用。

在此处的简单实现,我们只考虑适合二叉树的表达式求解,其余情况请自行翻阅编译原理相关书籍。当然,无论是哪种情况,本质的算法思想是相同的。

0.构造表达式树

要构造一个表达式树,首先要将一般的中缀表达式(infix)转换成逆波兰式(即后缀表达式,postfix)。

PS:关于逆波兰式以及infix和postfix的转换,请参考我之前的一篇文章http://blog.kingsamchen.com/archives/637

对于中缀表达式(a+b)*(c*(d+e)),其逆波兰式为ab+cde+**,我们现在结合这个表达式,阐述利用逆波兰式构造表达式树的一般步骤。

在构建表达式树时,我们需要一个堆栈,用于保存树或者结点的指针,记这个堆栈为S。

我们对逆波兰式进行遍历,如果碰到的是

(1)操作数,那么则建立一个叶子结点,数据为操作数,并将结点指针保存到堆栈中
(2)操作符,那么从堆栈中弹出两个指针,分别为p2和p1.建立一个结点,内容为操作符,然后分别将结点的左右孩子设置为p1和p2,最后将结点指针压入栈

一直重复以上步骤即可。最后堆栈中保存的即是表达式树的根结点指针。

对于中缀表达式(a+b)*(c*(d+e)),其逆波兰式为ab+cde+**,我们现在结合这个表达式,利用图示展示构建过程





1.表达式树的求值

表达式树的求值非常简单,只需要在后序遍历的基础上进行改进即可。

我们要对一个结点进行求值,那么我们需要得到左子树的值和右子树的值,这是递归思想的基准。

而当我们遍历到叶子结点,即操作数结点时,我们返回结点的自身的值。

2.代码实现

为了简化实现,实现中结点的数据类型设置为int型,且假设每个操作数只有一位数。

由于操作数只出现在叶子结点,所以非叶子结点的数据都被解释为操作符,实现中为字符类型

PS:如下代码只是为了说明表达式树建立和求值的算法本质,要设计完善的表达式树,还需要做大量的细节工作。

0 0
原创粉丝点击