表达式树

表达式树

二叉树是表达式处理的常用工具。例如，表达式

a+b*(c-d)-e/f

其中，每个非叶子结点表示一个运算符，左子树是第一个运算数对应的表达式，而右子树则是第二个运算数对应的表达式。如何给一个表达式简历表达式树呢？方法有很多，这里只介绍一种：找到“最后计算”的运算符（它是整颗表达式树的根），然后递归处理。

#include <bits/stdc++.h>
using namespace std;
const int N = 1010;
int lch[N], rch[N], idx, root;
char op[N], s[N];
int build_tree(char *s, int x, int y){
    int c1 = -1, c2 = -1, p = 0;
    int u;
    if (y - x == 1){   // 只有一个字符了 
        u = ++idx;
        lch[u] = rch[u] = -1;
        op[u] = s[x];
        return u;
    }
    for (int i = x; i < y; i++){
        if (s[i] == '(') p++;
        if (s[i] == ')') p--;
        if (s[i] == '+' || s[i] == '-')
            if (!p) c1 = i;
        if (s[i] == '*' || s[i] == '/')
            if (!p) c2 = i;
    }
    // 找不到括号外的加减，就用乘除
    if (c1 < 0) c1 = c2;
    // 整个表达式被一对括号括起来，往里缩一位 
    if (c1 < 0) return build_tree(s, x + 1, y - 1);
    u = ++idx;
    lch[u] = build_tree(s, x, c1);
    rch[u] = build_tree(s, c1 + 1, y);
    op[u] = s[c1];
    return u;
}
void in_order(int u){
    if (lch[u] == -1 && rch[u] == -1){
        cout << op[u];
        return ;
    }
    in_order(lch[u]);
    cout << op[u];
    in_order(rch[u]);
}
void pre_order(int u){
    if (lch[u] == -1 && rch[u] == -1){
        cout << op[u];
        return ;
    }
    cout << op[u];
    pre_order(lch[u]);
    pre_order(rch[u]);
}
int main(){
    scanf("%s", s);
    root = build_tree(s, 0, strlen(s));
    in_order(root);
    puts("");
    pre_order(root);
    return 0;
}
/*
a+b*(c-d)-e/f
*/

上述代码是如何寻找“最后一个运算符”的呢？代码用了一个变量p，只有当p=0时才考虑这个运算符。为什么呢？因为括号里的运算符一定不是最后计算的，应当忽略。例如，(a+b)*c中虽然有一个加号，但却是在括号里的，实际上比它优先级高的乘号才是最后计算的。由于加减和乘除号都是左结合的，最后一个运算符才是最后计算的，所以用两个变量c1和c2分别记录“最右”出现的加减号和乘除号。
再接下来的代码就不难理解了：如果括号外有加减号，它们肯定最后计算；但如果没有加减号，就需要考虑乘除号（if(c1 < 0) c1 = c2）；如果全都没有，说明整个表达式外面被一对括号括起来，把它去掉后递归调用。这样，就找到了最后计算的运算符s[c1]，它的左子树是区间[x, c1]，右子树是区间[c1+1, y]。