概述:
    Rumen是一个数据分析工具,它调取JobHistory 日志,将它保存为一个容易处理的文件.
    又两部分组成:1 Trace builder .将日志输出为JSON. 2 Folder ,将JSON文件存储为目录和文件.
    如何使用:
    hadoop rumentrace \
    file:///tmp/job-trace.json \
    file:///tmp/job-topology.json \
    hdfs:///tmp/hadoop-yarn/staging/history/done_intermediate/testuser

    将 /tmp/hadoop-yarn/staging/history/done_intermediate/testuser这个目录下所有的job 输出到 job-trace.json将job的拓扑关系保存在job-topology.json.