今天因为维护的 MapReduce Job 总是卡住,然后挂掉很是着急。查文档大概可能是 reduce 函数耗时超过默认的 10 分钟,好在本地可以复现。下了个最新版的 JMC,因为开了代理,总是开不了记录仪。几次周折总算拿到了 jfr 文件。通过火焰图找到了最耗时的方法,问题解决。

    然后顺着心情,学习了下系统问题的排查。

    20210706 用了下 Java Mission Control - 图1