链接

image.png

前置概念

CPU 使用率超过 100%

如果您的进程占用了多个CPU,会出现CPU使用率超过100%的情况。这里的采集结果为多核的总使用率。

特征

阿里云的 ESC 控制台上显示 100%,ssh 登录后执行命令非常慢。

排查问题

使用 top -c ,然后 P 查看 CPU 使用率, 发现有些进程过高。
image.png
然后使用 ps aux|grep 1188 发现该进程居然不存在。
通过 command 中的关键字来 ps 发现,是 guincorn 在不断的创建新的子进程。

父子进程

  • ps -ef|grep 24752 输出的第三列是父进程的 pid。
  • ps aux|grep 则无父进程,

image.png
第二列就是当前进程的 PID,第三列就是当前进程父进程的 PID。24752 的父进程是 1,说明是系统。

进程树

使用 pstree -p 24752 查看进程树:
image.png

gdb 查看跟踪调试

  1. gdb attach 24752

然后,按 c (continue) 发现:
image.png
发现 24752 在不断的创建子进程,child process.

杀掉进程

  1. kill -9 24752