1.使用top+jstack命令
- 1.1.什么是top?什么是jstack?
  - Linux的系统状况，比如cpu、内存的使用。">1.1.1. top：top命令经常用来监控Linux的系统状况，比如cpu、内存的使用。
  - 1.1.2.jstack是java虚拟机自带的一种堆栈跟踪工具
2.如何使用top+jstack分析线程状态
3. jastck怎么分析线程?

1.使用top+jstack命令

1.1.什么是top?什么是jstack?

1.1.1. top：top命令经常用来监控Linux的系统状况，比如cpu、内存的使用。

如下图所示：简单的使用top命令打出以下信息

上图各个名词说明：

top - 13::38:04[当前系统时间]
137 days[系统已经运行了137天]
1 user[个用户当前登录]
load average: 0.10, 0.06, 0.08[系统负载，即任务队列的平均长度]
Tasks: 148 total[总进程数]
1 running[正在运行的进程数]
147 sleeping[睡眠的进程数]
0 stopped[停止的进程数]
0 zombie[冻结进程数]
Cpu(s):14.9%us[用户空间占用CPU百分比]
10.1%sy[内核空间占用CPU百分比]
0.0%ni[用户进程空间内改变过优先级的进程占用CPU百分比]
73.6%id[空闲CPU百分比], 0.0%wa[等待输入输出的CPU时间百分比]
0.0%hi[hi hard interrupt 表示处理硬中断的CPU时间比例]
0.0%si [soft interrupt 表示处理软中断的CPU时间比例]
0.0%st[表示当前系统运行在虚拟机中的时候，被其他虚拟机占用的CPU时间比例]
Mem: 8193180k total[物理内存总量]
6687308k used[使用的物理内存总量]
1505872k free[空闲内存总量]
294676k buffers[用作内核缓存的内存量]
Swap: 0k total[交换区总量]
0k used[使用的交换区总量]
0k free[空闲交换区总量]
2493472k cached[缓冲的交换区总量]


PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND

PID 进程ID
USER 进程所有者的用户名，例如root
PR 进程调度优先级
NI 进程nice值（优先级），越小的值代表越高的优先级
VIRT 进程使用的虚拟内存
RES 进程使用的物理内存（不包括共享内存）
SHR 进程使用的共享内存
CPU 进程使用的CPU占比
MEM 进程使用的内存占比
TIME 进程启动后到现在所用的全部CPU时间
COMMAND 进程的启动命令（默认只显示二进制，top -c能够显示命令行和启动参数）

关于top相关的命令可以去网上搜索下如何使用，这里不做解释。

1.1.2.jstack是java虚拟机自带的一种堆栈跟踪工具

jstack用于生成java虚拟机当前时刻的线程快照。线程快照是当前java虚拟机内每一条线程正在执行的方法堆栈的集合，生成线程快照的主要目的是定位线程出现长时间停顿的原因，如线程间死锁、死循环、请求外部资源导致的长时间等待等。线程出现停顿的时候通过jstack来查看各个线程的调用堆栈，就可以知道没有响应的线程到底在后台做什么事情，或者等待什么资源。如果java程序崩溃生成core文件，jstack工具可以用来获得core文件的java stack和native stack的信息，从而可以轻松地知道java程序是如何崩溃和在程序何处发生问题。

另外，jstack工具还可以附属到正在运行的java程序中，看到当时运行的java程序的java stack和native stack的信息, 如果现在运行的java程序呈现hung的状态，jstack是非常有用的。

它的主要功能：

1．针对活着的进程做本地的或远程的线程dump；

2．针对core文件做线程dump。

So,jstack命令主要用来查看Java线程的调用堆栈的，可以用来分析线程问题（如死锁)。

2.如何使用top+jstack分析线程状态

2.1.找到项目和进程id

使用top命令(查找出哪个进程和项目消耗的cpu高如下图所示所查出结果)


top -c

如图所示我们找到了项目kdzs-buyerInfo的进程id：21161

2.2.查找出该进程下哪个线程消耗的cpu高

使用top命令（显示该进程下的消耗cpu高的线程）


top -H -p [进程PID]

比如输入 top -H -p 21161

如图所示找到了线程id：21338

接下来把此线程id转换为16进制可以输入命令进行转换如下


printf "%x\\n" 【线程id】

也可以使用工具链接转换，拿到我们转换为16进制的线程id：535a

2.3.使用jstack查找这个线程的信息

输入命令


jstack [进程id]|grep -A 20 [线程id的16进制]

输入如：jstack 21161 | grep -A 20 535a

找到线程信息所在然后结合线程状态分析原因。

2.4.快捷查询入口

3. jastck怎么分析线程?

3.1.1.线程状态


NEW,未启动的。不会出现在Dump中。
RUNNABLE,在虚拟机内执行的。运行中状态，可能里面还能看到locked字样，表明它获得了某把锁。
BLOCKED,受阻塞并等待监视器锁。被某个锁(synchronizers)給block住了。
WATING,无限期等待另一个线程执行特定操作。等待某个condition或monitor发生，一般停留在park(), wait(), sleep(),join() 等语句里。
TIMED\_WATING,有时限的等待另一个线程的特定操作。和WAITING的区别是wait() 等语句加上了时间限制 wait(timeout)。
TERMINATED,已退出的。

3.1.2.Monitor

在多线程的 JAVA程序中，实现线程之间的同步，就要说说 Monitor。 Monitor是 Java中用以实现线程之间的互斥与协作的主要手段，它可以看成是对象或者 Class的锁。每一个对象都有，也仅有一个 monitor。下面这个图，描述了线程和 Monitor之间关系，以及线程的状态转换图：

进入区(Entrt Set):表示线程通过synchronized要求获取对象的锁。如果对象未被锁住,则迚入拥有者;否则则在进入区等待。一旦对象锁被其他线程释放,立即参与竞争。

拥有者(The Owner):表示某一线程成功竞争到对象锁。

等待区(Wait Set):表示线程通过对象的wait方法,释放对象的锁,并在等待区等待被唤醒。

从图中可以看出，一个 Monitor在某个时刻，只能被一个线程拥有，该线程就是 “Active Thread”，而其它线程都是 “Waiting Thread”，分别在两个队列 “ Entry Set”和 “Wait Set”里面等候。在 “Entry Set”中等待的线程状态是 “Waiting for monitor entry”，而在“Wait Set”中等待的线程状态是 “in Object.wait()”。先看 “Entry Set”里面的线程。我们称被 synchronized保护起来的代码段为临界区。当一个线程申请进入临界区时，它就进入了 “Entry Set”队列。对应的 code就像：


synchronized(obj) {
.........
}

3.1.3.调用修饰

表示线程在方法调用时,额外的重要的操作。线程Dump分析的重要信息。修饰上方的方法调用。

locked <地址> 目标：使用synchronized申请对象锁成功,监视器的拥有者。

waiting to lock <地址> 目标：使用synchronized申请对象锁未成功,在迚入区等待。

waiting on <地址> 目标：使用synchronized申请对象锁成功后,释放锁幵在等待区等待。

parking to wait for <地址> 目标

locked


at oracle.jdbc.driver.PhysicalConnection.prepareStatement
- locked \<0x00002aab63bf7f58\> (a oracle.jdbc.driver.T4CConnection)
at oracle.jdbc.driver.PhysicalConnection.prepareStatement
- locked \<0x00002aab63bf7f58\> (a oracle.jdbc.driver.T4CConnection)
at com.jiuqi.dna.core.internal.db.datasource.PooledConnection.prepareStatement

通过synchronized关键字,成功获取到了对象的锁,成为监视器的拥有者,在临界区内操作。对象锁是可以线程重入的。

waiting to lock


at com.jiuqi.dna.core.impl.CacheHolder.isVisibleIn(CacheHolder.java:165)
- waiting to lock \<0x0000000097ba9aa8\> (a CacheHolder)
at com.jiuqi.dna.core.impl.CacheGroup$Index.findHolder
at com.jiuqi.dna.core.impl.ContextImpl.find
at com.jiuqi.dna.bap.basedata.common.util.BaseDataCenter.findInfo

通过synchronized关键字,没有获取到了对象的锁,线程在监视器的进入区等待。在调用栈顶出现,线程状态为Blocked。

waiting on


at java.lang.Object.wait(Native Method)
- waiting on \<0x00000000da2defb0\> (a WorkingThread)
at com.jiuqi.dna.core.impl.WorkingManager.getWorkToDo
- locked \<0x00000000da2defb0\> (a WorkingThread)
at com.jiuqi.dna.core.impl.WorkingThread.run

通过synchronized关键字,成功获取到了对象的锁后,调用了wait方法,进入对象的等待区等待。在调用栈顶出现,线程状态为WAITING或TIMED_WATING。

parking to wait for

park是基本的线程阻塞原语,不通过监视器在对象上阻塞。随concurrent包会出现的新的机制,不synchronized体系不同。

3.1.4.线程动作

线程状态产生的原因

runnable:状态一般为RUNNABLE。

in Object.wait():等待区等待,状态为WAITING或TIMED_WAITING。

waiting for monitor entry:进入区等待,状态为BLOCKED。

waiting on condition:等待区等待、被park。

sleeping:休眠的线程,调用了Thread.sleep()。

Wait on condition 该状态出现在线程等待某个条件的发生。具体是什么原因，可以结合 stacktrace来分析。最常见的情况就是线程处于sleep状态，等待被唤醒。常见的情况还有等待网络IO：在java引入nio之前，对于每个网络连接，都有一个对应的线程来处理网络的读写操作，即使没有可读写的数据，线程仍然阻塞在读写操作上，这样有可能造成资源浪费，而且给操作系统的线程调度也带来压力。在 NewIO里采用了新的机制，编写的服务器程序的性能和可扩展性都得到提高。正等待网络读写，这可能是一个网络瓶颈的征兆。因为网络阻塞导致线程无法执行。一种情况是网络非常忙，几乎消耗了所有的带宽，仍然有大量数据等待网络读写；另一种情况也可能是网络空闲，但由于路由等问题，导致包无法正常的到达。所以要结合系统的一些性能观察工具来综合分析，比如 netstat统计单位时间的发送包的数目，如果很明显超过了所在网络带宽的限制 ; 观察 cpu的利用率，如果系统态的 CPU时间，相对于用户态的 CPU时间比例较高；如果程序运行在 Solaris 10平台上，可以用 dtrace工具看系统调用的情况，如果观察到 read/write的系统调用的次数或者运行时间遥遥领先；这些都指向由于网络带宽所限导致的网络瓶颈。

3.1.5.案例分析

（1）运行一段简单代码


/\*\*
 \* @author Shadow
 \*/
public class JStackDemo1 {
 public static void main(String[] args) {
 while (true) {
 //Do Nothing
 }
 }
}

先使用命令jps查看进程号:


kdzs-data git:(master-trade-info) jps
29788 JStackDemo1
29834 Jps

然后使用命令jstack 查看堆栈信息


kdzs-data git:(master-trade-info) jstack 29788
"main" prio=10 tid=0x00007f197800a000 nid=0x7462 runnable [0x00007f197f7e1000]
 java.lang.Thread.State: RUNNABLE
 at javaCommand.JStackDemo1.main(JStackDemo1.java:7)

由此可见：当前一共有一条用户级别线程,线程处于runnable状态，执行到JStackDemo1.java的第七行。

（2）再运行下一段代码


/\*\*
 \* @author Shadow
 \*/
public class JStackDemo1 {
 public static void main(String[] args) {
 Thread thread = new Thread(new Thread1());
 thread.start();
 }
}
class Thread1 implements Runnable{
 @Override
 public void run() {
 while(true){
 System.out.println(1);
 }
 }
}

打出堆栈信息


"Reference Handler" daemon prio=10 tid=0x00007fbbcc06e000 nid=0x286c in Object.wait() [0x00007fbbc8dfc000]
 java.lang.Thread.State: WAITING (on object monitor)
 at java.lang.Object.wait(Native Method)
 - waiting on \<0x0000000783e066e0\> (a java.lang.ref.Reference$Lock)
 at java.lang.Object.wait(Object.java:503)
 at java.lang.ref.Reference$ReferenceHandler.run(Reference.java:133)
 - locked \<0x0000000783e066e0\> (a java.lang.ref.Reference$Lock)

我们能看到：

线程的状态： WAITING 线程的调用栈线程的当前锁住的资源： <0x0000000783e066e0> 线程当前等待的资源：<0x0000000783e066e0>

为什么同时锁住的等待同一个资源？

**线程的执行中，先获得了这个对象的 Monitor（对应于 locked <0x0000000783e066e0>）。当执行到 obj.wait(), 线程即放弃了 Monitor的所有权，进入 “wait set”队列（对应于 waiting on <0x0000000783e066e0> 。

（3）死锁分析

啥叫死锁？所谓死锁：是指两个或两个以上的进程在执行过程中，由于竞争资源或者由于彼此通信而造成的一种阻塞的现象，若无外力作用，它们都将无法推进下去。此时称系统处于死锁状态或系统产生了死锁，这些永远在互相等待的进程称为死锁进程。说白了，我现在想吃鸡蛋灌饼，桌子上放着鸡蛋和饼，但是我和我的朋友同时分别拿起了鸡蛋和饼子，我手里拿着鸡蛋，但是我需要他手里的饼。他手里拿着饼，但是他想要我手里的鸡蛋。就这样，如果不能同时拿到鸡蛋和饼，那我们就不能继续做后面的工作（做鸡蛋灌饼）。所以，这就造成了死锁。看一段死锁的程序：


package javaCommand;
/\*\*
 \* @author Shadow
 \*/
public class JStackDemo {
 public static void main(String[] args) {
 Thread t1 = new Thread(new DeadLockclass(true));//建立一个线程
 Thread t2 = new Thread(new DeadLockclass(false));//建立另一个线程
 t1.start();//启动一个线程
 t2.start();//启动另一个线程
 }
}
class DeadLockclass implements Runnable {
 public boolean falg;// 控制线程
 DeadLockclass(boolean falg) {
 this.falg = falg;
 }
 public void run() {
 /\*\*
 \* 如果falg的值为true则调用t1线程
 \*/
 if (falg) {
 while (true) {
 synchronized (Suo.o1) {
 System.out.println("o1 " + Thread.currentThread().getName());
 synchronized (Suo.o2) {
 System.out.println("o2 " + Thread.currentThread().getName());
 }
 }
 }
 }
 /\*\*
 \* 如果falg的值为false则调用t2线程
 \*/
 else {
 while (true) {
 synchronized (Suo.o2) {
 System.out.println("o2 " + Thread.currentThread().getName());
 synchronized (Suo.o1) {
 System.out.println("o1 " + Thread.currentThread().getName());
 }
 }
 }
 }
 }
}
class Suo {
 static Object o1 = new Object();
 static Object o2 = new Object();
}

运行结果

我们发现，程序只输出了两行内容，然后程序就不再打印其它的东西了，但是程序并没有停止。这样就产生了死锁。当线程1使用synchronized锁住了o1的同时，线程2也是用synchronized锁住了o2。当两个线程都执行完第一个打印任务的时候，线程1想锁住o2，线程2想锁住o1。但是，线程1当前锁着o1，线程2锁着o2。所以两个想成都无法继续执行下去，就造成了死锁。

我们使用jstack来看一下线程堆栈信息：


Found one Java-level deadlock:
=============================
"Thread-1":
 waiting to lock monitor 0x00007f0134003ae8 (object 0x00000007d6aa2c98, a java.lang.Object),
 which is held by "Thread-0"
"Thread-0":
 waiting to lock monitor 0x00007f0134006168 (object 0x00000007d6aa2ca8, a java.lang.Object),
 which is held by "Thread-1"
Java stack information for the threads listed above:
===================================================
"Thread-1":
 at javaCommand.DeadLockclass.run(JStackDemo.java:40)
 - waiting to lock \<0x00000007d6aa2c98\> (a java.lang.Object)
 - locked \<0x00000007d6aa2ca8\> (a java.lang.Object)
 at java.lang.Thread.run(Thread.java:745)
"Thread-0":
 at javaCommand.DeadLockclass.run(JStackDemo.java:27)
 - waiting to lock \<0x00000007d6aa2ca8\> (a java.lang.Object)
 - locked \<0x00000007d6aa2c98\> (a java.lang.Object)
 at java.lang.Thread.run(Thread.java:745)
Found 1 deadlock.

堆栈写的很明显，它告诉我们 Found one Java-level deadlock，然后指出造成死锁的两个线程的内容。然后，又通过 Java stack information for the threads listed above来显示更详细的死锁的信息。

Thread-1在想要执行第40行的时候，当前锁住了资源\<0x00000007d6aa2ca8\>,但是他在等待资源\<0x00000007d6aa2c98\>Thread-0在想要执行第27行的时候，当前锁住了资源\<0x00000007d6aa2c98\>,但是他在等待资源\<0x00000007d6aa2ca8\> 由于这两个线程都持有资源，并且都需要对方的资源，所以造成了死锁。原因我们找到了，就可以具体问题具体分析，解决这个死锁了。

java设计规范和设计模式

如何查看占用cpu较高的线程？