**
技术支持联盟
摘要:JVM是java程序的运行环境,了解JVM基本结构和运行方式,有助于深入地理解 Java语言,快速定位开发问题,提升代码质量。下面主要局JVN的内存模型进行简要介绍。
JMV是什么
JVM它是Java Virtual Machine 的缩写,主要是通过在实际计算机模仿各种计算机功能来实现的,组成部分包括堆、方法区、栈、本地方法栈、程序计算器等部分组成的,其中方法回收堆和方法区是共享区,而栈和程序计算器、本地方法栈区是归JVM的。Java能够被称为“一次编译,到处运行”的原因就是Java屏蔽了很多的操作系统平台相关信息,使得Java只需要生成在JVM虚拟机运行的目标代码也就是所说的字节码,就可以在多种平台运行。
JRE、JVM、JDK三者的关系
JDK是Java程序员常用的开发包、目的就是用来编译和调试Java程序的。JRE是指Java运行环境,也就是写好的程序必须在JRE才能够运行。JVM是Java虚拟机的缩写,是指负责将字节码解释成为特定的机器码进行运行,值得注意的是在运行过程中,Java源程序需要通过编译器编译为.class文件,否则JVM不认识。
JVM生命周期
JVM实例和JVM执行引擎实例
(1)JVM实例对应了一个独立运行的java程序——进程级别。一个运行时的Java虚拟机(JVM)负责运行一个Java程序。
当启动一个Java程序时,一个虚拟机实例诞生;当程序关闭退出,这个虚拟机实例也就随之消亡。
如果在同一台计算机上同时运行多个Java程序,将得到多个Java虚拟机实例,每个Java程序都运行于它自己的Java虚拟机实例中。
(2)JVM执行引擎实例则对应了属于运行程序的线程——线程级别。
JVM生命周期
(1)JVM实例的诞生
当启动一个Java程序时,一个JVM实例就产生了,任何一个拥有public static void main(String[] args)函数的class都可以作为JVM实例运行的起点?。
(2)JVM实例的运行
main()作为该程序初始线程的起点,任何其他线程均由该线程启动。JVM内部有两种线程:守护线程和非守护线程,main()属于非守护线程,守护线程通常由JVM自己使用,java程序也可以标明自己创建的线程是守护线程。?
(3)JVM实例的消亡
当程序中的所有非守护线程都终止时,JVM才退出;若安全管理器允许,程序也可以使用java.lang.Runtime类或者java.lang.System.exit()来退出。
JVM内存模型组成
JVM内存模型主要由堆内存、方法区、程序计数器、虚拟机栈和本地方法栈组成,其组成的结构如下图所示:
其中,堆和方法区是所有线程共有的,而虚拟机栈,本地方法栈和程序计数器则是线程私有的。
堆内存
堆内存是Java虚拟机所管理的内存中最大的一块存储区域。堆内存被所有线程共享。主要存放使用new关键字创建的对象。所有对象实例以及数组都要在堆上分配。垃圾收集器就是根据GC算法,收集堆上对象所占用的内存空间(收集的是对象占用的空间而不是对象本身)。
JVM堆分为新生代和老年代,新生代又分为Eden、SurvivorFrom区、SurvivorTo区,具体关系如下图:
方法区
方法区与Java堆一样,是各个线程共享的区域,它用于存储已被虚拟机加载的类信息,常量,静态变量,即时编译(JIT)后的代码等数据。
由于程序中所有的线程共享一个方法区,所以访问方法区的信息必须确保线程是安全的。如果有两个线程同时去加载一个类,那么只能有一个线程被允许去加载这个类,另一个必须等待。
在程序运行时,方法区的大小是可以改变的,程序在运行时可以扩展。同时,方法区里面的对象也可以被垃圾回收,但条件非常严苛,必须在该类没有任何引用的情况下才能被GC回收。
程序计数器
在JVM的概念模型里,字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令。分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。
JVM的多线程是通过线程轮流切换并分配处理器执行时间的方式来实现的,为了各条线程之间的切换后计数器能恢复到正确的执行位置,所以每条线程都会有一个独立的程序计数器。
当线程正在执行一个Java方法,程序计数器记录的是正在执行的JVM字节码指令的地址;如果正在执行的是一个Natvie(本地方法),那么这个计数器的值则为空(Underfined)。
程序计数器占用的内存空间很少,也是唯一一个在JVM规范中没有规定任何OutOfMemoryError(内存不足错误)的区域。
Java虚拟机栈
与程序计数器一样,Java虚拟机栈也是线程私有的,用通俗的话将它就是我们常常听说到堆栈中的那个“栈内存”。虚拟机栈描述的是Java方法执行的内存模型:每个方法在执行的同时都会创建一个栈帧(Stack Frame)用于存储局部变量表(局部变量表需要的内存在编译期间就确定了所以在方法运行期间不会改变大小),操作数栈,动态链接,方法出口等信息。每一个方法从调用至出栈的过程,就对应着栈帧在虚拟机中从入栈到出栈的过程。
本地方法栈
主要用于存储本地方法的局部变量表,本地方法的操作数栈等信息。当栈内的数据在超出其作用域后,会被自动释放掉。本地方法栈是在程序调用或JVM调用本地方法接口(Native)时候启用。
Java内存模型与硬件内存架构的关系如下图:
jvm类加载
JVM加载的是.class文件。其实,类的加载指的是将类的.class文件中的二进制数据读入到内存中,将其放在运行时数据区的方法区内,然后在堆区创建一个java.lang.Class对象,用来封装类在方法区内的数据结构。类的加载的最终产品是位于堆区中的Class对象,Class对象封装了类在方法区内的数据结构,并且向Java程序员提供了访问方法区内的数据结构的接口。
类的加载过程
JVM将类的加载分为3个步骤:
装载(Load)->链接(Link)->初始化(Initialize)
而连接(Link)又分为三个步骤:
验证->准备->解析
1、装载
加载是类加载过程的第一个阶段,在加载阶段,虚拟机需要完成以下三件事情:
(1)通过一个类的全限定名来获取其定义的二进制字节流。
(2)将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构。
(3)在Java堆中生成一个代表这个类的java.lang.Class对象,作为对方法区中这些数据的访问入口。
相对于类加载的其他阶段而言,加载阶段是获取类的二进制字节流的最佳阶段,因为开发人员既可以使用系统提供的类加载器来完成加载,也可以自定义自己的类加载器来完成加载。
加载阶段完成后,虚拟机外部的 二进制字节流就按照虚拟机所需的格式存储在方法区之中,而且在Java堆中也创建一个java.lang.Class类的对象,这样便可以通过该对象访问方法区中的这些数据。
2、链接
链接阶段分为三个步骤:验证、准备和解析。
验证:确保被加载的类的正确性;
准备:为类的静态变量分配内存,并将其初始化为默认值;
解析:把类中的符号引用转换为直接引用。
(1)验证
验证是链接第一步,这一阶段的目的是为了确保Class文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身的安全。验证阶段大致会完成4个阶段的检验动作:
文件格式验证:验证字节流是否符合Class文件格式的规范;例如:是否以0xCAFEBABE开头、主次版本号是否在当前虚拟机的处理范围之内、常量池中的常量是否有不被支持的类型。
元数据验证:对字节码描述的信息进行语义分析(注意:对比javac编译阶段的语义分析),以保证其描述的信息符合Java语言规范的要求;例如:这个类是否有父类,除了java.lang.Object之外。
字节码验证:通过数据流和控制流分析,确定程序语义是合法的、符合逻辑的。
符号引用验证:确保解析动作能正确执行。
验证阶段是非常重要的,但不是必须的,它对程序运行期没有影响,如果不需要验证,那么可以考虑采用-Xverifynone参数来关闭大部分的类验证措施,以缩短虚拟机类加载的时间。
(2)准备
准备阶段是正式为类变量分配内存并设置类变量初始值的阶段,这些内存都将在方法区中分配。对于该阶段有以下几点需要注意:
a、时候进行内存分配的仅包括类变量(static),而不包括实例变量,实例变量会在对象实例化时随着对象一块分配在Java堆中。
b、这里所设置的初始值通常情况下是数据类型默认的零值(如0、0L、null、false等),而不是被在Java代码中被显式地赋予的值。
(3)解析
解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程,解析动作主要针对类或接口、字段、类方法、接口方法、方法类型、方法句柄和调用限定符7类符号引用进行。符号引用就是一组符号来描述目标,可以是任何字面量。直接引用就是直接指向目标的指针、相对偏移量或一个间接定位到目标的句柄。
3、初始化
初始化,为类的静态变量赋予正确的初始值,JVM负责对类进行初始化,主要对类变量进行初始化。在Java中对类变量进行初始值设定有两种方式:
1)声明类变量是指定初始值。
2)使用静态代码块为类变量指定初始值。
类的初始化步骤或JVM初始化的步骤如下:
1)如果这个类还没有被加载和链接,那先进行加载和链接 ;
2)假如这个类存在直接父类,并且这个类还没有被初始化(注意:在一个类加载器中,类只能初始化一次),那就初始化直接的父类(不适用于接口);
3 ) 假如类中存在初始化语句(如static变量和static块),那就依次执行这些初始化语句。
Class类加载器
JVM的类加载是通过ClassLoader及其子类来完成的,类的层次关系和加载顺序可以由下图来描述:
双亲委派加载机制
JVM类加载时采用双亲委派机制。双亲委派机制是指当一个类加载器收到一个类加载请求时,该类加载器首先会把请求委派给父类加载器。每个类加载器都是如此,只有在父类加载器在自己的搜索范围内找不到指定类时,子类加载器才会尝试自己去加载。保证在复杂的类依赖关系中,类加载的顺序性、唯一性和安全性。
图中的蓝色箭头是向上委派加载过程,保证类加载的有序性和安全性;红色箭头表示向下委派加载过程,保障所有类都被加载。
对象存储空间
对象存在堆内存中,具体的存储位置与对象的生命周期有关。
新生代的对象
系统中创建的对象均保存在堆内存中,新生代存储“新生对象”,我们新创建的对象存储在新生代中。当新生内存占满后,会触发Minor GC,清理新生代内存空间。
新生代主要有以下三个特点:
1、除大对象外,JVM新创建的对象存储的对方
2、对象的创建和销毁最频繁的区域
3、会频繁触发MinorGC进行垃圾回收动作。
新生代分为Eden区、SurvivorFrom区和SurvivorTo区,通过三个区的内存交换来完成垃圾回收过程的,具体流程如下:
JVM新生对象周期由MinorGC决定,新创建的对象首先在Eden区。当Eden区没有足够的内存空间时,会触发MinorGC。MirnorGC采用复制算法,具体过程分为以下四步:
第一步,把Eden区和SurvivorFrom区存货的对象复制到SurvivorTo区,同时把这些对象的年龄加1,如下图:
第二步:若有些对象年龄已达到老年代的标准或ServivorTo区内存不足时,曾将对象复制到老年代,如下图:
第三步:清除Eden区和ServivorFrom区,如下图:
第四步:将ServivorTo区和ServivorFrom区互换,如下图:
老年代的对象
老年代存储长期存活的对象和大对象,老年代的对象比较稳定,通过MajorGC过程回收,且MajorGC过程不会频繁触发。当老年代空间占满后,会触发MajorGC。
注:MajorGC是清理整个堆空间,包括年轻代和老年代。如果MajorGC之后,堆中仍然无法存储对象,就会抛出OutOfMemoryError异常。