01|JVM整体架构

根据JVM规范,JVM内存共分为虚拟机栈、堆、方法区、程序计数器、本地方法栈五个部分。
image.png

程序计数器

线程私有;当前线程所执行字节码的行号指示器,通过修改指示器来选去下一条需要执行的字节码指令;如果线程正在执行的是一个Java方法,这个计数器记录的是正在执行的虚拟机字节码指令的地址;如果正在执行的是本地(Native)方法,这个计数器值则应为空(Undefined)。此内存区域是唯一一个在《Java虚拟机规范》中没有规定任何OutOfMemoryError情况的区域。

虚拟机栈

线程私有;生命周期与线程相同。
虚拟机栈描述的是Java方法执行的线程内存模型:每个方法被执行的时候,Java虚拟机都会同步创建一个栈帧用于存储基本数据类型的局部变量表、操作数栈、动态连接、方法出口等信息。每一个方法被调用直至执行完毕的过程,就对应着一个栈帧在虚拟机栈中从入栈到出栈的过程。
局部变量表存放了编译器可知的各种Java虚拟机基本数据类型对象引用,这些数据类型在局部变量表中的存储空间以局部变量槽(Slot)表示表示,其中64位长度的long和double类型的数据会占用两个变量槽,其余的数据类型只会占用一个。局部变量表所需的内存空间在编译器完成分配,在方法运行期间不会改变局部变量表的大小。(这里的大小是指变量槽的数量,虚拟机真正使用多大的内存空间来实现一个变量槽,由具体的虚拟机实现自行决定)
如果线程请求的栈深度大于虚拟机所允许的深度,将抛出StackOverflowError异常;如果Java虚拟机栈容量可以动态扩展,当栈扩展时无法申请到足够的内存将会抛出OutOfMemoryError异常。

本地方法栈

与虚拟机栈类似,区别在于虚拟机栈对应Java方法服务,本地方法栈未本地(Native)方法服务。

Java堆

所有线程共享;是虚拟机管理内存最大的一块。在虚拟机启动时创建。唯一目的就是存放对象实例。
java堆事垃圾收集器管理的内存区域。如果在Java堆中没有内存完成实例分配,并且堆也无法再拓展时,Java虚拟机将会抛出OutOfMemoryError异常。

方法区(非堆)

所有线程共享;用于存储已被虚拟机加载的类型信息、常量、静态变量、即时编译器编译后的代码缓存等数据。
Java8以前方法区可以称为“永久代”,Java8以后废弃了永久代的概念,改用在本地内存中实现元空间(Meta-space)来代替

运行时常量池

方法区的一部分,用于存放编译器生成的各种字面量与符号引用。

直接内存

直接内存(Direct Memory)并不是虚拟机运行时数据区的一部分,也不是《Java虚拟机规范》中定义的内存区域。但是这部分内存也被频繁地使用,而且也可能导致OutOfMemoryError异常。
在JDK 1.4中新加入了NIO(New Input/Output)类,引入了一种基于通道(Channel)与缓冲区(Buffer)的I/O方式,它可以使用Native函数库直接分配堆外内存,然后通过一个存储在Java堆里面的DirectByteBuffer对象作为这块内存的引用进行操作。这样能在一些场景中显著提高性能,因为避免了在Java堆和Native堆中来回复制数据。显然,本机直接内存的分配不会受到Java堆大小的限制,但是,既然是内存,则肯定还是会受到本机总内存(包括物理内存、SWAP分区或者分页文件)大小以及处理器寻址空间的限制,一般服务器管理员配置虚拟机参数时,会根据实际内存去设置-Xmx等参数信息,但经常忽略掉直接内存,使得各个内存区域总和大于物理内存限制(包括物理的和操作系统级的限制),从而导致动态扩展时出现OutOfMemoryError异常。

JVM分为五大模块:

  • 类装载器子系统
  • 运行时数据区
  • 执行引擎
  • 本地方法接口
  • 垃圾收集模块

    image.png

    02|JVM运行时内存

    Java7和Java8内存结构的区别
    image.png
    image.png
    Java8虚拟机内存详解
    image.png
    方法区Java8之后的变化:

  • 移除了永久代(PermGen),替换为元空间(Metaspace)

  • 永久代中的class metadata(类元信息)转移到了native memory(本地内存,而不是虚拟机)
  • 永久代中的interned Strings(字符串常量池)和class staticvariables(类静态变量)转移到类Java heap
  • 永久代参数(PermSize MaxPermSize)->元空间参数(MataspaceSize MaxMetaspaceSize)

Java8为什么要将永久代替换成Metaspace?

  • 字符串存在永久代中,容易出现性能问题和内存溢出
  • 类及方法的信息等比较难确定其大小,因此对于永久代的大小指定比较困难,太小容易出现永久代溢出,太小则容易出现老年代溢出
  • 永久代会为GC带来不必要的复杂度,并且回收效率偏低

    02|HotSpot虚拟机

    对象的创建过程
    1. new 指令
    1. 在常量池中定位类的符号引用
    1. 检查类是否已经被加载、解析和初始化过,如没有则执行相应的类加载过程
    1. 为新生对象分配内存(所需内存大小在类加载完成之后确定)。注:如果内存是规整的,则使用“指针碰撞”进行分配,如果内存不规整,虚拟机就必须维护一个列表,记录可使用的内存块,在分配的时候需找足够大的一块分配给对象实例,并更新内存列表记录,这种称为“空闲列表”。选择哪种方式由堆内存是否规整决定,内存是否规则由垃圾收集器是否带有压缩整理功能决定。带压缩整理功能的收集器:Serial、ParNew。保证内存分配线程安全的两种方式:
      • ①CAS+失败重试;
      • ②本地线程分配缓冲(Thread Local Allocation Buffer,TLAB),把内存分配的动作按照线程划分在不用的空间上进行,即每个线程在Java堆中预先分配一小块内存;虚拟机配置是否使用TLAB命令: -XX:+/-UseTLAB。
    1. 将分配到的内存空间初始化为零值(不包含对象头),使用TLAB,这一工作可以提前至TLAB分配时进行。
    1. 设置对象头信息,头信息包括元数据信息、对象的哈希码、对象的GC分代信息等。
    1. 执行对象方法
      对象的内存布局
      对象在堆内存中的存储布局可以划分为三个部分:对象头(Header)、实例数据(Instance Data)、和对齐填充(Padding)。
  • 对象头:对象头包含两类信息:

    • 第一类:运行时数据,如哈希码、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等。
    • 第二类:类型指针,即对象指向它的类型元数据的指针,Java虚拟机通过这个指针来确定该对象是哪个类的实例。

如果Java对象是一个Java数组,那在对象头中还必须有一块用于记录数组长度的数据。

  • 实例数据

存储对象真正的有效信息,即在代码中定义的各种类型和字段内容,存储顺序受到虚拟机分配策略参数(-XX:FieldAllocationStyle)和字段在java源码中定义顺序的影响

  • 对齐填充

并非必然存在,仅起到占位符的作用,HotSpot虚拟机的自动内存管理系统要求对象的起始地址必须是8字节的整数倍,因此,如果对象实例数据部分没有对齐的话,就需要通过对齐填充来补全。

对象的访问定位

访问对象的两种方式:

  • 句柄

01|Java内存区域 - 图7
Java堆中将可能会划分出一块内存作为句柄池,reference中存储的就是对象的句柄地址,而句柄中包含了对象实例数据与类型数据各自具体的地址信息。

  • 直接指针

image.png

reference中存储的直接就是对象地址,如果只是访问对象本身的话,就不需要多一次间接访问的开销。