(一)jvm中对象的分配


虚拟机在代码里面碰到new关键字的时候,操作流程:
User u = new User();
1. 检查加载(检查这个u是否被加载进来了,如果没有加载进来就会抛出一些异常出来)
2. 分配内存: 对new出来的对象分配内存,划分内存区域,使用两种方式 ,一是指针碰撞,二是空闲列表 ,两种方式主要取决于垃圾回收算法,在分配内存的时候还需要注意并发安全的问题(方法是多个线程可能同时进行的),解决办法就是CAS机制
3. 内存空间的初始化(注意不是构造方法)内存分配完成后,虚拟机需要将分配到的内存空间都初始化为零值(如int值为0,boolean值为false等等)。这一步操作保证了对象的实例字段在Java代码中可以不赋初始值(没有手动赋值)就直接使用,程序能访问到这些字段的数据类型所对应的零值。
4. 设置, 接下来,虚拟机要对对象进行必要的设置,例如这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的GC分代年龄等信息。这些信息存放在对象的对象头之中。
5. 对象初始化 : (就是执行了构造方法)在上面工作都完成之后,从虚拟机的视角来看,一个新的对象已经产生了,但从Java程序的视角来看,对象创建才刚刚开始,所有的字段都还为零值。所以,一般来说,执行new指令之后会接着把对象按照程序员的意愿进行初始化,这样一个真正可用的对象才算完全产生出来。

1.并发安全

除如何划分可用空间之外,还有另外一个需要考虑的问题是对象创建在虚拟机中是非常频繁的行为,即使是仅仅修改一个指针所指向的位置,在并发情况下也并不是线程安全的,可能出现正在给对象A分配内存,指针还没来得及修改,对象B又同时使用了原来的指针来分配内存的情况。
解决办法:

1. CAS机制(具体的看并发编程)

解决这个问题有两种方案,一种是对分配内存空间的动作进行同步处理——实际上虚拟机采用CAS配上失败重试的方式保证更新操作的原子性;

2. 本地线程的分配缓冲

空间换时间思想

另一种是把内存分配的动作按照线程划分在不同的空间之中进行,即每个线程在Java堆中预先分配一小块私有内存,也就是本地线程分配缓冲(Thread Local Allocation Buffer,TLAB),如果设置了虚拟机参数 -XX:+UseTLAB,在线程初始化时,同时也会申请一块指定大小的内存,只给当前线程使用,这样每个线程都单独拥有一个Buffer,如果需要分配内存,就在自己的Buffer上分配,这样就不存在竞争的情况,可以大大提升分配效率,当Buffer容量不够的时候,再重新从Eden区域申请一块继续使用。
TLAB的目的是在为新对象分配内存空间时,让每个Java应用线程能在使用自己专属的分配指针来分配空间(Eden区,默认Eden的1%),减少同步开销。
TLAB只是让每个线程有私有的分配指针,但底下存对象的内存空间还是给所有线程访问的(类似于堆),只是其它线程无法在这个区域分配而已。当一个TLAB用满(分配指针top撞上分配极限end了),就新申请一个TLAB。


什么时候会用CAS什么时候会用分配缓冲? 如果对象超过Eden区的百分之1的话,就会使用CAS机制(结论是否正确有待考究)


2.指针碰撞 (java堆内存空间规整的情况下使用)

如果Java堆中内存是绝对规整的,所有用过的内存都放在一边,空闲的内存放在另一边,中间放着一个指针作为分界点的指示器,那所分配内存就仅仅是把那个指针向空闲空间那边挪动一段与对象大小相等的距离,这种分配方式称为“指针碰撞”。

对象分配 - 图1

3.空闲列表 (java堆空间不规整的情况下使用)

如果Java堆中的内存并不是规整的,已使用的内存和空闲的内存相互交错,那就没有办法简单地进行指针碰撞了,虚拟机就必须维护一个列表,记录上哪些内存块是可用的,在分配的时候从列表中找到一块足够大的空间划分给对象实例,并更新列表上的记录,这种分配方式称为“空闲列表”。
选择哪种分配方式由Java堆是否规整决定,而Java堆否规整又由所采用的垃圾收集器是否带有压缩整理功能决定。

左边就是空闲列表,从0索引开始计算,划上钩子的就是使用的,划上叉的就是没有使用,分配对象的时候先去空闲列表里面找空间的地方,找到了就分配内存.
对象分配 - 图2


4.Java对象的大小


基本数据的类型的大小是固定的,这里就不多说了。对于非基本类型的Java对象,其大小就值得商榷。
在Java中,一个空Object对象的大小是8byte,这个大小只是保存堆中一个没有任何属性的对象的大小。看下面语句:


Object ob = new Object();


这样在程序中完成了一个Java对象的生命,但是它所占的空间为:4byte+8byte。4byte是上面部分所说的Java栈中保存引用的所需要的空间。而那8byte则是Java堆中对象的信息。因为所有的Java非基本类型的对象都需要默认继承Object对象,因此不论什么样的Java对象,其大小都必须是大于8byte。
有了Object对象的大小,我们就可以计算其他对象的大小了。

Class NewObject {
int count;
boolean flag;
Object ob;
}



其大小为:空对象大小(8byte)+int大小(4byte)+Boolean大小(1byte)+空Object引用的大小(4byte)=17byte。但是因为Java在对对象内存分配时都是以8的整数倍来分,因此大于17byte的最接近8的整数倍的是24,因此此对象的大小为24byte。


这里需要注意一下基本类型的包装类型的大小。因为这种包装类型已经成为对象了,因此需要把他们作为对象来看待。包装类型的大小至少是12byte(声明一个空Object至少需要的空间),而且12byte没有包含任何有效信息,同时,因为Java对象大小是8的整数倍,因此一个基本类型包装类的大小至少是16byte。这个内存占用是很恐怖的,它是使用基本类型的N倍(N>2),有些类型的内存占用更是夸张(随便想下就知道了)。因此,可能的话应尽量少使用包装类。在JDK5.0以后,因为加入了自动类型装换,因此,Java虚拟机会在存储方面进行相应的优化。




(二)对象的内存布局

对象分配 - 图3
在HotSpot虚拟机中,对象在内存中存储的布局可以分为3块区域:
1. 对象头(Header)
2. 实例数据(Instance Data)
3. 对齐填充(Padding)。

对象头包括两部分信息,第一部分用于存储对象自身的运行时数据,如哈希码(HashCode)(每个Object都有)、GC标志(垃圾回收的一些年龄)、对象分代年龄、锁状态标志(并发编程状态,对象是不是被锁定了)、线程持有的锁、偏向线程ID、偏向时间戳等。
对象头的另外一部分是类型指针(就是对象是哪个类的实例),即对象指向它的类元数据的指针,虚拟机通过这个指针来确定这个对象是哪个类的实例。
第二部分:实例数据是我们初始化的数据,比如int是1或者是0,String是字符串,Object所谓的赋值的一些信息.
第三部分对齐填充并不是必然存在的,也没有特别的含义,它仅仅起着占位符的作用。由于HotSpot VM的自动内存管理系统要求对对象的大小必须是8字节的整数倍.也就是说 对象头+实例数据+对齐填充 三个必须是8的整数倍,如果不是8的整数倍就需要对齐填充,填充成8的整数倍.

(三)对象的访问定位

建立对象是为了使用对象,我们的Java程序需要通过栈上的reference数据来操作堆上的具体对象。目前主流的访问方式有使用句柄和直接指针两种方式。
对象分配 - 图4

1.句柄


句柄就是特殊的指针

句柄和指针区别是, 指针是指到哪里就是直接的内存地址,句柄是需要句柄池来管理,通过所谓的重定位的内存地址.

如果使用句柄访问的话,那么Java堆中将会划分出一块内存来作为句柄池,reference中存储的就是对象的句柄地址,而句柄中包含了对象实例数据与类型数据各自的具体地址信息。

句柄的效率不如直接指针高.现在基本上都不使用句柄了.

2.直接指针


如果使用直接指针访问, reference中存储的直接就是对象地址。
这两种对象访问方式各有优势,使用句柄来访问的最大好处就是reference中存储的是稳定的句柄地址,在对象被移动(垃圾收集时移动对象是非常普遍的行为)时只会改变句柄中的实例数据指针,而reference本身不需要修改。

使用直接指针访问方式的最大好处就是速度更快,它节省了一次指针定位的时间开销,由于对象的访问在Java中非常频繁,因此这类开销积少成多后也是一项非常可观的执行成本。

缺点:如果对象消失了,需要对本地变量表的reference做修改, 如果是用句柄的方式的话,对象消失了是不需要对本地变量表进行修改的,只需要修改句柄池就行了.

虚拟机更看重的是对 对象 的访问速度,所以对Sun HotSpot而言,它是使用直接指针访问方式进行对象访问的。