转载:《JVM笔记9-Class类文件结构》

概述

Class 文件是一组以 8 位字节为基础单位的二进制流,各个数据项目严格按照顺序紧凑地排列在 Class 文件之中,中间没有添加任何分隔符,这使得整个 Class 文件中存储的内容几乎全部是程序运行的必要数据,没有空隙存在。

当遇到需要占用 8 位字节以上空间的数据项时,则会按照高位在前(Big-Endian)的方式分割成若干个 8 位字节进行存储。

根据 Java 虚拟机规范的规定,Class 文件格式采用一种类似于 C 语言结构体的伪结构来存储数据,这种伪结构中只有两种数据类型:无符号数和表,后面的解析都要以这两种数据类型为基础,所以这里要先介绍这两个概念。

  • 无符号数属于基本的数据类型,以 u1、u2、u4、u8 来分别代表 1 个字节、2 个字节、4 个字节和 8 个字节的无符号数,无符号数可以用来描述数字索引引用数量值或者按照 UTF-8 编码构成字符串值

  • 表是由多个无符号数或者其他表作为数据项构成的复合数据类型,所有表都习惯性地以 “_info” 结尾。表用于描述有层次关系的复合结构的数据,整个 Class 文件本质上就是一张表,它由如下表所示的数据项构成。

类型 名称 数量 备注
u4 magic 1 魔数
u2 minor_version 1 次版本号
u2 major_version 1 主版本号
u2 constant_pool_count 1 常量个数
cp_info constant_pool constant_pool_count – 1 常量池表项
u2 access_flags 1 类的访问控制符
u2 this_class 1 当前类的全限定名索引
u2 super_class 1 父类的全限定名索引
u2 interfaces_count 1 接口数量
u2 interfaces interface_count 接口的全限定名索引列表
u2 fields_count 1 字段数量
field_info fields fields_count 字段表表项
u2 methods_count 1 方法数量
method_info methods methods_count 方法表表项
u2 attributes_count 1 附加属性数量
attribute_info attributes attributes_count 附加属性表表项

无论是无符号数还是表,当需要描述同一类型但数量不定的多个数据时,经常会使用一个前置的容量计数器,加若干个连续的数据项的形式,这时称这一系列的某一类型的数据为某一类型的集合。

Class 的结构不像 XML 等描述语言,由于它没有任何分隔符号,所以上面表中的数据项,无论是顺序还是数量,甚至于数据存储的字节序(Byte Ordering,Class 文件中字节序为 Big-Endian)这样的细节,都是被严格限定的,哪个字节代表什么含义,长度是多少,先后顺序如何,都不允许改变。

Class 文件中的信息内容:

  • 魔数
  • Class 文件版本
  • 常量池
  • 访问标志
  • 类索引、父类索引、接口索引集合
  • 字段表集合
  • 方发表集合
  • 属性表集合

Java 类:

  1. public class HelloWorld {
  2. public static void main(String[] args) {
  3. System.out.println("Hello World");
  4. }
  5. }

通过 Binary Viewer 查看编译后的 Class 文件:

作者:殷建卫 链接:https://www.yuque.com/yinjianwei/vyrvkf/ar30va 来源:殷建卫 - 架构笔记 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。