概述
Class 文件是一组以 8 位字节为基础单位的二进制流,各个数据项目严格按照顺序紧凑地排列在 Class 文件之中,中间没有添加任何分隔符,这使得整个 Class 文件中存储的内容几乎全部是程序运行的必要数据,没有空隙存在。
当遇到需要占用 8 位字节以上空间的数据项时,则会按照高位在前(Big-Endian)的方式分割成若干个 8 位字节进行存储。
根据 Java 虚拟机规范的规定,Class 文件格式采用一种类似于 C 语言结构体的伪结构来存储数据,这种伪结构中只有两种数据类型:无符号数和表,后面的解析都要以这两种数据类型为基础,所以这里要先介绍这两个概念。
无符号数属于基本的数据类型,以 u1、u2、u4、u8 来分别代表 1 个字节、2 个字节、4 个字节和 8 个字节的无符号数,无符号数可以用来描述数字、索引引用、数量值或者按照 UTF-8 编码构成字符串值。
表是由多个无符号数或者其他表作为数据项构成的复合数据类型,所有表都习惯性地以 “_info” 结尾。表用于描述有层次关系的复合结构的数据,整个 Class 文件本质上就是一张表,它由如下表所示的数据项构成。
类型 | 名称 | 数量 | 备注 |
---|---|---|---|
u4 | magic | 1 | 魔数 |
u2 | minor_version | 1 | 次版本号 |
u2 | major_version | 1 | 主版本号 |
u2 | constant_pool_count | 1 | 常量个数 |
cp_info | constant_pool | constant_pool_count – 1 | 常量池表项 |
u2 | access_flags | 1 | 类的访问控制符 |
u2 | this_class | 1 | 当前类的全限定名索引 |
u2 | super_class | 1 | 父类的全限定名索引 |
u2 | interfaces_count | 1 | 接口数量 |
u2 | interfaces | interface_count | 接口的全限定名索引列表 |
u2 | fields_count | 1 | 字段数量 |
field_info | fields | fields_count | 字段表表项 |
u2 | methods_count | 1 | 方法数量 |
method_info | methods | methods_count | 方法表表项 |
u2 | attributes_count | 1 | 附加属性数量 |
attribute_info | attributes | attributes_count | 附加属性表表项 |
无论是无符号数还是表,当需要描述同一类型但数量不定的多个数据时,经常会使用一个前置的容量计数器,加若干个连续的数据项的形式,这时称这一系列的某一类型的数据为某一类型的集合。
Class 的结构不像 XML 等描述语言,由于它没有任何分隔符号,所以上面表中的数据项,无论是顺序还是数量,甚至于数据存储的字节序(Byte Ordering,Class 文件中字节序为 Big-Endian)这样的细节,都是被严格限定的,哪个字节代表什么含义,长度是多少,先后顺序如何,都不允许改变。
Class 文件中的信息内容:
- 魔数
- Class 文件版本
- 常量池
- 访问标志
- 类索引、父类索引、接口索引集合
- 字段表集合
- 方发表集合
- 属性表集合
Java 类:
public class HelloWorld {
public static void main(String[] args) {
System.out.println("Hello World");
}
}
通过 Binary Viewer 查看编译后的 Class 文件:
作者:殷建卫 链接:https://www.yuque.com/yinjianwei/vyrvkf/ar30va 来源:殷建卫 - 架构笔记 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。