跳到主要内容

字节码详解

Java字节码是JVM执行的指令集,是Java程序编译后的中间表示。理解字节码有助于深入理解Java语言的运行机制,也是进行性能优化和问题排查的重要技能。

什么是字节码?

Java源代码经过javac编译器编译后,生成.class文件,其中包含的就是字节码。字节码是一种平台无关的中间代码,由JVM解释执行或JIT编译为机器码执行。

字节码执行流程:

┌─────────────┐
│ .java │ 源文件
│ 源文件 │
└──────┬──────┘

↓ javac 编译
┌─────────────┐
│ .class │ 字节码文件(平台无关)
│ 字节码文件 │
└──────┬──────┘

├──────────────────────┐
│ │
↓ ↓
┌─────────────┐ ┌─────────────┐
│ JVM解释器 │ │ JIT编译器 │
│(Interpreter)│ │(JIT Compiler)│
└──────┬──────┘ └──────┬──────┘
│ │
└──────────┬───────────┘

┌─────────────┐
│ 机器码 │
│ (本地代码) │
└──────┬──────┘

┌─────────────┐
│ CPU │
│ 执行机器码 │
└─────────────┘

解释执行 vs JIT编译

  • 解释执行:逐行解释字节码为机器码执行,启动快,运行慢
  • JIT编译:将热点代码编译为机器码执行,启动稍慢,运行快

Class文件结构

Class文件是一组以8位字节为基础单位的二进制流,各数据项目严格按照顺序紧凑排列。

整体结构

ClassFile {
u4 magic; // 魔数
u2 minor_version; // 次版本号
u2 major_version; // 主版本号
u2 constant_pool_count; // 常量池计数
cp_info constant_pool[]; // 常量池
u2 access_flags; // 访问标志
u2 this_class; // 类索引
u2 super_class; // 父类索引
u2 interfaces_count; // 接口计数
u2 interfaces[]; // 接口索引
u2 fields_count; // 字段计数
field_info fields[]; // 字段表
u2 methods_count; // 方法计数
method_info methods[]; // 方法表
u2 attributes_count; // 属性计数
attribute_info attributes[]; // 属性表
}

魔数与版本

每个Class文件的前4个字节是魔数,固定为0xCAFEBABE,用于标识这是一个有效的Class文件。

// 查看Class文件版本
// JDK 8 = 52
// JDK 11 = 55
// JDK 17 = 61
// JDK 21 = 65

常量池

常量池是Class文件中最大的数据项目,存储字面量和符号引用:

常量类型标志描述
CONSTANT_Class7类或接口的符号引用
CONSTANT_Fieldref9字段的符号引用
CONSTANT_Methodref10方法的符号引用
CONSTANT_String8字符串字面量
CONSTANT_Integer3整型字面量
CONSTANT_Float4浮点字面量
CONSTANT_Long5长整型字面量
CONSTANT_Double6双精度浮点字面量
CONSTANT_NameAndType12名称和类型描述符
CONSTANT_Utf81UTF-8编码的字符串
CONSTANT_MethodHandle15方法句柄
CONSTANT_MethodType16方法类型
CONSTANT_InvokeDynamic18动态方法调用点

访问标志

访问标志用于标识类或接口的访问权限和属性:

标志名含义
ACC_PUBLIC0x0001public
ACC_FINAL0x0010final
ACC_SUPER0x0020使用invokespecial指令
ACC_INTERFACE0x0200接口
ACC_ABSTRACT0x0400abstract
ACC_SYNTHETIC0x1000自动生成
ACC_ANNOTATION0x2000注解
ACC_ENUM0x4000枚举

字节码指令

字节码指令是一种单字节指令,由操作码(Opcode)和操作数(Operands)组成。

加载和存储指令

加载和存储指令用于在栈帧中的局部变量表和操作数栈之间传输数据:

// 局部变量加载到操作数栈
iload, iload_<n> // int类型
lload, lload_<n> // long类型
fload, fload_<n> // float类型
dload, dload_<n> // double类型
aload, aload_<n> // 引用类型

// 操作数栈存储到局部变量表
istore, istore_<n> // int类型
lstore, lstore_<n> // long类型
fstore, fstore_<n> // float类型
dstore, dstore_<n> // double类型
astore, astore_<n> // 引用类型

示例

public int add(int a, int b) {
return a + b;
}

对应字节码:

iload_1    // 加载局部变量表索引1的值(参数a)到操作数栈
iload_2 // 加载局部变量表索引2的值(参数b)到操作数栈
iadd // 执行加法
ireturn // 返回int类型结果

运算指令

指令描述
iadd, ladd, fadd, dadd加法
isub, lsub, fsub, dsub减法
imul, lmul, fmul, dmul乘法
idiv, ldiv, fdiv, ddiv除法
irem, lrem, frem, drem取余
ineg, lneg, fneg, dneg取负
ishl, ishr, iushr移位
iand, ior, ixor位运算

类型转换指令

类型转换指令用于不同数值类型之间的转换:

// 宽化类型转换(安全,无需显式指令)
// byte -> short -> int -> long -> float -> double

// 窄化类型转换(需要显式指令)
i2b // int -> byte
i2c // int -> char
i2s // int -> short
l2i // long -> int
f2i // float -> int
d2i // double -> int

对象创建与访问指令

// 创建对象
new // 创建类实例
newarray // 创建基本类型数组
anewarray // 创建引用类型数组
multianewarray // 创建多维数组

// 访问字段
getfield // 获取实例字段
putfield // 设置实例字段
getstatic // 获取静态字段
putstatic // 设置静态字段

// 调用方法
invokevirtual // 调用实例方法(虚方法)
invokespecial // 调用构造方法、私有方法、父类方法
invokestatic // 调用静态方法
invokeinterface // 调用接口方法
invokedynamic // 动态方法调用

控制转移指令

// 条件分支
if_icmpeq // 如果两个int相等
if_icmpne // 如果两个int不相等
if_icmplt // 如果小于
if_icmpge // 如果大于等于
if_icmpgt // 如果大于
if_icmple // 如果小于等于

// 无条件分支
goto // 无条件跳转
tableswitch // switch-case(密集case)
lookupswitch // switch-case(稀疏case)

方法调用和返回指令

// 方法调用
invokevirtual // 虚方法调用
invokespecial // 特殊方法调用
invokestatic // 静态方法调用
invokeinterface // 接口方法调用
invokedynamic // 动态方法调用

// 方法返回
ireturn // 返回int
lreturn // 返回long
freturn // 返回float
dreturn // 返回double
areturn // 返回引用
return // 返回void

字节码分析工具

javap命令

JDK自带的字节码反汇编工具:

# 反编译Class文件
javap -c MyClass.class

# 显示详细信息
javap -verbose MyClass.class

# 显示私有成员
javap -p MyClass.class

示例输出

public class BytecodeExample {
public static void main(String[] args) {
int a = 10;
int b = 20;
int c = a + b;
System.out.println(c);
}
}

字节码:

public static void main(java.lang.String[]);
Code:
0: bipush 10
2: istore_1
3: bipush 20
5: istore_2
6: iload_1
7: iload_2
8: iadd
9: istore_3
10: getstatic #2 // Field java/lang/System.out:Ljava/io/PrintStream;
13: iload_3
14: invokevirtual #3 // Method java/io/PrintStream.println:(I)V
17: return

字节码解读

0: bipush 10      // 将常量10压入操作数栈
2: istore_1 // 将栈顶int值存储到局部变量表索引1
3: bipush 20 // 将常量20压入操作数栈
5: istore_2 // 将栈顶int值存储到局部变量表索引2
6: iload_1 // 加载局部变量1到栈
7: iload_2 // 加载局部变量2到栈
8: iadd // 执行加法,结果压入栈
9: istore_3 // 存储结果到局部变量3
10: getstatic #2 // 获取System.out静态字段
13: iload_3 // 加载局部变量3
14: invokevirtual #3 // 调用println方法
17: return // 方法返回

常见语法结构的字节码

条件语句

public int max(int a, int b) {
if (a > b) {
return a;
} else {
return b;
}
}

字节码:

0: iload_1
1: iload_2
2: if_icmple 7 // 如果a <= b,跳转到7
5: iload_1
6: ireturn // 返回a
7: iload_2
8: ireturn // 返回b

循环语句

public int sum(int n) {
int result = 0;
for (int i = 1; i <= n; i++) {
result += i;
}
return result;
}

字节码:

0: iconst_0
1: istore_2 // result = 0
2: iconst_1
3: istore_3 // i = 1
4: iload_3
5: iload_1
6: if_icmpgt 20 // i > n 跳转到20
9: iload_2
10: iload_3
11: iadd
12: istore_2 // result += i
13: iinc 3, 1 // i++
16: goto 4
19: iload_2
20: ireturn

try-catch语句

public void tryCatch() {
try {
method();
} catch (Exception e) {
e.printStackTrace();
}
}

字节码中的异常表:

Exception table:
from to target type
0 4 7 Class java/lang/Exception

synchronized语句

public void syncMethod(Object lock) {
synchronized (lock) {
System.out.println("sync");
}
}

字节码:

0: aload_1
1: dup
2: astore_2 // 保存锁对象引用
3: monitorenter // 获取锁
4: getstatic #2 // System.out
7: ldc #3 // "sync"
9: invokevirtual #4 // println
12: aload_2
13: monitorexit // 释放锁
14: goto 22
17: astore_3 // 异常处理
18: aload_2
19: monitorexit // 确保释放锁
20: aload_3
21: athrow
22: return

方法调用详解

invokevirtual

调用虚方法,根据对象的实际类型进行分派:

List<String> list = new ArrayList<>();
list.add("hello"); // invokevirtual调用ArrayList的add方法

invokespecial

调用特殊方法:构造方法、私有方法、父类方法:

super.method();     // invokespecial
this.privateMethod(); // invokespecial
new Object(); // invokespecial调用构造方法

invokestatic

调用静态方法:

Math.max(1, 2);     // invokestatic

invokeinterface

调用接口方法:

Runnable r = () -> {};
r.run(); // invokeinterface

invokedynamic

动态方法调用,支持动态语言和Lambda表达式:

// Lambda表达式使用invokedynamic
Runnable r = () -> System.out.println("hello");

小结

字节码是理解JVM运行机制的关键:

  1. Class文件结构:魔数、版本、常量池、访问标志等
  2. 字节码指令:加载存储、运算、类型转换、对象操作、控制转移
  3. 方法调用:invokevirtual、invokespecial、invokestatic、invokeinterface、invokedynamic
  4. 分析工具:javap命令

理解字节码有助于深入理解Java语言的运行机制,进行性能优化和问题排查。

参考资料