- Java 虚拟机的指令由一个字节长度的、 代表着某种特定操作含义的数字(称为操作码,Opcode)以及跟随其后的零至多个代表此操作所需参数(称为操作数,Operands)而构成。如果要将一个 16 位长度的无符号整数使用两个无符号字节存储起来(将它们命名为 byte1 和 byte2),那它们的值应该是这样的:(byte1<<8)|byte2
- 不考虑异常处理情况下,虚拟机解释器执行模型伪代码:
do{
自动计算 PC 寄存器的值加 1;
根据 PC 寄存器的指示位置,从字节码流中取出操作码;
if(字节码存在操作数)从字节码流中取出操作数;
执行操作码所定义的操作;
} while(字节码流长度 > 0);
# 字节码与数据类型
- Java 虚拟机的指令集对于特定的操作只提供了有限的类型相关指令去支持它。
- 编译器在大多数对于 boolean、 byte、 short 和 char 类型数据的操作,在编译器转换为对应的 int 类型来处理。
# 加载和存储指令
- 加载和存储指令用于将数据在栈帧中的局部变量表和操作数栈之间来回传输。
- 将一个局部变量加载到操作栈:iload、 iload_
、 lload、 lload_ 、 fload、 fload_ 、 dload、 dload_ 、 aload、 aload_ - 将一个数值从操作数栈存储到局部变量表:istore、 istore_
、 lstore、 lstore_ 、fstore、 fstore_ 、 dstore、 dstore_ 、 astore、 astore_ 。 - 将一个常量加载到操作数栈:bipush、 sipush、 ldc、 ldc_w、 ldc2_w、 aconst_null、iconst_m1、 iconst_、 lconst_
、 fconst_ 、 dconst_ 。 - 扩充局部变量表的访问索引的指令:wide。
- iload_
表示 n 条 iload_n 指令集合。
# 运算指令
- 运算或算术指令用于对两个操作数栈上的值进行某种特定运算,并把结果重新存入到操作栈顶。
- 大体上算术指令可以分为两种:对整型数据进行运算的指令与对浮点型数据进行运算的指令。
- 运算指令都使用 Java 虚拟机的数据类型。例如对于 byte、short、 char 和 boolean 这类数据的运算,应使用操作 int 类型的指令代替。
- 加法指令:iadd、 ladd、 fadd、 dadd。
- 减法指令:isub、 lsub、 fsub、 dsub。
- 乘法指令:imul、 lmul、 fmul、 dmul。
- 除法指令:idiv、 ldiv、 fdiv、 ddiv。
- 求余指令:irem、 lrem、 frem、 drem。
- 取反指令:ineg、 lneg、 fneg、 dneg。
- 位移指令:ishl、 ishr、 iushr、 lshl、 lshr、 lushr。
- 按位或指令:ior、 lor。
- 按位与指令:iand、 land。
- 按位异或指令:ixor、 lxor。
- 局部变量自增指令:iinc。
- 比较指令:dcmpg、 dcmpl、 fcmpg、 fcmpl、 lcmp。
# java 虚拟机规范要求:
- 在处理整型数据时,只有除法指令(idiv 和 ldiv)以及求余指令(irem 和 lrem)中当出现除数为零时会导致虚拟机抛出 ArithmeticException 异常,其余任何整型数运算场景都不应该抛出运行时异常。
- 在处理浮点数时向最接近数舍入模式。
- 在把浮点数转换为整数时使用向零舍入模式,所有小数部分的有效字节都会被丢弃掉。
- 对 long 类型数值进行比较时,虚拟机采用带符号的比较方式,对浮点数值进行比较时(dcmpg、 dcmpl、 fcmpg、 fcmpl)使用无信号比较方式。
# 类型转换指令
- 将两种不同的数值类型进行相互转换。
- 用于实现用户代码中的显式类型转换操作,或者处理字节码指令集中数据类型相关指令无法与数据类型一一对应的问题。
# 宽化类型转换(无需显式的转换指令)的数值类型:(Widening Numeric Conversions)
- int 类型到 long、 float 或者 double 类型。
- long 类型到 float、 double 类型。
- float 类型到 double 类型。
# 窄化类型转换(必须显式使用的转换指令来完成)(Narrowing Numeric Conversions)
- 转换指令包括:i2b、 i2c、 i2s、 l2i、 f2i、 f2l、 d2i、 d2l 和 d2f。
- 可能会导致转换结果产生不同的正负号、 不同的数量级的情况。
在将 int 或 long 类型窄化转换为整数类型 T 的时候,转换过程仅仅是简单地丢弃除最低位 N 个字节以外的内容,N 是类型 T 的数据类型长度。(符号位发生变化) - 转换过程很可能会导致数值的精度丢失。
将一个浮点值窄化转换为整数类型 T(T 限于 int 或 long 类型之一)的时,遵循以下原则: - 如果浮点值是 NaN,那转换结果就是 int 或 long 类型的 0。
- 如果浮点值不是无穷大并使用向零舍入模式取整后获得的整数值(V)在目标类型 T 的表示范围,那么转换结果为 V。
- 否则,将根据 v 的符号,转换为 T 所能表示的最大或者最小正数。
- 尽管数据类型窄化转换可能会发生上限溢出、 下限溢出和精度丢失等情况,数值类型的窄化转换指令不会抛出运行时异常。
# 对象创建与访问指令
- Java 虚拟机对类实例和数组的创建与操作使用了不同的字节码指令
- 创建类实例的指令:new。
- 创建数组的指令:newarray、 anewarray、 multianewarray。
- 访问类字段(static 字段,或者称为类变量)和实例字段(非 static 字段,或者称为实例变量)的指令:getfield、 putfield、 getstatic、 putstatic。
- 把一个数组元素加载到操作数栈的指令:baload、 caload、 saload、 iaload、 laload、faload、 daload、 aaload。
- 将一个操作数栈的值存储到数组元素中的指令:bastore、 castore、 sastore、 iastore、fastore、 dastore、 aastore。
- 取数组长度的指令:arraylength。
- 检查类实例类型的指令:instanceof、 checkcast。
# 操作数栈管理指令
- 用于直接操作操作数栈
- 将操作数栈的栈顶一个或两个元素出栈:pop、 pop2。
- 复制栈顶一个或两个数值并将复制值或双份的复制值重新压入栈顶:dup、 dup2、dup_x1、 dup2_x1、 dup_x2、 dup2_x2。
- 将栈最顶端的两个数值互换:swap。
# 控制转移指令
- 可以让 Java 虚拟机有条件或无条件地从指定的位置指令而不是控制转移指令的下一条指令继续执行程序(在有条件或无条件地修改 PC 寄存器的值)。
- 条件分支:ifeq、 iflt、 ifle、 ifne、 ifgt、 ifge、 ifnull、 ifnonnull、 if_icmpeq、 if_icmpne、if_icmplt、 if_icmpgt、 if_icmple、 if_icmpge、 if_acmpeq 和 if_acmpne。
- 复合条件分支:tableswitch、 lookupswitch。
- 无条件分支:goto、 goto_w、 jsr、 jsr_w、 ret。
- 对于 boolean 类型、 byte 类型、 char 类型和 short 类型的条件分支比较操作,都是使用 int 类型的比较指令来完成。
- 对于 long 类型、 float 类型和 double 类型的条件分支比较操作,则会先执行相应类型的比较运算指令(dcmpg、 dcmpl、 fcmpg、fcmpl、 lcmp),运算指令会返回一个整型值到操作数栈中,随后再执行 int 类型的条件分支比较操作来完成整个分支跳转。
# 方法调用和返回指令
- invokevirtual 指令用于调用对象的实例方法,根据对象的实际类型进行分派(虚方法分派),这也是 Java 语言中最常见的方法分派方式。
- invokeinterface 指令用于调用接口方法,它会在运行时搜索一个实现了这个接口方法的对象,找出适合的方法进行调用。
- invokespecial 指令用于调用一些需要特殊处理的实例方法,包括实例初始化方法、 私有方法和父类方法。
- invokestatic 指令用于调用类方法(static 方法)。
- invokedynamic 指令用于在运行时动态解析出调用点限定符所引用的方法,并执行该方法,前面 4 条调用指令的分派逻辑都固化在 Java 虚拟机内部,而 invokedynamic 指令的分派逻辑是由用户所设定的引导方法决定的。
- 方法调用指令与数据类型无关,而方法返回指令是根据返回值的类型区分的(包括 ireturn(当返回值是 boolean、 byte、 char、 short 和 int 类型时使用)、 lreturn、 freturn、 dreturn 和 areturn)。另外还有一条 return 指令供声明为 void 的方法、 实例初始化方法以及类和接口的类初始化方法使用。
# 异常处理指令
- 在 Java 程序中显式抛出异常的操作(throw 语句)都由 athrow 指令来实现。
- 除了用 throw 语句显式抛出异常情况之外,Java 虚拟机规范还规定了许多运行时异常会在其他 Java 虚拟机指令检测到异常状况时自动抛出。
- 在 java 虚拟机中采用异常表来处理异常。
# 同步指令
- Java 虚拟机可以支持方法级的同步和方法内部一段指令序列的同步,这两种同步结构都是使用管程(Monitor)来支持的。
- 方法级的同步是隐式的,即无须通过字节码指令来控制,它实现在方法调用和返回操作之中。
- 虚拟机可以从方法常量池的方法表结构中的 ACC_SYNCHRONIZED 访问标志得知一个方法是否声明为同步方法。
- 当方法调用时,调用指令将会检查方法的 ACC_SYNCHRONIZED 访问标志是否被设置。如果设置了,执行线程就要求先成功持有管程,然后才能执行方法,最后当方法完成(无论是正常完成还是非正常完成)时释放管程。
- 在方法执行期间,执行线程持有了管程,其他任何线程都无法再获取到同一个管程。
# 代码同步演示
java 代码:
void onlyMe(Foo f){
synchronized(f){
doSomething();
}
}
编译后字节码:
Method void onlyMe(Foo)
0 aload_1//将对象f入栈
1 dup//复制栈顶元素(即f的引用)
2 astore_2//将栈顶元素存储到局部变量表Slot 2中
3 monitorenter//以栈顶元素(即f)作为锁,开始同步
4 aload_0//将局部变量Slot 0(即this指针)的元素入栈
5 invokevirtual#5//调用doSomething()方法
8 aload_2//将局部变量Slow 2的元素(即f)入栈
9 monitorexit//退出同步
10 goto 18//方法正常结束,跳转到18返回
13 astore_3//从这步开始是异常路径,见下面异常表的Taget 13
14 aload_2//将局部变量Slow 2的元素(即f)入栈
15 monitorexit//退出同步
16 aload_3//将局部变量Slow 3的元素(即异常对象)入栈
17 athrow//把异常对象重新抛出给onlyMe()方法的调用者
18 return//方法正常返回
Exception table:
FromTo Target Type
4 10 13 any
13 16 13 any
- 无论方法是正常结束还是异常结束每条 monitorenter 指令都必须执行其对应的 monitorexit 指令。
# 虚拟机实现的方式
- 将输入的 Java 虚拟机代码在加载或执行时翻译成另外一种虚拟机的指令集。
- 将输入的 Java 虚拟机代码在加载或执行时翻译成宿主机 CPU 的本地指令集(即 JIT 代码生成技术)。