Java字节码指令简介

来源:互联网 发布:电脑版淘宝的微淘 编辑:程序博客网 时间:2024/05/12 04:10

本文是《深入理解Java虚拟机》中第六章的读书笔记。

1、概述

在Class文件中,Java方法里的方法体,也就是代表着一个Java源码程序中程序的部分存储在方法表集合的Code属性中。存储在Code属性中的是字节码,也就是编译后的程序。Java虚拟机的指令由两部分组成,首先是一个字节长度、代表某种含义的数字(即操作码),在操作码后面跟着零个或多个代表这个操作所需的参数(即操作数)。由于Java虚拟机采用的是面向操作数栈而不是寄存器的架构,所以大多数指令不包含操作数,只有一个操作码。

操作码的长度只有一个字节,这就限制了操作码的个数不超过256个。同时,Class文件格式放弃了编译后代码的操作数长度对齐,这就意味着虚拟机处理那些超过一个字节的数据时,不得不在运行时从字节中重建出具体数据的结构。比如,如果要将一个两个字节长的无符号整数使用两个无符号字节存储起来分别是byte1和byte2,那么就需要这样构造出原始的无符号整数:

(byte1<<8) | byte2

这样会在某种程度上导致执行字节码时损失一些性能。但这样做也有好处,那就是由于不需要对齐,省去了中间的填充与间隔符号;用一个字节来表示操作码,也是为了获得短小的编译代码。这样就尽可能的减少了编译后的代码的长度,非常适合网络传输。

如果不考虑异常处理的话,那么Java虚拟机的解释器可以使用下面的伪代码作为基本的执行模型来理解:

do{    自动计算PC寄存器的值加1;    根据PC寄存器的指示位置,从字节码流中取出操作码;    if(字节码存在操作数) 从字节码流中取出操作数;    执行操作码所定义的操作;}while(字节码长度>0);

2、字节码与数据类型

在Java虚拟机的指令集中,大多数的指令都包含了操作所对应的数据类型信息。比如iload指令表示从局部变量表中加载int型数据到操作数栈中,而fload表示加载float类型的数据。不过,这两条指令再虚拟机的内部可能是由同一段代码来实现的,但在class文件中必须有自己的操作码。

我们已经知道Java指令的长度只有一个字节,这就限制了指令集的大小。如果每个指令都像上面两个指令那样包含所有的数据类型,那么就有可能导致指令过多。因此,Java虚拟机的指令集对于特定的操作只提供了有限的类型相关指令去支持它。比如,大多数指令没有支持整数类型byte、char和short,甚至没有指令支持boolean类型。

这些指令中都有特殊的字符来表示专门支持的类型:i代表int类型,l代表long,s代表short,b代表byte,c代表char,f代表float,d代表double,a代表Reference。

这里仅仅介绍一下指令的种类以及作用,并不会过多的介绍各个指令的含义以及使用,需要的话可以查看《Java虚拟机规范(Java SE 7版)》。

3、加载和存储指令

加载指令用于将局部变量表中的数据传送到操作数栈中,而存储指令用于将操作数栈中的结果传送到局部变量表中。这类指令包括如下几种:

  • 将一个局部变量加载到操作栈,比如iload、iload<n>、fload、fload<n>、lload、lload<n>、dload、dload<n>、aload、aload<n>;
  • 将一个数值从操作数栈存储到局部变量表,比如istore、istore<n>、lstore、lstore<n>、fstore、fstore<n>、dstore、dstore<n>、astore、astore<n>;
  • 将一个常量加载到操作数栈,比如bipush、sipush、ldc、ldc_w、ldc2_w、aconst_null、iconst_ml、iconst_<i>、lconst_<l>、fconst_<f>、dconst_<d>;
  • 扩充局部变量表的访问索引的指令:wide;

上面中带尖括号的指令实际是一组指令。比如iload<n>,代表了iload_1、iload_2和iload_3。这几组指令是某个带操作数的指令(比如iload)的特殊形式,它们省略了操作数,不过操作数隐含在指令中。

4、运算指令

运算或算术指令用于对一个或两个操作数栈上的值进行某种特定的运算,并将结果存入栈顶。大体上可以分为两种,对整数进行运算的指令和对浮点数进行运算的指令。不过,由于没有支持byte、short、char和boolean的算术指令,对于这些数据的运算,会把它们转化为int类型进行运算。指令列出如下:

  • 加法指令:iadd、ladd、fadd、dadd;
  • 减法指令:isub、lsub、fsub、dsub;
  • 乘法指令:imul、lmul、fmul、dmul;
  • 除法指令:idiv、ldiv、fdiv、ddiv;
  • 求余指令:irem、lrem、frem、drem;
  • 取反指令:ineg、lneg、fneg、dneg;
  • 位移指令:ishl、ishr、iushr、lshl、lshr、lushr;
  • 按位或指令:ior、lor;
  • 按位与指令:iand、land;
  • 按位异或指令:ixor、lxor;
  • 局部变量自增指令:iinc;
  • 比较指令:dcmpg、dcmpl、fcmpg、fcmpl、lcmp;

5、类型转换指令

类型转换指令用来将两种不同类型进行转换,这些转换操作一般用于实现代码中的显示类型转换操作,或者前面提到的字节码指令集中数据类型相关指令无法与数据类型一一对应的问题。

虚拟机直接支持宽化类型转换,即小范围类型向大范围类型的安全转换,不需要显示的转换指令。

但是处理窄化类型转换时,必须显示使用转换指令来完成,这些指令包括:i2b、i2c、i2s、l2i、f2l、d2i、d2l和d2f。这些指令可能会导致数值的精度丢失。

6、对象创建与访问指令

虽然类实例和数组都是对象,但是虚拟机创建类对象和数组的指令是不同的。对象创建后,就可以通过对象访问指令获取对象实例或者数组实例中的字段或数组元素,指令如下:

  • 创建类实例的指令:new;
  • 创建数组的指令:newarray、anewarray、multianewarray;
  • 访问类字段和实例字段的指令:getfield、putfield、getstatic、putstatic;
  • 把一个数组元素加载到操作数栈的指令:baload、caload、saload、iaload、laload、faload、daload、aaload;
  • 将一个操作数栈的值存储到数组元素中的指令:bastore、castore、sastore、iastore、fastore、dastore、aastore;
  • 取数组长度的指令:arraylength;
  • 检查类实例类型的指令:instanceof、checkcast;

7、操作数栈管理指令

就像操作一个普通的栈一样,Java虚拟机提供了一些用于直接操作操作数栈的指令,包括:

  • 将操作数栈的栈顶一个或两个元素出栈:pop、pop2;
  • 复制栈顶一个或两个数值并将复制值或双份的复制值重新压入栈顶:dup、dup2、dup_x1、dup2_x1、dup_x2、dup2_x2;
  • 将栈顶最顶端的两个数值互换:swap;

8、控制转移指令

控制转移指令可以让Java虚拟机有条件或无条件的从指定的位置指令而不是控制转移指令的下一条指令继续执行,可以理解为控制转移指令改变了PC寄存器的值。指令如下:

  • 条件分支:ifeq、iflt、ifle、ifgt、ifge、ifnonnull、if_icmpeq、if_icmpne、if_icmplt、if_icmpgt、、if_icmpge、if_acmpeq和if_acmpne;
  • 复合条件分支:tableswitch、lookupswitch;
  • 无条件分支:goto、goto_w、jsr、jsr_w、ret;

9、方法调用和返回指令

这里仅仅列出5条用于方法调用的指令:

  • invokevirtual指令用于调用对象的实例方法,根据对象的实际类型进行分派(虚方法分派),这也是Java语言中最常见的方法分派方式;
  • invokeinterface指令用于调用接口方法,它会在运行时搜索一个实现了这个接口方法的对象,找出适合的方法进行调用;
  • invokespecial指令用于调用一些需要特殊处理的实例方法,包括实例初始化方法、私有方法和父类方法;
  • invokestatic指令用于调用类方法(static方法);
  • invokedynamic指令用于在运行时动态解析出调用点限定符索引用的方法,并执行方法,前面4条指令的分派逻辑都固化在Java虚拟机内部,而invokedynamic指令的分派逻辑是由用户所设定的引导方法决定的;

方法调用指令与类型无关,但是方法返回指令是根据返回值的类型区分的,包括ireturn、lreturn、freturn、dreturn和areturn,另外还有一个return指令供声明为void的方法、实例初始化方法以及类和接口的类初始化方法使用。

10、异常处理指令

在Java程序中显式抛出异常的操作(throw语句)都是由athrow指令来实现的,除了用throw语句显式抛出异常外,Java虚拟机规范还规定了许多运行时异常会在其他Java虚拟机指令检测到异常状况时自动抛出。

而在Java虚拟机中,处理异常(catch语句)不是由字节码指令来完成的,而是采用异常表来完成的。

11、同步指令

Java虚拟机可以支持方法级的同步和方法内部一段指令序列的同步,这两种同步结构都是使用管程(Monitor)来支持的。

方法级的同步是隐式的,即不需要通过字节码指令来控制,它实现在方法调用和返回操作中。虚拟机可以从方法常量池的方法表结构中的ACC_SYNCHRONIZED访问标志得知一个方法是否声明为同步方法。当方法调用时,调用指令就会去检查方法的ACC_SYNCHRONIZED访问标志是否被设置了,如果设置,执行线程就要求持有管程。在方法执行期间,执行线程持有了管程,其他任何线程都无法再获取到同一个管程。如果一个方法在执行期间发生了异常,并在方法中无法处理次异常,那么这个同步方法所持有的管程将在异常抛出后自动释放。

同步一段指令集序列通常是由Java语言中的synchronized语句块表示的,Java虚拟机的指令集中有monitorenter和monitorexit指令来支持synchronized关键字的语义。正确实现synchronized关键字需要Javac编译器和Java虚拟机两者共同协作。编译器必须保证每个monitorenter指令都有对应的monitorexit指令。


添加公众号Machairodus,我会不时分享一些平时学到的东西~


0 0
原创粉丝点击