一、字节码指令概述
1、概述
1、Java字节码对于虚拟机,就好像汇编语言对于计算机,属于基本执行命令。
2、Java虚拟机的指令由1个字节长度的、代表着某种特定操作含义的数字(称为操作码,Opcode)以及跟随其后的0至多个代表此操作所需参数(称为操作数,Operand)而构成。由于Java虚拟机采用面向操作数栈而不是寄存器的结构,所以大多数的指令都不包含操作数,只有一个操作码,指令惨数都存放在操作数栈中 。
3、字节码指令集可算是一种具有鲜明特点、优势和劣势均很突出的指令集架构,由于限制了Java虚拟机操作码的长度为一个字节(即0~255),这意味着指令集的操作码总数不可能超过256条。
4、由于Class文件格式放弃了编译后代码的操作数长度对齐,这就意味着虚拟机在处理那些超过一个字节的数 据时,不得不在运行时从字节中重建出具体数据的结构,譬如要将一个16位长度的无符号整数使用两个无符号字节存储起来(假设将它们命名为byte1和byte2),那它们的值应该是这样的(byte1<<8)|byte2
5、这种操作在某种程度上会导致解释执行字节码时将损失一些性能,但这样做的优势也同样明显: 放弃了操作数长度对齐,就意味着可以省略掉大量的填充和间隔符号;用一个字节来代表操作码, 也是为了尽可能获得短小精干的编译代码
2、执行模型
如果不考虑异常处理的话,那Java虚拟机的解释器可以使用下面这段伪代码作为最基本的执行模型来理解,这个执行模型虽然很简单,但依然可以有效正确地工作。
3、字节码与数据类型
1、在Java虚拟机的指令集中,大多数指令都包含其操作所对应的数据类型信息。举个例子,iload指令用于从局部变量表中加载int型的数据到操作数栈中,而fload指令加载的则是float类型的数据。这两条指令的操作在虚拟机内部可能会是由同一段代码来实现的,但在Class文件中它们必须拥有各自独立的操作码。
2、对于大部分与数据类型相关的字节码指令,它们的操作码助记符中都有特殊的字符来表明专门为哪种数据类型服务
-
i 代表对int 类型的数据操作。 -
l 代表long 类型。 -
s 代表short 类型。 -
b 代表byte 类型。 -
c 代表char 类型。 -
f 代表float 类型。 -
d 代表double 类型。 -
a 代表reference 类型。 -
也有一些指令的助记符中没有明确指明操作类型的字母,例如arraylength 指令,它没有代表数据类型的特殊字符,但操作数永远只能是一个数组类型的对象。还有另外一些指令,如无条件跳转指令goto 则是与数据类型无关的指令。
3、大部分的指令都没有支持整数类型byte、char和short,甚至没有任何指令支持boolean类型。编译器会在编译器或运行期将byte和short类型的数据带符号扩展(Sign-Extend)为相应的int类型数据,将boolean和char类型数据零位扩展(Zero-Extend)为相应的int类型数据。与之类似,在处理boolean、byte、short和char类型的数组时,也会转换为使用对应的int类型的字节码指令来处理。因此,大多数对于boolean、byte、short和char类型数据的操作,实际上都是使用相应的int类型作为运算类型 。
4、字节码指令分类
1、为了能够更快地熟悉和了解这些基本指令,这里将JVM中的字节码指令集按用途大致分成9类:
-
加载与存储指令 -
算术指令 -
类型转换指令 -
对象的创建与访问指令 -
方法调用与返回指令 -
操作数栈管理指令 -
比较控制指令 -
异常处理指令 -
同步控制指令
2、在做值相关操作时:
-
一个指令,可以从局部变量表、常量池、堆中对象、方法调用、系统调用等中取得数据,这些数据(可能是值,可能是对象的引用)被压入操作数栈。 -
一个指令,也可以从操作数栈中取出一到多个值(pop 多次),完成赋值、加减乘除、方法传参、系统调用等操作。
二、加载与存储指令
1、作用
加载和存储指令用于将数据从栈帧中的局部变量表和操作数栈之间来回传输。对应两个操作:
2、常用指令
1、将一个局部变量加载到操作数栈(压栈指令):
-
xload、xload_<n>(n为0到3,x为i、l、f、d、a) -
xaload(x为i、l、f、d、a、 b、c、s)
2、将一个常量加载到操作数栈:bipush、sipush、ldc、ldc_w、ldc2_w、aconst_null、iconst_m1、iconst_<i>、lconst_<l>、fconst_<f>、dconst_<d>
3、将一个数值从操作数栈存储到局部变量表(出栈装入局部变量表指令):
-
xstore、xstore_<n>(x为i、l、f、d、a;n为0到3) -
xastore(x为i、l、f、d、a、b、c、s)
4、扩充局部变量表的访问索引的指令:wide
5、从指令的命名上不难找出规律,指令助记符的第一个字符总是喜欢表示数据类型,i表示整数,l表示长整型,f表示浮点数,d表示双精度浮点,习惯上用a表示对象引用。如果指令隐含操作的参数,会以下划线形式给出。
3、补充说明
1、上面所列举的指令助记符中,有一部分是以尖括号结尾的(例如iload_<n>)。这些指令助记符实际上代表了一组指令(例如iload_<n>,代表了iload_0、iload_1、iload_2和iload_3这几条指令)。这几组指令都是某个带有一个操作数的通用指令(例如 iload)的特殊形式,对于这若干组特殊指令来说,它们表面上没有操作数,不需要进行取操作数的动作,但操作数都隐含在指令中 。除此之外,它们的语义与原生的通用指令完全一致(例如 iload_0 的语义与操作数为0时的iload指令语义完全一致)。
2、举例说明:
-
iload_0:将局部变量表中索引为0位置上的数据压入操作数栈中。 -
iload 0:显式将局部变量表中索引为0位置上的数据压入操作数栈中。只不过没有必要使用这组指令,iload是一个操作码(1个字节),0是一个操作数(2个字节),意味着这组指令在字节码文件中占3个字节,而上面一个只占用一个字节(更节省空间)。但是操作最多的是0-3的一个范围,如果超出范围,就只能显式指定操作数了。
4、局部变量入栈指令
-
xload_<n>(n为0到3,x为i、l、f、d、a) -
xload(x为i、l、f、d、a) -
x表示数据类型,n表示索引
2、指令xload_n表示将第n个局部变量压入操作数栈,比如iload_1、fload_0、aload_0等指令。其中aload_n表示将一个对象引用压栈。
3、指令xload通过指定参数的形式,把局部变量压入操作数栈,当使用这个命令时,表示局部变量的数量可能超过了4个,比如指令iload、fload等。
public class LoadAndStoreTest {
public void load(int num, Object obj, long count, boolean flag, short[] arr) {
System.out.println(num);
System.out.println(obj);
System.out.println(count);
System.out.println(flag);
System.out.println(arr);
}
}
1、先将代码编译一下,然后通过jclasslib工具查看字节码
2、分析局部变量在局部变量表中的位置
3、注意点
-
非静态方法的局部变量表索引为0的位置存放的是this指针,之后依次是所传入的参数,以及字节码中的局部变量 。 -
32位以内的类型只占用一个slot(包括returnAddress类型),64位的类型(long和double)占用两个slot 。
5、常量入栈指令
1、将常数压入操作数栈,根据数据类型和入栈内容的不同,可以分为const、push、ldc三类指令 (范围依次变大)。
2、const指令 :用于对特定的常量入栈,入栈的常量隐含在指令本身里面,指令如下:
-
iconst_m1将-1压入操作数栈 -
iconst_x(x为0到5)将x压入栈 -
lconst_0、lconst_1分别将长整数0和1压入栈 -
fconst_0、fconst_1、fconst_2分别将浮点数0、1、2压入栈 -
dconst_0、dconst_1分别将double型0和1压入栈 -
aconst_null将null压入操作数栈
3、push指令 :主要包括bipush和sipush,它们的主要区别在与接受数据类型的不同,它们都将参数压入栈
-
bipush接收8位整数作为参数 -
sipush接收16位整数作为参数
4、ldc指令 :如果以上指令都不能满足需求,那么可以使用万能的ldc指令
-
ldc接收一个8位的参数,该参数指向常量池中的int、float或者String的索引,将指定的内容压入堆栈 -
ldc_w接收两个8位的参数,能支持的索引范围大于ldc -
ldc2_w针对要压入的元素是long或double类型的
5、三种指令对应的范围
public class LoadAndStoreTest {
public void pushConstLdc() {
int a = -1;
int b = 0;
int c = 5;
int d = 6;
int e = 127;
int f = 128;
int g = 32767;
int h = 32768;
}
}
1、先将代码编译一下,然后通过jclasslib工具查看字节码
6、出栈装入局部变量表指令
1、用于将操作数栈中栈顶元素弹出后,装入局部变量表的指定位置,用于给局部变量赋值。
-
xstore、xstore_<n>(x为i、l、f、d、a;n为0到3) -
xastore(x为i、l、f、d、a、b、c、s) -
比如:指令istore_n将从操作数栈中弹出一个整数,并把它赋值给局部变量索引为n位置 。 -
指令xstore由于没有隐含参数信息,因此需要提供一个byte类型的参数来指定目标局部变量的位置。 -
xastore则专门针对数组操作,以iastore为例,它用于给一个int数组的给定索引赋值。在iastore执行前,操作数栈顶需要以此准备3个元素:值、索引、数组引用,iastore会弹出这3个值,并将值赋给数组中指定索引的位置。
2、一般说来,类似像store这样的命令需要带一个参数,用来指明将弹出的元素放在局部变量表的第几个位置 。但是,为了尽可能压缩指令大小,使用专门的istore_1指令表示将弹出的元素放置在局部变量表第1个位置。类似的还有istore_0、istore_2、istore_3它们分别表示从操作数栈顶弹出一个元素,存放在局部变量表第0、2、3个位置。
3、由于局部变量表前几个位置使用频率很高,因此这种做法虽然增加了指令数量,但是可以大大压缩生成的字节码的体积 。如果局部变量表很大,需要存储的槽位大于3,那么可以使用xstore指令,外加一个参数,用来表示需要存放的槽位位置。
public class LoadAndStoreTest {
public void store(int k, double d) {
int m = k + 2;
long l = 12;
String str = "hello";
float f = 10.0f;
d = 10;
}
}
1、先将代码编译一下,然后通过jclasslib工具查看字节码
2、首先局部变量表中索引为1,2的位置是k和d对应的值,指令iload_1,将索引为1位置的值压入操作数栈中,iconst_2指令将常量2压入栈中,iadd指令执行加法操作后弹出栈,istore 4指令将计算完成后的值放入局部变量表中索引为4的位置;ldc2_w #8指令将常量池中索引为8的常量12压入栈中,lstore 5指令将12弹出栈放到局部变量表中索引为5的位置;ldc #10指令将常量池中索引为10的常量hello压入栈中,astore 7指令将hello弹出栈放到局部变量表中索引为7的位置;ldc #11指令将常量池中索引为11的常量10.0压入栈中,fstore 8指令将10.0弹出栈放到局部变量表中索引为8的位置;ldc2_w #12指令将常量池中索引为12的常量10.0压入栈中,dstore_2指令将10.0弹出栈放到局部变量表中索引为2的位置。
三、运算指令
1、概述
1、作用 :用于对两个操作数栈上的值进行某种特定运算,并把结果重新存入到操作栈顶。
2、分类 :大体上运算指令可以分为两种,对整型数据 进行运算的指令与对浮点型类型数据 进行运算的指令。
3、byte、short、char、boolean类型说明
-
在每一大类中,都有针对Java虚拟机具体数据类型的专用算术指令。但没有直接支持byte、short、char和boolean类型的算术指令,对于这些数据的运算,都使用int类型的指令来处理。此外,在处理boolean、byte、short和char类型的数组时,也会转换为使用对应的int类型的字节码指令来处理。
2、运算时溢出与运算模式
1、运算时溢出:数据运算可能会导致溢出,例如两个很大的正整数相加,结果可能是一个负数。其实Java虚拟机规范并无明确规定过整型数据溢出的具体结果,仅规定了在处理整型数据时,只有除法指令以及求余指令中当出现除数为0时会导致虚拟机抛出异常ArithmeticException,其余任何整型数运算场景都不应该抛出运行时异常。
2、运算模式:
-
向最接近数舍入模式:JVM要求在进行浮点数计算时,所有的运算结果都必须舍入到适当的精度,非精确结果必须舍入为可被表示的最接近的精确值,如果有两种可表示的形式与该值一样接近,将优先选择最低有效位为零的; -
向零舍入模式:将浮点数转换为整数时,采用该模式,该模式将在目标数值类型中选择一个最接近但是不大于原值的数字作为最精确的舍入结果。
3、NaN值与无穷大Infinity
1、当一个操作产生溢出时,将会使用有符号的无穷大表示,如果某个操作结果没有明确的数学定义的话,将会使用NaN(Not a Number)值来表示。而且所有使用NaN值作为操作数的算术操作,结果都会返回NaN 。
2、Infinity无穷大,比如10 / 0.0的结果就是Infinity
4、所有的算术指令
1、加法指令:iadd、ladd、fadd、dadd
2、减法指令:isub、lsub、fsub、dsub
3、乘法指令:imul、lmul、fmul、dmul
4、除法指令:idiv、ldiv、fdiv、ddiv
5、求余指令:irem、lrem、frem、drem
6、取反指令:ineg、lneg、fneg、dneg
7、局部变量自增指令:iinc
8、位运算指令:
-
位移指令:ishl、ishr、iushr、lshl、lshr、lushr -
按位或指令:ior、lor -
按位与指令:iand、land -
按位异或指令:ixor、lxor
9、比较指令:dcmpg、dcmpl、fcmpg、fcmpl、lcmp
5、举例说明
public class MethodAreaDemo {
public static void main(String[] args) {
int x = 500;
int y = 100;
int a = x / y;
int b = 50;
System.out.println(a + b);
}
}
1、字节码对应的内存解析:初始状态
2、首先将操作数500压入操作数栈中
3、然后操作数500从操作数栈中取出,存储到局部变量表中索引为1的位置 。
4、然后操作数100从操作数栈中取出,存储到局部变量表中索引为2的位置 。
5、将操作数100从操作数栈放到局部变量表索引为2的位置。
6、读取本地变量1,压入操作数栈 。
7、读取本地变量2,压入操作数栈 。
8、两数相除,计算结果放在操作数栈顶,之后执行istore_3 指令 ,将计算结果从操作数栈中弹出,存入局部变量索引为3的位置 。
9、将操作数50压入操作数栈
10、将操作数50从栈顶弹出,保存在局部变量表索引为4的位置 。
11、获取System.out输出流的引用
12、将本地变量表中索引为3的值取出,压入操作数栈中,准备进行加法运算
13、将本地变量表中索引为4的值取出,压入操作数栈中,准备进行加法运算
14、执行加法运算后,将计算结果放在操作数栈顶
15、调用静态方法println(),输出加法结果
16、main()方法执行结束
6、自增指令
1、局部变量自增指令:iinc (int型的局部变量自增会使用该指令)
2、iinc是对局部变量表中的值进行自增,操作的是局部变量(因为类的成员变量都放在堆中,所以对成员变量自增会使用xadd指令,x为i,l,f,d)
3、比如iinc 1 by 1表示局部变量表中索引为1的变量的值自增1 。iinc是对局部变量表中的值进行自增,操作数栈中的值没有变化
public class ArithmeticTest {
public void method1() {
int i = 10;
++i;
}
}
1、将i++代码注释后,编译之后通过jclasslib工具查看字节码如下
2、将++i代码注释后,在通过jclasslib工具查看字节码如下
3、说明:如果不涉及到其他的运算,++i与i++在字节码角度来看是没有任何区别的,因此在for循环中i++或++i都是可以的。
public class ArithmeticTest {
public void method2() {
int i = 10;
int a = i++;
int j = 20;
int b = ++j;
}
}
1、当涉及到其他运算的时候,通过jclasslib工具查看字节码如下
7、比较指令
1、说明
-
比较指令的作用是比较栈顶两个元素的大小,并将比较结果压入栈中 。 -
比较指令有:dcmpg、dcmpl、fcmpg、fcmpl、lcmp ,首字符d表示double类型,f表示float,l表示long类型。 -
对于double和float类型的数字,由于NaN的存在,各有两个版本的比较指令。以float为例,有fcmpg和fcmpl两个指令,它们的区别在于在数字比较时,若遇到NaN值,处理结果不同。 -
指令dcmpl和dcmpg也是类似的,根据其命名可以推测其含义。 -
指令lcmp针对long型整数,由于long型整数没有NaN值,故无需准备两套指令
2、举例
-
指令fcmpg和fcmpl都从栈中弹出两个操作数,并将它们做比较,设栈顶的元素为v2,栈顶顺位第2位元素为v1,若v1=v2,则压入0;若v1 >v2则压入1;若v1<v2则压入-1。 -
两个指令的不同之处在于,如果遇到NaN值,fcmpg会压入1,而fcmpl会压入-1。
3、注意:只有数值类型的数据,才可以比较大小
四、类型转换指令
1、概述
1、类型转换指令可以将两种不同的数值类型相互转换 。这些转换操作一般用于实现用户代码中的显式类型转换操作 ,或者用来处理字节码指令集中数据类型相关指令无法与数据类型一一对应的问题 。
2、宽化类型转换
1、Java虚拟机直接支持(即转换时无须显式地使用转换指令 )以下数值类型的宽化类型转换(Widening Numeric Conversion,即小范围类型向大范围类型的安全转换):
-
int类型到long、float或者double类型对应的指令为:i2l、i2f、i2d -
long类型到float、double类型对应的指令为:l2f、l2d -
float类型到double类型对应的指令为:f2d -
即int ——> long ——> float ——> double
2、精度损失问题
-
宽化类型转换是不会因为超过目标类型最大值而丢失信息的,例如,从int转换到long,或者从int转换到double,都不会丢失任何信息,转换前后的值是精确相等的。 -
从int、long类型数值转换到float,或者long类型树脂转换到double时,将可能发生丢失精度——可能丢失掉几个最低有效位上的值,转换后的浮点数值是根据IEEE754最接近舍入模式所得到的正确整数数值。 -
尽管宽化类型转换实际上是可能发生精度丢失的,但是这种转换永远不会导致Java虚拟机抛出运行时异常。
3、从byte、char和short类型到int类型的宽化类型转换实际上是不存在的 。对于byte类型转换为int,虚拟机并没有做实质性的转化处理,只是简单地通过操作数栈交换了两个数据。而byte转为long时,使用的是i2l,可以看到在内部byte在这里已经等同于int类型处理,类似的还有short类型,这种处理方式有两个特点:
-
一方面可以减少实际的数据类型,如果为short和byte都准备一套指令,那么指令的数量就会大增,而虚拟机目前的设计上,只愿意使用一个字节表示指令,因此指令总数不能超过256个,为了节省指令资源,将short和byte当作int处理 。 -
另一方面,由于局部变量表中的槽位固定为32位,无论是byte或者short存入局部变量表,都会占用32位空间。从这个角度来说,也没有必要特意区分这几种数据类型。
public class ClassCaseText {
public void method1() {
int i = 10;
long l = i;
float f = i;
double d = i;
float f1 = l;
double d1 = l;
double d2 = f1;
}
@Test
public void method2() {
int i = 123123123;
float f = i;
System.out.println(f);
long l = 123123123123L;
l = 123123123123123123L;
double d = l;
System.out.println(d);
}
public void method3(byte b, short s, char c) {
int i1 = b;
long l1 = b;
double d1 = b;
int i2 = s;
long l2 = s;
double d2 = s;
int i3 = c;
long l3 = c;
double d3 = c;
}
}
1、method1对应的字节码信息如下
2、method2对应的字节码信息如下
3、method3对应的字节码信息如下
3、窄化类型转换
1、处理窄化类型转换(Narrowing Numeric Conversion)时就必须显式地使用转换指令来完成 :
-
int类型到byte、short或者char类型对应的指令有:i2b、i2s、i2c -
long类型到int类型对应的指令有:l2i -
float类型到int或者long类型对应的指令有:f2i、f2l -
double类型到int、long或者float类型对应的指令有:d2i、d2l、d2f -
long类型到byte类型先l2i再i2b
2、精度损失问题
-
窄化类型转换可能会导致转换结果具备不同的正负号、不同的数量级,因此,转换过程很可能会导致数值丢失精度。 -
尽管数据类型窄化转换可能会发生上限溢出、下限溢出和精度丢失等情况,但是Java虚拟机规范中明确规定数值类型的窄化转换指令永远不可能导致虚拟机抛出运行时异常。
3、当一个浮点值窄化转换为整数类型T(T限于int或long类型之一)的时候,将遵循以下转换规则:
-
如果浮点值是NaN,那转换结果就是int或long类型的0。 -
如果浮点值不是无穷大的话,浮点值使用IEEE 754的向零舍入模式取整,获得整数值v,如果v在目标类型T(int或long)的表示范围之内,那转换结果就是v。否则,将根据v的符号,转换为T所能表示的最大或者最小正数。
4、当一个double类型窄化转换为float类型时,将遵循以下转换规则:
-
通过IEEE 754向最接近数舍入模式舍入一个可以使用float类型表示的数字。 -
如果转换结果的绝对值太小而无法使用float来表示,将返回float类型的正负零。 -
如果转换结果的绝对值太大而无法使用float来表示,将返回float类型的正负无穷大。(Infinity) -
对于double类型的NaN值将按规定转换为float类型的NaN值。
public class ClassCaseText {
public void method4() {
int i = 10;
byte b = (byte) i;
short s = (short) i;
char c = (char) i;
long l = 10L;
int i1 = (int) l;
byte b1 = (byte) l;
}
@Test
public void method5() {
int i = 128;
byte b = (byte) i;
System.out.println(b);
}
@Test
public void method6() {
double d1 = Double.NaN;
int i = (int) d1;
System.out.println(i);
double d2 = Double.POSITIVE_INFINITY;
long l = (long) d2;
int j = (int) d2;
System.out.println(l);
System.out.println(Long.MAX_VALUE);
System.out.println(j);
System.out.println(Integer.MAX_VALUE);
float f1 = (float) d2;
System.out.println(f1);
float f2 = (float) d1;
System.out.println(f2);
}
}
五、对象创建与访问指令
1、概述
1、Java是面向对象的程序设计语言。虚拟机平台从字节码层面就对面向对象做了深层次的支持。有一系列指令专门用于对象操作,可进一步细分为创建指令、字段访问指令、数组操作指令、类型检查指令 。
2、创建指令
1、虽然类实例和数组都是对象。但Java虚拟机对类实例和数组的创建与操作使用了不同的字节码指令
2、创建类实例的指令:new,它接收一个操作数,为指向常量池的索引,表示要创建的类型,执行完成后,将对象的引用压入栈 。
3、创建数组的指令:
-
newarray:创建基本类型数组 -
anewarray:创建引用类型数组 -
multianewarray:创建多维数组
public class NewTest {
public void newInterface() {
Object obj = new Object();
File file = new File("hello.txt");
}
public void newArray() {
int [] intArr = new int[10];
Object [] objArr = new Object[10];
int [][] mintArr = new int[10][10];
String [][] strArr = new String[10][];
}
}
1、创建对象方法对应的字节码信息如下:
2、字节码说明:
-
new指令创建一个对象之后,将对象的引用地址压入栈中。 -
dup指令将操作数栈栈顶的内容复制一份,压入栈中。 -
invokespecial指令方法调用指令,调用object的构造方法之后,复制内容就被使用了,出栈了。 -
astore_1指令将栈中内容放到局部变量表中索引为1的位置,这也刚好解释为什么需要复制一份,如果没有复制一份,那么在invokespecial指令执行之后,new指令创建对象的引用也就出栈了;因此复制一份后invokespecial指令使用的是复制的对象引用。
2、创建数组方法对应的字节码信息如下:
3、字段访问指令
1、对象创建后,就可以通过对象访问指令获取对象实例或数组实例中的字段或者数组元素。
-
访问类字段(static字段, 或者称为类变量)的指令:getstatic(把相应的字段压入到操作数栈中)、putstatic(把操作数栈的值弹出来并做赋值) 。 -
访问类实例字段(非static字段, 或者称为实例变量)的指令:getfield(把相应的字段压入到操作数栈中)、putfield(把操作数栈的值弹出来并做赋值) 。
public class NewTest {
public void callHello() {
System.out.println("hello");
}
}
1、对应的字节码信息如下:
4、数组操作指令
1、数组操作指令主要有:xastore和xaload指令 。
-
把一个数组元素加载到操作数栈的指令:baload、caload、saload、iaload、laload、faload、daload、aaload 。 -
将一个操作数栈的值存储到数组元素中的指令:bastore、castore、sastore、iastore、lastore、fastore、dastore、aastore(数组存放在堆,这些指令会修改堆里的值) 。
2、取数组长度的指令:arraylength,该指令弹出栈顶的数组,获取数组的长度,将长度压入栈 。
3、说明:
-
指令xaload表示将数组的元素压栈,比如saload、 caload分别表示压入short数组和char数组。指令xaload在执行时,要求操作数中栈顶元素为数组索引i,栈顶顺位第2个元素为数组引用a,该指令会弹出栈顶这两个元素,并将a[i]重新压入栈中 。 -
xastore则专门针对数组操作,以iastore为例, 它用于给一个int数组的给定索引赋值。在iastore执行前,操作数栈顶需要为此准备3个元素:值、索引、数组引用,iastore会弹出这3个值,并将值赋给数组中指定索引的位置 。
public class NewTest {
public void setArray() {
int [] arr = new int[10];
arr[3] = 20;
System.out.println(arr[1]);
}
public void arrayLength() {
int [] arr = new int[10];
System.out.println(arr.length);
}
}
1、数组操作方法对应的字节码信息如下:
2、数组长度方法对应的字节码信息如下:
5、类型检查指令
1、检查类实例或数组类型的指令:instanceof,checkcast
-
checkcast指令用于检查类型强制转换是否可以进行。如果可以进行。那么checkcast指令不会改变操作数栈,否则它会抛出ClassCastException异常 。 -
instanceof指令用来判断给定对象是否是某一个类的实例,它会将判断结果压入操作数栈 。
public class NewTest {
public String checkCast(Object obj) {
if (obj instanceof String) {
return (String) obj;
} else {
return null;
}
}
}
1、对应的字节码信息如下:
六、方法调用与返回指令
1、方法调用指令
1、方法调用指令的五种指令:
-
invokevirtual :用于调用对象的实例方法,根据对象的实际类型进行分派(虚方法分派),支持多态(方法重写),这也是最常见的方法分派方式。 -
invokeinterface :用于调用接口方法,会在运行时搜索一个实现了这个接口方法的对象,并找出适合的方法进行调用。 -
invokespecial :用于调用一些需要特殊处理的实例方法,包括实例初始化方法(构造器)、私有方法和父类方法 。这些方法都是静态类型绑定的,不会在调用时进行动态派发(因为这三个方法不会被重写)。 -
invokestatic :用于调用类静态方法(static方法),这是静态绑定的。 -
invokedynamic :用于在运行时动态解析出调用点限定符所引用的方法。并执行该方法。前4条调用指令的分派逻辑都固化在Java虚拟机内部,用户无法改变,而invokedynamic指令的分派逻辑是由用户所设定的引导方法决定的。 -
注意:方法调用指令与数据类型无关 。 -
2、代码示例:
2、方法返回指令
1、方法调用结束前,需要进行返回,方法返回指令是根据返回值类型进行区分的 。
2、ireturn :当返回值是boolean、byte、char、short和int类型时使用。
3、lreturn,freturn,dreturn、areturn :对应返回值类型为long、float、double、reference。
4、return :指令供声明为void的方法、实例初始化方法以及类和接口的类初始化方法使用。
5、举例:ireturn指令会将当前函数操作数栈的顶层元素弹出,并将这个元素压入调用者函数的操作数栈中(因为调用者非常关注函数的返回值)。
6、如果当前返回的是synchronized方法,那么还会执行一个隐含的monitorexit指令,退出临界区,最后会丢弃当前方法的整个帧,恢复调用者的帧,并将控制权交给调用者。
七、操作数栈管理指令
1、概述
1、操作数栈管理指令:如同操作一个普通数据结构中的堆栈那样,JVM提供的操作数栈管理指令,可以用于直接操作操作数栈的指令。
2、指令如下:
-
pop、pop2 :将一个或两个元素从栈顶弹出,并且直接废弃。 -
dup、dup2、dup_x1、dup2_x1、dup_x2、dup2_x2 :复制栈顶一个或两个数值并将赋值值或双份的复制值重新压入栈顶。 -
swap :将栈最订顶端的两个Slot数值位置交换。java虚拟机没有提供交换两个64位数据类型(long、double)数值的命令 。 -
nop :是一个特殊的指令,它的字节码为0x00。和汇编语言中的nop一样,它表示什么都不做。可用于调试、占位等。 -
补充:这些指令属于通用型,对栈的压入或者弹出无需指明数据类型。
2、详细说明
1、不带_x的指令 是复制栈顶数据并压入栈顶。包括两个指令,dup与dup2,dup的系数代表要复制的Slot个数 。
-
dup开头的指令用于复制1个Slot的数据,比如:1个int或者1个reference类型数据。 -
dup2开头的指令用于复制2个Slot的数据。比如:1个long、2个int、1个int+1个float类型数据。
2、带_x的指令 是复制栈顶数据并插入栈顶以下的某个位置。包括四个指令,dup_x1、dup2_x1、dup2_x1、dup2_x2。对于带_x的复制插入指令,只要将指令的dup和x的系数相加,结果即为需要插入的位置 。
-
dup_x1插入位置:1+1=2, 即栈顶2个Slot下面 -
dup_x2插入位置:1+2=3,即栈项3个Slot下面 -
dup2_x1插入位置:2+1=3, 即栈顶3个Slot下面 -
dup2_x2插入位置:2+2=4, 即栈顶4个Slot下面
3、pop :将栈顶的1个Slot数值出栈。如1个short类型数值
4、pop2 :将栈顶的2个Slot数值出栈。如1个double类型数值,或者2个int类型数值
3、示例
public class StackOperateTest {
private long index = 0;
public void method1() {
Object obj = new Object();
String s = obj.toString();
obj.toString();
}
public void method2() {
method3();
}
public long method3() {
return 0;
}
public long method4() {
return index++;
}
}
1、方法1的字节码指令说明:
2、方法2的字节码指令说明:
3、方法4的字节码指令说明:
八、控制转移指令
1、概述
1、控制转移指令可以让Java虚拟机有条件或无条件地从指定位置指令(而不是控制转移指令)的下 一条指令继续执行程序,从概念模型上理解,可以认为控制指令就是在有条件或无条件地修改PC寄存器的值。
2、大体可分为:条件跳转指令、比较指令、比较条件跳转指令、多条件分支跳转指令、无条件跳转指令等。
2、条件跳转指令
1、条件跳转指令通常和比较指令结合使用。在条件跳转指令执行前,一般可以先用比较指令进行栈顶元素的准备,然后进行条件的跳转。
2、条件跳转指令有:ifeq、iflt、ifle、ifne、ifgt、ifge、ifnull、ifnonnull 。这些指令都接收两个字节的操作数,用于计算跳转的位置(16位符号整数作为当前位置的offset)。
3、它们的统一含义为:弹出栈顶元素,判断它是否满足某一条件,如果满足条件,则跳转到给定位置
4、与前面的运算规则一致:
-
对于boolean、byte、char、short类型的条件分支比较操作,都是使用int类型的比较指令完成。 -
对于long、float、double类型的条件分支比较操作,则会先执行相应类型的比较运算指令,运算指令会返回一个整型值到操作数栈中,随后再执行int类型的条件分支比较操作来完成整个分支跳转。
5、由于各类型的比较最终都会转为int类型的比较操作,所以Java虚拟机提供的int类型的条件分支指令是最为丰富和强大的。
public class ConditionJump {
public void method1() {
int a = 1;
if (a == 0) {
a = 10;
} else {
a = 20;
}
}
public boolean method2(String str) {
if (str == null) {
return true;
} else {
return false;
}
}
public void method3() {
int i = 10;
long j = 20;
System.out.println(i > j);
}
public int method4(double d) {
if (d > 50.0) {
return 1;
} else {
return -1;
}
}
}
1、method1方法对应字节码说明:
2、method3方法对应字节码说明:
3、比较条件跳转指令
1、比较条件跳转指令类似于比较指令和条件跳转指令的结合体,它将比较和跳转两个步骤合二为一。
2、比较条件跳转指令有:if_icmpeq、if_icmpne、if_icmplt、if_icmpgt、if_icmple、 if_icmpge、if_acmpeq和if_acmpne 。其中指令助记符加上“if_”后,以字符“i”开头的指令针对int型整数操作(也包括short和byte类型),以字符“a”开头的指令表示对象引用的比较。
3、指令含义:这些指令都接收两个字节的操作数作为参数,用于计算跳转的位置。同时在执行指令时,栈顶需要准备两个元素进行比较。指令执行完成后,栈顶的这两个元素被清空,且没有任何数据入栈。如果预设条件成立,则执行跳转,否则,继续执行下一条语句 。
public class CompareConditionJump {
public void method1() {
int i = 10;
int j = 20;
System.out.println(i < j);
}
public void method2() {
short s = 9;
byte b = 10;
System.out.println(s > b);
}
public void method3() {
Object obj1 = new Object();
Object obj2 = new Object();
System.out.println(obj1 == obj2);
System.out.println(obj1 != obj2);
}
}
1、method1方法对应字节码说明:
2、method3方法对应字节码说明:
4、多条件分支跳转
1、多条件分支跳转指令是专为switch-case语句设计的,主要有tableswitch和lookupswitch 。
2、从助记符上看,两者都是switch语句的实现,它们的区别:
-
tableswitch要求多个条件分支值是连续的 ,它内部只存放起始值和终止值,以及若干个跳转偏移量,通过给定的操作数index,可以立即定位到跳转偏移量位置,因此效率比较高 。 -
lookupswitch内部存放着各个离散的case-offset对 ,每次执行都要搜索全部的case-offset对,找到匹配的case值,并根据对应的offset计算跳转地址,因此效率较低 。
3、指令tableswitch的示意图如下图所示。由于tableswitch的case值是连续的,因此只需要记录最低值和最高值,以及每项对应的offset偏移量,根据给定的index值通过简单的计算即可直接定位到offset。
4、指令lookupswitch处理的是离散的case值,但是出于效率考虑,将case-offset对按照case值大小排序 ,给定index时,需要查找与index相等的case,获得其offset,如果找不到则跳转到default。
public class MoreConditionJump {
public void method1(int var) {
int num;
switch (var) {
case 1:
num = 10;
break;
case 2:
num = 20;
break;
case 3:
num = 30;
break;
default:
num = 40;
}
}
public void method2(int var) {
int num;
switch (var) {
case 100:
num = 10;
break;
case 500:
num = 20;
break;
case 300:
num = 30;
break;
default:
num = 40;
}
}
public void method3(String var) {
switch (var) {
case "SPRING": break;
case "SUMMER": break;
}
}
}
1、mthod1方法对应的字节码:
2、mthod2方法对应的字节码:
3、mthod3方法对应的字节码:
5、无条件跳转指令
1、指令goto 接收两个字节的操作数,共同组成一个带符号的整数,用于指定指令的偏移量,指令执行的目的就是跳转到偏移量给定的位置处 。
2、如果指令偏移量太大,超过双字节的带符号整数的范围,则可以使用指令goto_w,它和goto有相同的作用,但是它接收4个字节的操作数,可以表示更大的地址范围。
3、指令jsr、jsr_w、ret 虽然也是无条件跳转的,但主要用于try-finally语句,且已经被虚拟机逐渐废弃 。
public class NonConditionJump {
public void method1() {
int i = 0;
while (i < 100) {
String s = "hello";
i ++;
}
}
}
1、对应字节码说明:
九、异常处理指令
1、抛出异常指令
1、在Java程序中显示抛出异常的操作(throw语句)都是由athrow (a引用类型)指令来实现。
2、除了使用throw语句显示抛出异常情况之外,JVM规范还规定了许多运行时异常会在其他Java虚拟机指令检测到异常状况时自动抛出(字节码文件中看不到抛异常的指令) 。如:当除数为零时,虚拟机会在idiv或ldiv指令中抛出ArithmeticException异常。
3、注意:正常情况下,操作数栈的压入弹出都是一条条指令完成的。唯一的例外情况是在抛异常时,Java 虚拟机会清除操作数栈上的所有内容,而后将异常实例压入调用者操作数栈上。
public class ThrowExceptionTest {
public void method1(int i) {
if (i == 0) {
throw new RuntimeException("参数为0");
}
}
public void method2(int i) throws RuntimeException {
if (i == 1) {
throw new RuntimeException("参数为0");
}
}
public void method3() {
int i = 10;
int j = i / 0;
System.out.println(j);
}
}
1、mthod1方法对应的字节码:
2、mthod2方法对应的字节码:不仅有抛出指令还有异常表
3、mthod3方法对应的字节码:对于已经定义好的运行时异常,会自动抛出,因此字节码中看不到抛出指令
2、异常表
1、在Java虚拟机中,处理异常(catch语句) 不是由字节码指令来实现的(早期使用jsr、ret指令),而是采用异常表来完成的 。
2、如果一个方法定义了一个try-catch或者try-finally的异常处理,就会创建一个异常表。它包含了每个异常处理或者finally块的信息。异常表保存了每个异常处理信息。
-
起始位置 -
结束位置 -
程序计数器记录的代码处理的偏移地址 -
被捕获的异常类在常量池中的索引
3、当一个异常被抛出时,JVM会在当前的方法里寻找一个匹配的处理,如果没有找到,这个方法会强制结束并弹出当前栈帧 ,并且异常会重新抛给上层调用的方法(在调用方法栈帧)。如果在所有栈帧弹出前仍然没有找到合适的异常处理,这个线程将终止。如果这个异常在最后一个非守护线程里抛出,将会导致JVM自已终止,比如这个线程是个main线程。
4、不管什么时候抛出异常,如果异常处理最终匹配了所有异常类型,代码就会继续执行 。在这种情况下,如果方法结束后没有抛出异常,仍然执行finally块, 在return前, 它直接跳到finally块来完成目标。
public class TryCatchTest {
public void method1() {
try {
File file = new File("D:/test.txt");
FileInputStream fis = new FileInputStream(file);
String s = "hello";
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (RuntimeException e) {
e.printStackTrace();
}
}
}
1、对应的异常表信息:
-
如果0-22行指令之间出现异常,异常类型属于FileNotFoundException,那么就跳转到25行指令处 -
如果0-22行指令之间出现异常,异常类型属于RuntimeException,那么就跳转到33行指令处
2、对应的字节码信息:
十、同步控制指令
1、概述
1、Java虚拟机支持两种同步结构:方法级的同步和方法内部一段指令序列的同步 ,这两种同步结构都是使用管程(Monitor,更常见的是直接将它称为“锁”)来实现的。
2、方法级同步
1、方法级的同步是隐式的 ,无须通过字节码指令来控制,它实现在方法调用和返回操作之中 。虚拟机可以从方法常量池中的方法表结构中的ACC_SYNCHRONIZED访问标志得知一个方法是否被声明为同步方法。
2、当方法调用时,调用指令将会检查方法的ACC_SYNCHRONIZED访问标志是否被设置。
-
如果设置了,执行线程就要求先成功持有同步锁,然后才能执行方法,最后当方法完成(无论是正常完成 还是非正常完成)时释放同步锁 。 -
在方法执行期间,执行线程持有了同步锁,其他任何线程都无法再获取到同一个锁 。 -
如果一个同步方法执行期间抛出了异常,并且在方法内部无法处理此异常,那这个同步方法所持有的锁将在异常抛到同步方法之外时自动释放 。
public class SynchronizedTest {
private int i = 0;
public synchronized void method1() {
i++;
}
}
1、对应的字节码信息:
2、说明:这段代码和普通的无同步操作的字节码没有什么区别,没有使用monitorenter和monitorexit进行同步区控制。这是因为,对于同步方法而言,当虚拟机通过方法的访问标示符判断是一个同步方法时,会自动在方法调用前进行加锁 ,当同步方法执行完毕后,不管方法是正常结束还是有异常抛出,均会由虚拟机释放这个锁。因此,对于同步方法而言,monitorenter和monitorexit指令是隐式存在的,并未直接出现在字节码中 。
3、方法内部一段指令序列的同步
1、同步一段指令集序列:通常是由Java中的synchronized语句块来表示的 。JVM的指令集有monitorenter和monitorexit两条指令来支持synchronized关键字的语义 。
2、当一个线程进入同步代码块时,它使用monitorenter指令请求进入 。如果当前对象的监视器计数器为0,则它会被准许进入,若为1,则判断持有当前监视器的线程是否为自己,如果是,则进入,否则进行等待,直到对象的监视器计数器为0,才会被允许进入同步块。
3、当线程退出同步块时,需要使用monitorexit声明退出 。在Java虚拟机中,任何对象都有一个监视器与之相关联,用来判断对象是否被锁定,当监视器被持有时,对象处于锁定状态。
4、指令monitorenter和monitorexit在执行时,都需要在操作数栈顶压入对象,之后monitorenter和monitorexit的锁定和释放都是针对这个对象的监视器进行的 。
5、下图展示了监视器如何保护临界区代码不同时被多个线程访问,只有当线程4离开临界区后,线程1、2、3才有可能进入。
public class SynchronizedTest {
private int i = 0;
public void method2(Object obj){
synchronized (obj){
i--;
}
}
}
1、对应的异常表信息:
2、对应的字节码信息:
3、补充说明:
-
编译器必须确保无论方法通过何种方式完成,方法中调用过的每条monitorenter指令都必须执行其对应的monitorexit指令,而无论这个方法是正常结束还是异常结束 。 -
为了保证在方法异常完成时monitorenter和monitorexit指令依然可以正确配对执行,编译器会自动产生一个异常处理器,这个异常处理器声明可处理所有的异常,它的目的就是用来执行monitorexit指令 。
|