JIT是什么
JIT(Just-In-Time)编译器是Java虚拟机在运行时对字节码进行动态编译的一种机制。JIT编译器可以把字节码编译成本地机器码,这样就可以提高程序的运行速度。
JIT编译器的主要作用是把频繁执行的代码块(Hot Spot)进行即时编译,然后将编译结果缓存起来,以便下次执行相同的代码块时直接使用编译结果,避免重复编译和解释执行。
以下是一个简单的示例,演示JIT编译器的作用:
public class JITExample {
public static void main(String[] args) {
long startTime = System.currentTimeMillis();
int sum = 0;
for (int i = 0; i < 100000000; i++) {
sum += i;
}
long endTime = System.currentTimeMillis();
System.out.println("sum = " + sum);
System.out.println("Time elapsed: " + (endTime - startTime) + " ms");
}
}
上面的代码是一个简单的累加器,对100000000个数进行累加。在第一次执行时,JVM会对代码进行解释执行,而在第二次执行时,JVM会把循环体编译成本地机器码。以下是第二次执行的输出:
sum = 4999999950000000
Time elapsed: 98 ms
可以看到,第二次执行的速度要比第一次快很多。这是因为第一次执行时,JVM需要对代码进行解释执行,而第二次执行时,JVM已经对代码进行了优化,使用了本地机器码,所以执行速度更快。
需要注意的是,JIT编译器并不是所有情况下都能起到优化的作用,只有在执行频率较高的代码块(Hot Spot)上才能发挥最大的优化作用。
基于上面的例子,我们有一个疑问:JIT是对整个代码进行缓存,从而提升性能的吗?
JIT 是基于 HotSpot 虚拟机的解释器和编译器组合的执行优化机制。在运行过程中,HotSpot 虚拟机可以根据运行时的统计信息对部分代码进行实时编译,生成对应平台的本地机器码,从而提升执行性能。
具体来说,JIT 编译器并不是对整个代码进行缓存,而是在运行过程中,动态地把热点代码(经常被执行的代码)进行实时编译并缓存,从而提升这部分代码的执行性能。
在刚刚那个例子中,如果 for 循环的执行次数比较大(比如 1000000 次),那么该循环内的代码就成为了热点代码,JIT 编译器可能会对该循环进行实时编译并缓存。对于该循环后续的执行,JIT 编译器就可以直接执行本地机器码,而不需要每次都通过解释器执行字节码。这样,循环体内的代码就可以得到加速执行。
执行本地机器码和通过解释器执行字节码,二者的区别在哪,为什么执行本地机器码性能会提升?
在Java程序运行时,如果使用解释器执行字节码,那么每个指令都需要被解释器翻译成本地机器码再执行,这个过程需要消耗很多时间。而如果使用JIT编译器,它会将一段被重复执行的字节码编译成本地机器码并缓存起来,以后每次执行这段代码时就直接运行本地机器码,跳过了字节码的解释和翻译过程,从而提高了程序的执行速度。
总体而言,执行本地机器码的速度比解释执行字节码的速度要快得多,因为本地机器码直接在CPU上执行,而不需要额外的翻译和解释过程,这也是JIT编译器提升Java程序性能的主要机制之一。
既然是这样,那为什么不把所有代码都编译成本地机器码,从而提升效率,而只是将热点代码编译成本地机器码进行缓存?
将所有代码都编译成本地机器码可能会带来以下问题:
额外的编译时间和空间开销:编译整个程序需要大量时间和空间。特别是对于大型程序,编译时间可能会很长,占用大量空间。
对于少数使用频率较低的代码,编译成本地机器码的开销可能会超过运行该代码的收益,这种情况下编译成本地机器码就没有意义了。
应用程序的可移植性问题。如果应用程序的代码全部编译成本地机器码,那么该程序就只能在支持该平台的机器上运行,无法实现跨平台运行。
因此,JIT 编译器会选择热点代码进行本地机器码的编译,以避免上述问题,并在保证程序正确性的前提下提高运行效率。
JIT 编译器编辑的成本地机器码缓存在哪里?
JIT 编译器编译出来的本地机器码会缓存到内存中,存储在被称为“代码缓存”或“方法区”(Metaspace)的区域中。代码缓存是 JVM 在运行时用来存储编译后的本地机器代码的专用区域,与堆空间相互独立,具有高效、独立的内存分配和回收机制。代码缓存默认大小与堆空间一样,可以通过 JVM 参数来调整,例如 -XX:ReservedCodeCacheSize 和 -XX:InitialCodeCacheSize。
在代码缓存中,JIT 编译器会把编译后的本地机器码缓存起来,以便下次执行相同代码时可以直接使用,而不需要重新解释和编译。这样可以提高程序的执行效率,特别是对于那些执行频繁的代码块,因为这些代码块经常被执行,所以缓存的效果也会更加显著。