JIT编译器作用和原理 – 编程技术之美-IT之美

发表于2023年2月21日2023年7月15日作者 IT之美

JIT是什么

JIT（Just-In-Time）编译器是Java虚拟机在运行时对字节码进行动态编译的一种机制。JIT编译器可以把字节码编译成本地机器码，这样就可以提高程序的运行速度。

JIT编译器的主要作用是把频繁执行的代码块（Hot Spot）进行即时编译，然后将编译结果缓存起来，以便下次执行相同的代码块时直接使用编译结果，避免重复编译和解释执行。

以下是一个简单的示例，演示JIT编译器的作用：

public class JITExample {
    public static void main(String[] args) {
        long startTime = System.currentTimeMillis();
        int sum = 0;
        for (int i = 0; i < 100000000; i++) {
            sum += i;
        }
        long endTime = System.currentTimeMillis();
        System.out.println("sum = " + sum);
        System.out.println("Time elapsed: " + (endTime - startTime) + " ms");
    }
}

上面的代码是一个简单的累加器，对100000000个数进行累加。在第一次执行时，JVM会对代码进行解释执行，而在第二次执行时，JVM会把循环体编译成本地机器码。以下是第二次执行的输出：

sum = 4999999950000000
Time elapsed: 98 ms

可以看到，第二次执行的速度要比第一次快很多。这是因为第一次执行时，JVM需要对代码进行解释执行，而第二次执行时，JVM已经对代码进行了优化，使用了本地机器码，所以执行速度更快。

需要注意的是，JIT编译器并不是所有情况下都能起到优化的作用，只有在执行频率较高的代码块（Hot Spot）上才能发挥最大的优化作用。

基于上面的例子，我们有一个疑问：JIT是对整个代码进行缓存，从而提升性能的吗？
JIT 是基于 HotSpot 虚拟机的解释器和编译器组合的执行优化机制。在运行过程中，HotSpot 虚拟机可以根据运行时的统计信息对部分代码进行实时编译，生成对应平台的本地机器码，从而提升执行性能。

具体来说，JIT 编译器并不是对整个代码进行缓存，而是在运行过程中，动态地把热点代码（经常被执行的代码）进行实时编译并缓存，从而提升这部分代码的执行性能。

在刚刚那个例子中，如果 for 循环的执行次数比较大（比如 1000000 次），那么该循环内的代码就成为了热点代码，JIT 编译器可能会对该循环进行实时编译并缓存。对于该循环后续的执行，JIT 编译器就可以直接执行本地机器码，而不需要每次都通过解释器执行字节码。这样，循环体内的代码就可以得到加速执行。

执行本地机器码和通过解释器执行字节码，二者的区别在哪，为什么执行本地机器码性能会提升？

在Java程序运行时，如果使用解释器执行字节码，那么每个指令都需要被解释器翻译成本地机器码再执行，这个过程需要消耗很多时间。而如果使用JIT编译器，它会将一段被重复执行的字节码编译成本地机器码并缓存起来，以后每次执行这段代码时就直接运行本地机器码，跳过了字节码的解释和翻译过程，从而提高了程序的执行速度。

总体而言，执行本地机器码的速度比解释执行字节码的速度要快得多，因为本地机器码直接在CPU上执行，而不需要额外的翻译和解释过程，这也是JIT编译器提升Java程序性能的主要机制之一。

既然是这样，那为什么不把所有代码都编译成本地机器码，从而提升效率，而只是将热点代码编译成本地机器码进行缓存？

将所有代码都编译成本地机器码可能会带来以下问题：

额外的编译时间和空间开销：编译整个程序需要大量时间和空间。特别是对于大型程序，编译时间可能会很长，占用大量空间。

对于少数使用频率较低的代码，编译成本地机器码的开销可能会超过运行该代码的收益，这种情况下编译成本地机器码就没有意义了。

应用程序的可移植性问题。如果应用程序的代码全部编译成本地机器码，那么该程序就只能在支持该平台的机器上运行，无法实现跨平台运行。

因此，JIT 编译器会选择热点代码进行本地机器码的编译，以避免上述问题，并在保证程序正确性的前提下提高运行效率。

JIT 编译器编辑的成本地机器码缓存在哪里？

JIT 编译器编译出来的本地机器码会缓存到内存中，存储在被称为“代码缓存”或“方法区”（Metaspace）的区域中。代码缓存是 JVM 在运行时用来存储编译后的本地机器代码的专用区域，与堆空间相互独立，具有高效、独立的内存分配和回收机制。代码缓存默认大小与堆空间一样，可以通过 JVM 参数来调整，例如 -XX:ReservedCodeCacheSize 和 -XX:InitialCodeCacheSize。

在代码缓存中，JIT 编译器会把编译后的本地机器码缓存起来，以便下次执行相同代码时可以直接使用，而不需要重新解释和编译。这样可以提高程序的执行效率，特别是对于那些执行频繁的代码块，因为这些代码块经常被执行，所以缓存的效果也会更加显著。