Java JIT 会在 运行 JDK 代码时作弊吗?
Does Java JIT cheat when running JDK code?
我正在对一些代码进行基准测试,即使使用完全相同的算法,我也无法像 java.math.BigInteger
那样快地达到 运行。
所以我将 java.math.BigInteger
源复制到我自己的包中并尝试了这个:
//import java.math.BigInteger;
public class MultiplyTest {
public static void main(String[] args) {
Random r = new Random(1);
long tm = 0, count = 0,result=0;
for (int i = 0; i < 400000; i++) {
int s1 = 400, s2 = 400;
BigInteger a = new BigInteger(s1 * 8, r), b = new BigInteger(s2 * 8, r);
long tm1 = System.nanoTime();
BigInteger c = a.multiply(b);
if (i > 100000) {
tm += System.nanoTime() - tm1;
count++;
}
result+=c.bitLength();
}
System.out.println((tm / count) + "nsec/mul");
System.out.println(result);
}
}
当我 运行 这个(jdk 1.8.0_144-b01 在 MacOS 上)它输出:
12089nsec/mul
2559044166
当我 运行 它的导入行未注释时:
4098nsec/mul
2559044166
使用 JDK 版本的 BigInteger 几乎是我的版本的三倍,即使它使用的是完全相同的代码。
我用 javap 检查了字节码,并比较了 运行 选项时的编译器输出:
-Xbatch -XX:-TieredCompilation -XX:+PrintCompilation -XX:+UnlockDiagnosticVMOptions
-XX:+PrintInlining -XX:CICompilerCount=1
而且这两个版本生成的代码似乎相同。
那么热点是否使用了一些我无法在我的代码中使用的预计算优化?我一直都明白他们没有。
如何解释这种差异?
是的,HotSpot JVM 有点像 "cheating",因为它有一些 BigInteger
方法的特殊版本,您在 Java 代码中找不到这些方法。这些方法称为 JVM intrinsics.
特别是,BigInteger.multiplyToLen
是 HotSpot 中的一个固有方法。 JVM源代码库中有一个特殊的hand-coded assembly implementation,但只适用于x86-64架构。
您可以使用 -XX:-UseMultiplyToLenIntrinsic
选项禁用此内部函数以强制 JVM 使用纯 Java 实现。在这种情况下,性能将与您复制的代码的性能相似。
P.S. 这里有一个 list 的其他 HotSpot 内部方法。
在Java8这确实是一个内在方法;该方法的略微修改版本:
private static BigInteger test() {
Random r = new Random(1);
BigInteger c = null;
for (int i = 0; i < 400000; i++) {
int s1 = 400, s2 = 400;
BigInteger a = new BigInteger(s1 * 8, r), b = new BigInteger(s2 * 8, r);
c = a.multiply(b);
}
return c;
}
运行 这与:
java -XX:+UnlockDiagnosticVMOptions
-XX:+PrintInlining
-XX:+PrintIntrinsics
-XX:CICompilerCount=2
-XX:+PrintCompilation
<YourClassName>
这将打印很多行,其中之一是:
java.math.BigInteger::multiplyToLen (216 bytes) (intrinsic)
在 Java 9 另一方面,该方法似乎不再是内在方法,但它又调用了一个内在方法:
@HotSpotIntrinsicCandidate
private static int[] implMultiplyToLen
所以 运行 Java 9 下的相同代码(具有相同的参数)将显示:
java.math.BigInteger::implMultiplyToLen (216 bytes) (intrinsic)
下面是方法的相同代码 - 只是命名略有不同。
我正在对一些代码进行基准测试,即使使用完全相同的算法,我也无法像 java.math.BigInteger
那样快地达到 运行。
所以我将 java.math.BigInteger
源复制到我自己的包中并尝试了这个:
//import java.math.BigInteger;
public class MultiplyTest {
public static void main(String[] args) {
Random r = new Random(1);
long tm = 0, count = 0,result=0;
for (int i = 0; i < 400000; i++) {
int s1 = 400, s2 = 400;
BigInteger a = new BigInteger(s1 * 8, r), b = new BigInteger(s2 * 8, r);
long tm1 = System.nanoTime();
BigInteger c = a.multiply(b);
if (i > 100000) {
tm += System.nanoTime() - tm1;
count++;
}
result+=c.bitLength();
}
System.out.println((tm / count) + "nsec/mul");
System.out.println(result);
}
}
当我 运行 这个(jdk 1.8.0_144-b01 在 MacOS 上)它输出:
12089nsec/mul
2559044166
当我 运行 它的导入行未注释时:
4098nsec/mul
2559044166
使用 JDK 版本的 BigInteger 几乎是我的版本的三倍,即使它使用的是完全相同的代码。
我用 javap 检查了字节码,并比较了 运行 选项时的编译器输出:
-Xbatch -XX:-TieredCompilation -XX:+PrintCompilation -XX:+UnlockDiagnosticVMOptions
-XX:+PrintInlining -XX:CICompilerCount=1
而且这两个版本生成的代码似乎相同。 那么热点是否使用了一些我无法在我的代码中使用的预计算优化?我一直都明白他们没有。 如何解释这种差异?
是的,HotSpot JVM 有点像 "cheating",因为它有一些 BigInteger
方法的特殊版本,您在 Java 代码中找不到这些方法。这些方法称为 JVM intrinsics.
特别是,BigInteger.multiplyToLen
是 HotSpot 中的一个固有方法。 JVM源代码库中有一个特殊的hand-coded assembly implementation,但只适用于x86-64架构。
您可以使用 -XX:-UseMultiplyToLenIntrinsic
选项禁用此内部函数以强制 JVM 使用纯 Java 实现。在这种情况下,性能将与您复制的代码的性能相似。
P.S. 这里有一个 list 的其他 HotSpot 内部方法。
在Java8这确实是一个内在方法;该方法的略微修改版本:
private static BigInteger test() {
Random r = new Random(1);
BigInteger c = null;
for (int i = 0; i < 400000; i++) {
int s1 = 400, s2 = 400;
BigInteger a = new BigInteger(s1 * 8, r), b = new BigInteger(s2 * 8, r);
c = a.multiply(b);
}
return c;
}
运行 这与:
java -XX:+UnlockDiagnosticVMOptions
-XX:+PrintInlining
-XX:+PrintIntrinsics
-XX:CICompilerCount=2
-XX:+PrintCompilation
<YourClassName>
这将打印很多行,其中之一是:
java.math.BigInteger::multiplyToLen (216 bytes) (intrinsic)
在 Java 9 另一方面,该方法似乎不再是内在方法,但它又调用了一个内在方法:
@HotSpotIntrinsicCandidate
private static int[] implMultiplyToLen
所以 运行 Java 9 下的相同代码(具有相同的参数)将显示:
java.math.BigInteger::implMultiplyToLen (216 bytes) (intrinsic)
下面是方法的相同代码 - 只是命名略有不同。