java cpu 分析准确度

java cpu profiling accuracy

我尝试确保某些(免费)java cpu 分析工具的准确性,例如sjk, visualvm.

这是一个示例程序,用于执行 cpu 敏感任务:

RandomStringUtils.java:

import java.util.Random;

public class RandomStringUtils {
    public String generate() {
        int leftLimit = 97; // letter 'a'
        int rightLimit = 122; // letter 'z'
        int targetStringLength = 10;
        Random random = new Random();
        StringBuilder buffer = new StringBuilder(targetStringLength);
        for (int i = 0; i < targetStringLength; i++) {
            int randomLimitedInt = leftLimit + (int)
                (random.nextFloat() * (rightLimit - leftLimit + 1));
            buffer.append((char) randomLimitedInt);
        }

        return buffer.toString();
    }
}

MainClass.java:

import java.security.MessageDigest;
import java.security.NoSuchAlgorithmException;

public class MainClass {

    public String crypt(String str) {
        if (str == null || str.length() == 0) {
            throw new IllegalArgumentException("String to encript cannot be null or zero length");
        }
        StringBuilder hexString = new StringBuilder();
        try {
            MessageDigest md = MessageDigest.getInstance("MD5");
            md.update(str.getBytes());
            byte[] hash = md.digest();
            for (byte aHash : hash) {
                if ((0xff & aHash) < 0x10) {
                    hexString.append("0" + Integer.toHexString((0xFF & aHash)));
                } else {
                    hexString.append(Integer.toHexString(0xFF & aHash));
                }
            }
        } catch (NoSuchAlgorithmException e) {
            e.printStackTrace();
        }
        return hexString.toString();
    }

    public static void main(String[] args) {
        long N = 1000 * 100;
        if (args.length > 0) {
            N = Long.parseLong(args[0], 10);
        }
        MainClass main = new MainClass();
        RandomStringUtils randomStringUtils = new RandomStringUtils();
        for (long i = 0; i < N; i++) {
            main.crypt(randomStringUtils.generate());
        }
    }
}

比如我用sjk对cpu:

进行采样
java -jar sjk-plus-0.11.jar stcap -p 3113 -f main -i 5ms -t 30s -o dump.std
java -jar sjk-plus-0.11.jar flame -f dump.std -o report.html

这里我的问题是,为什么main()的自拍时间这么长?它只执行循环。 encrypt()generate()不是占了整个cpu吗?

visualvm 显示了类似的结果。

sjk有没有考虑自己的时间和整个时间?如何在命令行报告中显示它们?

这是安全点偏差的一个非常明显的例子。

下面 3 个火焰图是您的代码稍作修改后的版本 (see on github)。

使用华小抽样

SJK 正在使用线程转储采样方法,因此结果因 safepoint 偏差而出现偏差。

使用Java飞行记录器

JFR 在采样时不受安全点偏差的影响,但 JIT 编译器生成的符号映射默认仅限于安全点检查。这对重建堆栈跟踪有负面影响。

虽然结果优于线程转储采样,但您可以看到异常情况。例如。 Integer.toHexString时间肯定被夸大了。

使用 Java 飞行记录器和其他 JVM 选项

-XX:+UnlockDiagnosticVMOptions -XX:+DebugNonSafepoints

这个对 JVM 启动选项图片的调整变得更加准确和详细。 -XX:+DebugNonSafepoints 强制 JIT 编译器生成详细的符号映射。

判断这个例子,您可以得出结论,Java Flight Recorder 普遍更好。

Here 你可以找到对这种现象的更详尽的解释。