Java8自动使用多核?

Java 8 automatically using multicore?

我一年前用 java 7 做了一些关于多核的测试。首先我只在主线程中实现了一些计算(CPU 用法表明只有一个核心完成了所有工作)和然后我用一个 ExecutorService 实例实现了 Callable。虽然 运行 它是所有工作的核心。

现在,一年后,我必须实现一个小程序(使用 java 8)来插入大量数据。所有工作都在主线程中实现(没有 Callable 和 ExecutorService),但是当我是 运行 程序时 CPU 用法告诉我,所有 4 个核心都在 98%。

那么 java 8 会自动将工作分配到所有 CPU 核心上吗?我很困惑...

这里是一些代码...

MapGenerator.java

    Region[][] regions = new Region[numOfRegions][numOfRegions];

    for(int x = 0; x < regions.length; x++){
        for(int z = 0; z < regions[x].length; z++){
            newLat = SRTMHandler.getNewLatitude(startLat, z * regionSize * 16);
            newLon = SRTMHandler.getNewLongitude(startLon, x * regionSize * 16, newLat);

            regions[x][z] = new Region(x, z, regionSize, newLat, newLon);
        }
    }

Region.java:

private Chunk[] chunks;    

public Region(int x, int z, int size, float startLat, float startLon){
    this.chunks = new Chunk[this.size][this.size];
    //Init stuff
    float newLat = this.startLat, newLon = this.startLon;

    for(int newX = 0; newX < this.size; newX++){
        for(int newZ = 0; newZ < this.size; newZ++){
            newLat = SRTMHandler.getNewLatitude(this.startLat, newZ * 16);
            newLon = SRTMHandler.getNewLongitude(this.startLon, newX * 16, newLat);

            this.chunks[newX][newZ] = new Chunk(this.x * this.size + newX, this.z * this.size + newZ, 16, 900, this, newLat, newLon);
        }
    }
}

Chunk.java:(SRTMHandler.getHeightForLatLon() 做一些地理计算,然后读取字节数组中的值,没什么特别的)

public Chunk(int x, int z, int size, int height, Region r, float startLat, float startLon){
    this.blocks = new Block[size][size][height];
    //Init stuff

    try {
        this.calcSurface();
        //System.out.println("Finished " + this.toString());
    } catch (IOException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }
}

private void calcSurface() throws IOException{
    int x1 = this.x;
    int x2 = this.x + 16;
    int z1 = this.z;
    int z2 = this.z + 16;
    final int radius = 45;
    float q11 = SRTMHandler.getHeightForLatLon(SRTMHandler.getNewLatitude(this.startLat, (-1)*radius), SRTMHandler.getNewLongitude(this.startLon, (-1)*radius, this.startLat));
    float q12 = SRTMHandler.getHeightForLatLon(SRTMHandler.getNewLatitude(this.startLat, radius), SRTMHandler.getNewLongitude(this.startLon, (-1)*radius, this.startLat));
    float q21 = SRTMHandler.getHeightForLatLon(SRTMHandler.getNewLatitude(this.startLat, (-1)*radius), SRTMHandler.getNewLongitude(this.startLon, radius, this.startLon));
    float q22 = SRTMHandler.getHeightForLatLon(SRTMHandler.getNewLatitude(this.startLat, radius), SRTMHandler.getNewLongitude(this.startLon, radius, this.startLat));

    for(int x = 0; x < this.blocks.length; x++){
        for(int z = 0; z < this.blocks[x].length; z++){
            float height = Interpolation.biLerp(x, z, q11, q12, q21, q22, x1, x2, z1, z2);

            this.blocks[x][z][(int)Math.round(height)] = new Block(this.x * this.size + x, this.z * this.size + z, (int)Math.round(height), BlockType.Grass, this);
        }
    }
}

Java 8 不会自动在所有 CPU 核心上分配工作,除非您的代码明确请求它(例如通过使用并行流)。

在某些特殊情况下,Hotspot 编译器将 auto-vectorize the code, see for example JDK-6340864. However, automatic vectorization is using special SIMD CPU 指令,而不是多个 CPU 指令。

另请参阅这些答案:

  • Does the JVM have the ability to detect opportunities for parallelization?
  • Automatic parallelization

(注意我重写了答案,删除了评论更正的部分)

我也遇到过这种情况。在我的例子中,频繁的垃圾收集导致了显着的高 (98%) CPU 使用率。正如原始问题下的几条评论所指出的,java GC 默认使用多线程。

在我看来,您的程序未 CPU 绑定。因此,不太可能完全使用4核。另一方面,当没有足够的堆 space 分配给你的程序时,频繁的 GC 很容易耗尽 CPU 资源。增加堆大小后,一切都很好。