IPython Jupyter 中的 Julia 并行计算

Julia parallel computing in IPython Jupyter

我正在 Ipython 中准备一个小型演示文稿,我想展示在 Julia 中进行并行操作是多么容易。

基本上是Monte Carlo圆周率计算described here

问题是我无法让它在 IPython (Jupyter) Notebook 中并行工作,它只使用一个。

我开始 Julia 是这样的:julia -p 4

如果我在 REPL 中定义函数并且 运行 它在那里工作正常。

@everywhere function compute_pi(N::Int)
    """
    Compute pi with a Monte Carlo simulation of N darts thrown in [-1,1]^2
    Returns estimate of pi
    """
    n_landed_in_circle = 0  
    for i = 1:N
        x = rand() * 2 - 1  # uniformly distributed number on x-axis
        y = rand() * 2 - 1  # uniformly distributed number on y-axis

        r2 = x*x + y*y  # radius squared, in radial coordinates
        if r2 < 1.0
            n_landed_in_circle += 1
        end
    end
    return n_landed_in_circle / N * 4.0    
end

function parallel_pi_computation(N::Int; ncores::Int=4)
    """
    Compute pi in parallel, over ncores cores, with a Monte Carlo simulation throwing N total darts
    """
    # compute sum of pi's estimated among all cores in parallel
    sum_of_pis = @parallel (+) for i=1:ncores
        compute_pi(int(N/ncores))
    end

    return sum_of_pis / ncores  # average value
end

julia> @time parallel_pi_computation(int(1e9))
elapsed time: 2.702617652 seconds (93400 bytes allocated)
3.1416044160000003

但是当我这样做时:

 using IJulia
 notebook()

并尝试在仅使用 1 个核心的笔记本电脑中做同样的事情:

In [5]:  @time parallel_pi_computation(int(10e8))
elapsed time: 10.277870808 seconds (219188 bytes allocated)

Out[5]:  3.141679988

那么,为什么 Jupyter 不使用所有内核?我该怎么做才能让它发挥作用?

谢谢。

解决这个问题的一种方法是创建一个始终使用 4 个内核的内核。为此,需要一些手动工作。我假设你在 unix 机器上。

在文件夹 ~/.ipython/kernels/julia-0.x 中,您将找到以下 kernel.json 文件:

{
  "display_name": "Julia 0.3.9",
  "argv": [
    "/usr/local/Cellar/julia/0.3.9_1/bin/julia",
    "-i",
    "-F",
    "/Users/ch/.julia/v0.3/IJulia/src/kernel.jl",
    "{connection_file}"
  ],
  "language": "julia"
}

如果复制整个文件夹cp -r julia-0.x julia-0.x-p4,并修改新复制的kernel.json文件:

{
  "display_name": "Julia 0.3.9 p4",
  "argv": [
    "/usr/local/Cellar/julia/0.3.9_1/bin/julia",
    "-p",
    "4",
    "-i",
    "-F",
    "/Users/ch/.julia/v0.3/IJulia/src/kernel.jl",
    "{connection_file}"
  ],
  "language": "julia"
}

您的路径可能会有所不同。请注意,我只给了内核一个新名称并添加了命令行参数`-p 4.

您应该会看到一个名为 Julia 0.3.9 p4 的新内核,它应该始终使用 4 个内核。

另请注意,此内核文件不会在您更新 IJulia 时更新,因此您必须在更新 juliaIJulia.[=20= 时手动更新它]

使用 addprocs(4) 作为笔记本中的第一个命令应该提供四个工作人员在笔记本中进行并行操作。

您可以使用此命令添加新内核:

using IJulia
#for 4 cores
installkernel("Julia_4_threads", env=Dict("JULIA_NUM_THREADS"=>"4"))

#or for 8 cores
installkernel("Julia_8_threads", env=Dict("JULIA_NUM_THREADS"=>"8"))

重新启动后 VSCode 此选项将显示您的 select kernel 选项。