单台 OSX 机器上的 Dask - 默认情况下是并行的吗?
Dask on single OSX machine - is it parallel by default?
我已经在 OSX Mojave 上安装了 Dask。它是否默认并行执行计算?或者我需要更改一些设置吗?
我正在使用 DataFrame API。这对答案有影响吗?
我是用pip安装的。这对答案有影响吗?
是的,Dask 默认是并行的。
除非您另外指定,或创建分布式 Client
,否则将使用 "threaded" 调度程序执行,线程数等于您的内核数。但是请注意,由于 python GIL(一次只执行一条 python 指令),您可能无法获得尽可能多的并行性,具体取决于您的特定任务在释放吉尔。这就是您可以选择调度程序的原因。
正在 OSX,使用 pip 安装:这些没有区别。使用数据框的不同之处在于它决定了您可能 运行 的任务类型。 Pandas擅长为很多操作释放GIL。
我已经在 OSX Mojave 上安装了 Dask。它是否默认并行执行计算?或者我需要更改一些设置吗?
我正在使用 DataFrame API。这对答案有影响吗?
我是用pip安装的。这对答案有影响吗?
是的,Dask 默认是并行的。
除非您另外指定,或创建分布式 Client
,否则将使用 "threaded" 调度程序执行,线程数等于您的内核数。但是请注意,由于 python GIL(一次只执行一条 python 指令),您可能无法获得尽可能多的并行性,具体取决于您的特定任务在释放吉尔。这就是您可以选择调度程序的原因。
正在 OSX,使用 pip 安装:这些没有区别。使用数据框的不同之处在于它决定了您可能 运行 的任务类型。 Pandas擅长为很多操作释放GIL。