如何从命令行 运行 一个 dask 分布式本地集群?

How can I run a dask-distributed local cluster from the command line?

我想从命令行执行与 Client(LocalCluster()) 相同的操作。

当与从 Jupyter 笔记本分发的交互时,我最终经常重新启动我的内核并每次都启动一个新的 LocalCluster,以及刷新我的散景网页。

我更希望在后台有一个进程 运行,我可以直接连接到它,这可能吗?

这里的相关文档页面是http://distributed.readthedocs.io/en/latest/setup.html#using-the-command-line

在一个终端中,写入以下内容:

$ dask-scheduler

在另一个终端中,写入以下内容:

$ dask-worker localhost:8786

这里的默认值有点不同。 LocalCluster 创建 N 个单线程 worker,而 dask-worker 启动一个 N 线程 worker。您可以使用以下关键字更改这些默认值

$ dask-worker localhost:8786 --nthreads 1 --nprocs 4