使用 dask labextension 连接到远程集群

Using the dask labextenstion to connect to a remote cluster

我对 运行 EMR 上的 Dask 集群感兴趣,并在 separate EC2 上从 Jupyter Lab notebook 运行 内部与其交互实例(例如,不在集群内且不受 EMR 管理的 EC2 实例)。

Dask 文档指向 dask-labextension as the tool of choice for this use case. dask-labextension relies on a YAML config file(and/or 一些环境变量)以了解如何与集群通信。但是,据我所知,此配置只能设置为指向 local Dask 集群。换句话说,您必须在 Jupyter Lab notebook 运行 集群中的一个实例上(大概在主实例上?)才能使用此扩展。

我的解读正确吗?当前无法将 dask-labextension 与外部 Dask 集群一起使用吗?

Dask Labextension 可以与从 Web 客户端 运行 可见的任何 Dask 集群通信。如果您可以在 Web 浏览器中连接到仪表板,那么您可以将相同的地址复制到 Dask-Labextension 搜索栏,它将连接。