如何使用 Apache Airflow 的 DataprocCreateClusterOperator 在 Dataproc(GCP) 上启用 Spark Web 界面

How to enable Spark web interface on Dataproc(GCP) using DataprocCreateClusterOperator of Apache Airflow

我们正在使用 Apache Airflow 的 DataprocCreateClusterOperator 在 GCP(Dataproc) 上创建 Spark 集群,并希望启用 Spark Web UI 接口。使用终端创建时,我们在创建集群命令中传递 --enable-component-gateway。我们如何使用 DataprocCreateClusterOperator

来实现这一点

我们尝试在下面添加endpoint_config(下面的示例代码),但没有成功。

"software_config" : {
.....,

   "endpoint_config" : {
   "enable_http_port_access" : "true"
   }
}

有人可以帮忙吗?

根据 Dataproc REST API (Cluster, ClusterConfig, EndpointConfig),应该是

{
  "clusterName": ...,
  ...
  "config": {
    "endpointConfig": {
      "enableHttpPortAccess" : true
    },
    "softwareConfig": {
      ...
    },
    ...
  }
}