如何从 dataproc 访问 Cloud SQL?

How to access Cloud SQL from dataproc?

我有一个 dataproc 集群,我想让集群访问云 SQL 实例。当我创建集群时,我分配了范围 --scopes sql-admin 但在阅读 Cloud SQL documentation 之后,我似乎需要通过代理连接。我如何配置它以从 dataproc 访问?

更新:

直到集成开箱即用(@vadim 的回答)我可以通过在我的数据处理初始化脚本中使用云代理来实现它:

wget https://dl.google.com/cloudsql/cloud_sql_proxy.linux.amd64
mv cloud_sql_proxy.linux.amd64 cloud_sql_proxy
chmod +x cloud_sql_proxy
nohup ./cloud_sql_proxy -dir=/cloudsql --instances=my-project:us-central1:mysql-instance=tcp:3307 > cloud_proxy_nohup.log &

(注意:端口 3306 已被使用,所以我在这里使用 3307)

Dataproc 初始化操作有一个待处理的拉取请求,它将在集群中的所有节点上安装云 SQL 代理:

https://github.com/GoogleCloudPlatform/dataproc-initialization-actions/pull/47/commits/ade93cc25d72c33e176840ddaa50671e5ed8ed4a

在 Cloud SQL 和 Dataproc 之间使用带有 private IP 的 VPC 似乎是一个不错的选择。不再需要代理。