请求一个基本的 Notebook 示例将数据传入和传出 Google Cloud Datalab

A plea for a basic Notebook example getting data into and out of Google Cloud Datalab

我已经开始尝试使用 Google 云数据实验室。虽然我知道它是 Beta 产品,但至少可以说,我发现 Doc 非常令人沮丧。

这里的问题和缺乏回应,以及在项目可用的几个月里缺乏新的修订或文档让我想知道是否对产品有任何承诺?

一开始是一个笔记本,它显示从外部源到数据存储系统和大查询系统的数据摄取。这是一个常见的用例。我想使用我自己的数据,最好有一个笔记本来摄取它。看起来不费吹灰之力应该可以吧?它会让我(和其他人)摆脱混乱,试图 link 来自各种产品和工作区的各种简洁文档并一起工作..

除了更好地解释 Git 集线器连接过程(先前的问题))

对于 BigQuery,请参见此处:https://github.com/GoogleCloudPlatform/datalab/blob/master/content/datalab/tutorials/BigQuery/Importing%20and%20Exporting%20Data.ipynb

对于 GCS,请参见此处:https://github.com/GoogleCloudPlatform/datalab/blob/master/content/datalab/tutorials/Storage/Storage%20Commands.ipynb

这是目前 Datalab 中唯一支持的两个存储选项(在任何情况下都不应用于大规模数据传输;这些适用于适合 Datalab VM 内存的小规模传输)。

对于 Git 支持,请参阅 https://github.com/GoogleCloudPlatform/datalab/blob/master/content/datalab/intro/Using%20Datalab%20-%20Managing%20Notebooks%20with%20Git.ipynb。但是请注意,这与 Github 无关。

至于最近 activity 的低水平,那是因为我们一直在埋头准备 GCP Next(这将在下周发生)。完成后,我们应该能够将许多新功能迁移到 Datalab 并很快发布新的 public 版本。

Datalab 运行 不在您的本地计算机上。只是演示部分在您的浏览器中。因此,如果您指的是浏览器客户端计算机,那将不是一个好的解决方案 - 您会将数据从本地计算机移动到虚拟机,该虚拟机是 运行 Datalab Python 代码(以及此虚拟机存储空间有限 space),然后再次将其移动到真正的目的地。相反,您应该为此使用本地计算机上的云控制台或(最好)gcloud 命令行。