如何在 Python 中安装 gcp?

How to install gcp in Python?

许多 BigQuery 示例开头为:

import gcp.bigquery as bq

但每当我尝试 运行 时,我都会得到 ImportError: No module named gcp.bigquery

如何安装这个库?

我在 python 2.7 的 virtualenv 中工作。我试过 pip install gcppip install gcloudpip install google-api-python-client

None 其中有帮助,但我找不到任何文档。求助!

更新:我想使用 gcp 的原因是我想从 Python 脚本中从 BigQuery 获取数据,最好是 CSV 格式。如果有更好的方法来做到这一点,我洗耳恭听...

使用 pandas 和 google-api-python-client。您要查找的函数是 pd.read_gbq http://pandas.pydata.org/pandas-docs/stable/generated/pandas.io.gbq.read_gbq.html

gcp.bigquery 是特定于 Cloud Datalab 的库(您在其中看到此类导入的任何示例也是如此)。

你应该尝试一个简单的方法:

$ pip install --upgrade google-api-python-client

the documentation 中所述。

另外,gcp.bigqueryGoogle Cloud DataLab的一部分,所以如果你还有兴趣,可以从那个角度试试。

如果您在 python 中访问 BigQuery,您可以使用 gcloud 库。

首先,安装gcloud库:

$ pip install --upgrade gcloud

然后,在设置您的 auth and project info, you can make api calls in python like this (adapted from the gcloud-python docs 之后):

from gcloud import bigquery

client = bigquery.Client()
datasets, next_page_token = client.list_datasets()
print([dataset.name for dataset in datasets])

(前面有人说了,你也可以做到using the google-api-python-client。)

许可证:Apache 2

您可以根据 github 上的数据实验室团队的内容构建库:

  1. 克隆存储库https://github.com/GoogleCloudPlatform/datalab/
  2. 运行 tools/initenv.sh
  3. 运行 sources/build.sh
  4. 在 sources/build/

希望这对您有所帮助。至少在本地执行 docker 图像对我不起作用。

对于遇到此问题的任何人,datalabs 库似乎已更新,现在您应该以不同的方式导入内容。

import datalab.bigquery as bq