使 iPython BigQuery Magic Function SQL 查询动态化

Making iPython BigQuery Magic Function SQL query dynamic

我正在使用 Jupyter 中的 bigquery 魔术功能,希望能够动态更改项目和数据集。例如

而不是

%%bigquery table
SELECT * FROM `my_project.my_dataset.my_table`

我要

project = my_project
dataset = my_dataset

%%bigquery table
'SELECT * FROM `{}.{}.my_table`'.format(project,dataset)

根据 IPython Magics for BigQuery 文档,无法将项目或数据集作为参数传递;尽管如此,您可以使用 BigQuery 客户端库在 Jupyter Notebook 中执行此操作。

from google.cloud import bigquery

client = bigquery.Client()  

project = 'bigquery-public-data'
dataset = 'baseball'

sql ="""SELECT * FROM `{}.{}.games_wide` LIMIT 10"""
query=sql.format(project,dataset)

query_job = client.query(query)

print("The query data:")

for row in query_job:
# Row values can be accessed by field name or index.
print("gameId={}, seasonId={}".format(row[0], row["gameId"]))

我还建议您查看 public 文档以了解如何 visualize BigQuery data in a Jupyter notebooks