Datalab:如何将 Big Query 标准 SQL 查询导出到数据框?
Datalab: How to export Big Query standard SQL query to dataframe?
在数据实验室笔记本中,可以将 BiqQuery 结果直接导出到数据框中。我有一个适用于遗留 SQL 的示例,我需要进行调整以使其适用于标准 SQL。我找不到适用于此的语法。以下是我认为我需要写的内容:
import datalab.bigquery as bq
import pandas as pd
%%sql --module data_name -d standard
SELECT COUNT(*) AS count FROM `project.dataset.ga_sessions_*` WHERE _TABLE_SUFFIX BETWEEN '20170126' AND '20170126'
my_data_frame = bq.Query(data_name).to_dataframe()
当我收到错误时,此语法一定有问题:
Exception: invalid: Invalid table name: `project.dataset.table.ga_sessions_*`
我怎样才能解决这个问题以适用于标准 SQL?
也许您需要明确表示要使用标准 SQL in datalab.
让我们知道这是否适合您(确保您的分支是 up-to-date 主分支):
my_data_frame = bq.Query(data_name).to_dataframe(dialect='standard')
请注意,此 %%sql 魔法已被 %%bq 魔法取代,标准 sql 现在是默认值:
在数据实验室笔记本中,可以将 BiqQuery 结果直接导出到数据框中。我有一个适用于遗留 SQL 的示例,我需要进行调整以使其适用于标准 SQL。我找不到适用于此的语法。以下是我认为我需要写的内容:
import datalab.bigquery as bq
import pandas as pd
%%sql --module data_name -d standard
SELECT COUNT(*) AS count FROM `project.dataset.ga_sessions_*` WHERE _TABLE_SUFFIX BETWEEN '20170126' AND '20170126'
my_data_frame = bq.Query(data_name).to_dataframe()
当我收到错误时,此语法一定有问题:
Exception: invalid: Invalid table name: `project.dataset.table.ga_sessions_*`
我怎样才能解决这个问题以适用于标准 SQL?
也许您需要明确表示要使用标准 SQL in datalab.
让我们知道这是否适合您(确保您的分支是 up-to-date 主分支):
my_data_frame = bq.Query(data_name).to_dataframe(dialect='standard')
请注意,此 %%sql 魔法已被 %%bq 魔法取代,标准 sql 现在是默认值: