如何使用 BigQuery 计算 GitHub 上的推送事件?
How to count push events on GitHub using BigQuery?
我正在尝试使用 BigQuery 上的 public GitHub 数据集来计算事件 - PushEvents,在这种情况下 - 在每个存储库的基础上随着时间的推移。
SELECT COUNT(*)
FROM [githubarchive:github.timeline]
WHERE type = 'PushEvent'
AND repository_name = "account/repo"
GROUP BY pushed_at
ORDER BY pushed_at DESC
基本上只是检索指定回购和事件类型的计数,按日期和 return 列表对计数进行分组。 BigQuery 验证以下内容,但随后查询失败:
Field 'pushed_at' not found.
据我所知 GitHub 的 PushEvent documentation,但是,pushed_at 是一个可用字段。有人有正确执行的相关查询示例吗?关于这里做错了什么有什么建议吗?
该字段称为 repository_pushed_at,您可能还打算将其包含在 SELECT 列表中,即
SELECT repository_pushed_at, COUNT(*)
FROM [githubarchive:github.timeline]
WHERE type = 'PushEvent'
AND repository_name = "account/repo"
GROUP BY repository_pushed_at
ORDER BY repository_pushed_at DESC
我正在尝试使用 BigQuery 上的 public GitHub 数据集来计算事件 - PushEvents,在这种情况下 - 在每个存储库的基础上随着时间的推移。
SELECT COUNT(*)
FROM [githubarchive:github.timeline]
WHERE type = 'PushEvent'
AND repository_name = "account/repo"
GROUP BY pushed_at
ORDER BY pushed_at DESC
基本上只是检索指定回购和事件类型的计数,按日期和 return 列表对计数进行分组。 BigQuery 验证以下内容,但随后查询失败:
Field 'pushed_at' not found.
据我所知 GitHub 的 PushEvent documentation,但是,pushed_at 是一个可用字段。有人有正确执行的相关查询示例吗?关于这里做错了什么有什么建议吗?
该字段称为 repository_pushed_at,您可能还打算将其包含在 SELECT 列表中,即
SELECT repository_pushed_at, COUNT(*)
FROM [githubarchive:github.timeline]
WHERE type = 'PushEvent'
AND repository_name = "account/repo"
GROUP BY repository_pushed_at
ORDER BY repository_pushed_at DESC