如何使用 Google BigQuery 从 GDELT 获取超过 6 个月的数据
How to get more than 6 months of data from GDELT using Google BigQuery
我无法从 GDELT 获得超过 6 个月的数据 gkg table。
例如,此查询 returns 仅产生 2015 年 2 月 19 日的结果:
SELECT Date, SourceCommonName, DocumentIdentifier FROM [gdelt-bq:gdeltv2.gkg]
where (date < 20150220000000 and locations like "%Israel%" and
SourceCommonName = "cnn.com")
相同的查询日期 < 20150219000000 returns 没有结果
如何获得较早的结果/为什么不返回较早的结果?
您提到的 table 如您所述,自 2015 年 1 月以来才更新。这是 GDELT v2 的公告:http://blog.gdeltproject.org/gdelt-2-0-our-global-world-in-realtime/
V1 有过去 30 年的数据,可在 https://bigquery.cloud.google.com/table/gdelt-bq:full.events 获得,但不如 v2 中的 gkg 丰富。
也许可以联系 GDELT 项目的 Kalev,让 GKG 填回前几年的数据?
我无法从 GDELT 获得超过 6 个月的数据 gkg table。
例如,此查询 returns 仅产生 2015 年 2 月 19 日的结果:
SELECT Date, SourceCommonName, DocumentIdentifier FROM [gdelt-bq:gdeltv2.gkg]
where (date < 20150220000000 and locations like "%Israel%" and
SourceCommonName = "cnn.com")
相同的查询日期 < 20150219000000 returns 没有结果
如何获得较早的结果/为什么不返回较早的结果?
您提到的 table 如您所述,自 2015 年 1 月以来才更新。这是 GDELT v2 的公告:http://blog.gdeltproject.org/gdelt-2-0-our-global-world-in-realtime/
V1 有过去 30 年的数据,可在 https://bigquery.cloud.google.com/table/gdelt-bq:full.events 获得,但不如 v2 中的 gkg 丰富。
也许可以联系 GDELT 项目的 Kalev,让 GKG 填回前几年的数据?