从 GDELT 查询中提取 URL 的主题或文本

Extract URL of theme or text from the GDELT query

我正在尝试从 GDELT 中提取与加密货币相关的新闻。我正在使用以下查询:

select date(_partitiontime) date, count(theme) occurences
from `gdelt-bq.gdeltv2.gkg_partitioned`, unnest(split(themes,';')) as theme 
where lower(theme) like "%bitcoin%"
group by date
-- order by date 

我不仅要提取比特币一词出现的次数,还要提取新闻文章或文本。

我也试过:

select Date,SourceCommonName,Themes,Persons,DocumentIdentifier 
from gdelt-bq.gdeltv2.gkg_partitioned, unnest(split(themes,';')) as theme
where theme like "%bitcoin%"
limit 100

但是这个查询 returns 0 个结果。好像我缺少一些东西来获取与比特币相关的新闻的 URL。

任何帮助将不胜感激。谢谢!

您应该在第二个查询的 where 子句中使用 lower(theme)