加载到 BigQuery 时使用多个“*”模式将不起作用
Using multiple '*' patterns when loading into BigQuery won't work
我们尝试在加载到 BigQuery 时使用 glob 模式,例如:
gs://<bucket_name>/Network*Impressions_12345_20150201*
我们的存储桶中同时包含“..NetworkImpressions_..”和“..NetworkBackfillImpressions_..”,因此我们使用第一个“*”来收集两种类型的文件。但是 BQ borks:
"Not found: URI
gs://backup-gdfp-7415/Network*Impressions_232503_20150101_20*"
文件确实存在。如果我们删除第一个 '*' 它工作正常(当我们明确指定两种类型时)。
这是我们尝试使用模式的失败加载作业的作业 ID:job_LXNGEAeWsaU9HyFgcCCJMHu8YtY
我原以为这应该可以通过 BigQuery 实现?
来自加载作业配置文档sourceUris parameter:
[必需] 指向您在 Google 云存储中的数据的完全限定 URI。 只有出现在 URI 末尾的通配符名称才受支持。
我们尝试在加载到 BigQuery 时使用 glob 模式,例如:
gs://<bucket_name>/Network*Impressions_12345_20150201*
我们的存储桶中同时包含“..NetworkImpressions_..”和“..NetworkBackfillImpressions_..”,因此我们使用第一个“*”来收集两种类型的文件。但是 BQ borks:
"Not found: URI gs://backup-gdfp-7415/Network*Impressions_232503_20150101_20*"
文件确实存在。如果我们删除第一个 '*' 它工作正常(当我们明确指定两种类型时)。
这是我们尝试使用模式的失败加载作业的作业 ID:job_LXNGEAeWsaU9HyFgcCCJMHu8YtY
我原以为这应该可以通过 BigQuery 实现?
来自加载作业配置文档sourceUris parameter:
[必需] 指向您在 Google 云存储中的数据的完全限定 URI。 只有出现在 URI 末尾的通配符名称才受支持。