为什么当我的数据集在 Google BigQuery ML 中只有 2.4gb 时查询处理的字节数是 100GB?

Why does the Bytes Processed for the query is 100GB when my dataset is only 2.4gb in Google BigQuery ML?

我 运行 为非外部的 2.4gb table 创建模型,它 运行 14 小时 25 分钟,如图所示

第一张图片说 运行 时我的查询将处理 2.4gb。 第二个说它处理了 100GB 并计费。知道为什么吗?

对于时间序列模型(假设它是您拥有的模型),当启用 auto-arima 进行自动 hyper-parameter 调整时,多个候选模型会在训练阶段进行拟合和评估。在这种情况下,输入SELECT语句处理的字节数乘以候选模型的数量,可以通过AUTO_ARIMA_MAX_ORDER训练选项来控制。

此外,对于迭代模型,CREATE MODEL 语句在 50 次迭代时停止。

结合以上两个事实和你的数字(2 和 100)- 看起来是解释/回答你的问题