为什么当我的数据集在 Google BigQuery ML 中只有 2.4gb 时查询处理的字节数是 100GB？

Why does the Bytes Processed for the query is 100GB when my dataset is only 2.4gb in Google BigQuery ML?

我运行为非外部的 2.4gb table 创建模型，它运行 14 小时 25 分钟，如图所示

第一张图片说运行时我的查询将处理 2.4gb。第二个说它处理了 100GB 并计费。知道为什么吗？

对于时间序列模型（假设它是您拥有的模型），当启用 auto-arima 进行自动 hyper-parameter 调整时，多个候选模型会在训练阶段进行拟合和评估。在这种情况下，输入SELECT语句处理的字节数乘以候选模型的数量，可以通过AUTO_ARIMA_MAX_ORDER训练选项来控制。

此外，对于迭代模型，CREATE MODEL 语句在 50 次迭代时停止。

结合以上两个事实和你的数字（2 和 100）- 看起来是解释/回答你的问题