BigQuery 加载作业响应:inputFileBytes 与 outputBytes - 每个描述什么

BigQuery load job response: inputFileBytes versus outputBytes - what does each describe

据我所知,BigQuery 的文档对此含糊不清,所以在这里提问:

加载作业完成后,BigQuery returns 有关已完成作业的统计信息(下例)。 inputFileBytes 和 outputBytes 的值通常不同,但没有记录原因。我的两个问题:

一个。 "inputFileBytes" 是否描述了存储在 GCS 中的暂存文件的大小? (如果这是一个压缩文件,这应该报告该文件的大小,而不是未压缩的大小,对吗?)

b。 "outputBytes" 是否描述了
的结果数量 存储在 BigQuery 中的字节数(即用户将
收费?)

 "statistics": {
  "creationTime": "1455758097056",
  "startTime": "1455758114405",
  "endTime": "1455758123900",
  "load": {
   "inputFiles": "1",
   "inputFileBytes": "2648200",
   "outputRows": "23210",
   "outputBytes": "8075071"
  }

字段 inputFileBytes 应该描述 BigQuery 看到的文件的字节大小。如果您正在加载 .gz 文件,它将是文件的大小,而不是未压缩数据的大小。

字段outputBytes描述了刚刚加载的数据的字节大小。是的,这对应于用户计费字节大小。