没有连接的聚合和调节器查询(Bigquery 标准 sql)

Query with agregate and condition without join (Bigquery standard sql)

我在 table

中有这个数据
column 1    column 2    condition   value
1   ABC 1   1
1   строка 2    0   1
1   строка 3    0   1
1   строка 4    0   1
1   строка 5    0   1
1   строка 6    0   1
2   BCD 1   1
2   строка 2    0   1
2   строка 3    0   1

我不会得到这个结果:

column 1    column 2    sum of value
1   ABC 6
2   BCD 3

此结果仅按第一列分组。第二列显示条件为 1 的那些行上的值。在第三列中,我们得到列值的总和,不包括任何条件。是否可以在不加入的情况下执行此操作(因为table非常大)

以下适用于 BigQuery 标准 SQL

#standardSQL
SELECT 
  column1, 
  MAX(IF(condition = 1, column2, '')) column2,
  SUM(value)sumOfValue
FROM `project.dataset.table`
GROUP BY column1  

您可以使用您问题中的示例来测试/使用它,如下所示

#standardSQL
WITH `project.dataset.table` AS (
  SELECT 1 column1, 'ABC' column2,  1 condition,  1 value UNION ALL
  SELECT 1,         'строка 2',     0,            1 UNION ALL
  SELECT 1,         'строка 3',     0,            1 UNION ALL
  SELECT 1,         'строка 4',     0,            1 UNION ALL
  SELECT 1,         'строка 5',     0,            1 UNION ALL
  SELECT 1,         'строка 6',     0,            1 UNION ALL
  SELECT 2,         'BCD',          1,            1 UNION ALL
  SELECT 2,         'строка 2',     0,            1 UNION ALL
  SELECT 2,         'строка 3',     0,            1 
)
SELECT 
  column1, 
  MAX(IF(condition = 1, column2, '')) column2,
  SUM(value)sumOfValue
FROM `project.dataset.table`
GROUP BY column1   

结果符合预期(我认为)

column1 column2 sumOfValue   
1       ABC     6    
2       BCD     3      

以上解决方案假设每组 column1 只有一行且条件 = 1。如果不是这种情况 - 上面只会给出 column2 中的一个 (MAX) 值。如果您需要对所有此类值进行分组 - 请参阅下面的选项

#standardSQL
WITH `project.dataset.table` AS (
  SELECT 1 column1, 'ABC' column2,  1 condition,  1 value UNION ALL
  SELECT 1,         'строка 2',     0,            1 UNION ALL
  SELECT 1,         'строка 3',     1,            1 UNION ALL
  SELECT 1,         'строка 4',     0,            1 UNION ALL
  SELECT 1,         'строка 5',     1,            1 UNION ALL
  SELECT 1,         'строка 6',     0,            1 UNION ALL
  SELECT 2,         'BCD',          1,            1 UNION ALL
  SELECT 2,         'строка 2',     0,            1 UNION ALL
  SELECT 2,         'строка 3',     0,            1 
)
SELECT 
  column1, 
  REGEXP_REPLACE(STRING_AGG(IF(condition = 1, CONCAT(column2, ','), ''),''), r',$', '') column2, 
  SUM(value)sumOfValue
FROM `project.dataset.table`
GROUP BY column1  

在这种情况下,结果将为

column1 column2                 sumOfValue   
1       ABC,строка 3,строка 5   6    
2       BCD                     3