使用 Redshift 计算特定 ID 字段中值的出现次数

Question

我想计算某个 ID 的特定字段中特定值的出现次数。所以我有这个：

| Location ID |   Group  |
|:----------- |:---------|
| 1           |  Group A |      
| 2           |  Group B |      
| 3           |  Group C |   
| 4           |  Group A |  
| 4           |  Group B | 
| 4           |  Group C | 
| 3           |  Group A | 
| 2           |  Group B | 
| 1           |  Group C |    
| 2           |  Group A |

我希望通过一些计算机魔法产生的结果是：

| Location ID | Group A Count | Group B Count | Group C count|
|:----------- |:--------------|:--------------|:-------------|
| 1           | 1             | 0             | 1            |
| 2           | 1             | 2             | 0            |
| 3           | 1             | 0             | 1            |
| 4           | 1             | 1             | 1            |

我可以在 Redshift 中使用某种旋转函数来实现这一点吗？

Answer 1

这将需要使用 CASE 函数和 GROUP 子句，如示例所示。

SELECT l_id,
       SUM(CASE WHEN l_group = 'Group A' THEN 1 ELSE 0 END) AS a,
       SUM(CASE WHEN l_group = 'Group B' THEN 1 ELSE 0 END) AS b-- and so on
       FROM location
GROUP BY l_id;

这应该会给你这样的结果：

| l_id | a | b |
|------|---|---|
|    4 | 1 | 1 |
|    1 | 1 | 0 |
|    3 | 1 | 0 |
|    2 | 1 | 2 |

你可以在这个SQL Fiddle上玩一下。

使用 Redshift 计算特定 ID 字段中值的出现次数

Count occurrences of value in field for a particular ID using Redshift

amazon-redshift