aws athena SQL 查询；为每个唯一的 column1 获取 column2 的唯一计数

Question

我对 SQL 查询还很陌生，正在查询 aws athena 数据库。

我的第一个查询将 return 每个独特的品牌给定一些参数：

-- query1
SELECT DISTINCT brand
FROM "database" 
WHERE product_gap = 'yes' AND store_name = 'petco'

返回这样的列表：

#   brand
1   Drs. Doink and Foink
2   Zkukit!
3   Willow
4   Freshz
5   Aquatic Land
6   UniLaws
7   Seraz
.....

依此类推 553 行。如果我在第二个查询中选择任何品牌，例如 'Seraz' 和运行，它将 return 该品牌的 'merch1' 列的非重复计数

-- query2
SELECT COUNT (DISTINCT merch1)
FROM "database" 
WHERE product_gap = 'yes' AND store_name = 'petco' AND brand='Seraz'

哪个 returns:

#   _col0
1   2

其中 _col0 是 seraz 的 merch1 的非重复计数。

我的问题是如何组合我的查询，以便对于查询 1 的每个独特品牌结果，它运行查询 2，并在 table 中显示独特的 merch1 计数，如下所示：

#   brand                 merch1_distinct_count
1   Drs. Doink and Foink  2
2   Zkukit!               1
3   Willow                1
4   Freshz                1
5   Aquatic Land          1
6   UniLaws               3
7   Seraz                 2
.....

Answer 1

使用 group by 和 brand column

SELECT brand, COUNT(DISTINCT merch1) merch1_distinct_count
FROM "database" 
WHERE product_gap = 'yes' AND store_name = 'petco'
group by brand

aws athena SQL 查询；为每个唯一的 column1 获取 column2 的唯一计数

aws athena SQL query; get unique count of column2 for each unique column1

sql

presto

amazon-athena