aws athena SQL 查询;为每个唯一的 column1 获取 column2 的唯一计数
aws athena SQL query; get unique count of column2 for each unique column1
我对 SQL 查询还很陌生,正在查询 aws athena 数据库。
我的第一个查询将 return 每个独特的品牌给定一些参数:
-- query1
SELECT DISTINCT brand
FROM "database"
WHERE product_gap = 'yes' AND store_name = 'petco'
返回这样的列表:
# brand
1 Drs. Doink and Foink
2 Zkukit!
3 Willow
4 Freshz
5 Aquatic Land
6 UniLaws
7 Seraz
.....
依此类推 553 行。
如果我在第二个查询中选择任何品牌,例如 'Seraz' 和 运行,它将 return 该品牌的 'merch1' 列的非重复计数
-- query2
SELECT COUNT (DISTINCT merch1)
FROM "database"
WHERE product_gap = 'yes' AND store_name = 'petco' AND brand='Seraz'
哪个 returns:
# _col0
1 2
其中 _col0 是 seraz 的 merch1 的非重复计数。
我的问题是如何组合我的查询,以便对于查询 1 的每个独特品牌结果,它 运行 查询 2,并在 table 中显示独特的 merch1 计数,如下所示:
# brand merch1_distinct_count
1 Drs. Doink and Foink 2
2 Zkukit! 1
3 Willow 1
4 Freshz 1
5 Aquatic Land 1
6 UniLaws 3
7 Seraz 2
.....
使用 group by
和 brand column
SELECT brand, COUNT(DISTINCT merch1) merch1_distinct_count
FROM "database"
WHERE product_gap = 'yes' AND store_name = 'petco'
group by brand
我对 SQL 查询还很陌生,正在查询 aws athena 数据库。
我的第一个查询将 return 每个独特的品牌给定一些参数:
-- query1
SELECT DISTINCT brand
FROM "database"
WHERE product_gap = 'yes' AND store_name = 'petco'
返回这样的列表:
# brand
1 Drs. Doink and Foink
2 Zkukit!
3 Willow
4 Freshz
5 Aquatic Land
6 UniLaws
7 Seraz
.....
依此类推 553 行。 如果我在第二个查询中选择任何品牌,例如 'Seraz' 和 运行,它将 return 该品牌的 'merch1' 列的非重复计数
-- query2
SELECT COUNT (DISTINCT merch1)
FROM "database"
WHERE product_gap = 'yes' AND store_name = 'petco' AND brand='Seraz'
哪个 returns:
# _col0
1 2
其中 _col0 是 seraz 的 merch1 的非重复计数。
我的问题是如何组合我的查询,以便对于查询 1 的每个独特品牌结果,它 运行 查询 2,并在 table 中显示独特的 merch1 计数,如下所示:
# brand merch1_distinct_count
1 Drs. Doink and Foink 2
2 Zkukit! 1
3 Willow 1
4 Freshz 1
5 Aquatic Land 1
6 UniLaws 3
7 Seraz 2
.....
使用 group by
和 brand column
SELECT brand, COUNT(DISTINCT merch1) merch1_distinct_count
FROM "database"
WHERE product_gap = 'yes' AND store_name = 'petco'
group by brand