条件 ROW NUMBER 或 COMBINE GROUP BY
Conditional ROW NUMBER or COMBINE GROUP BYs
我需要对两个不同的列进行 GROUP BY 并合并。此外,如果具有不同 group_id 的 size 匹配另一个 size,那么我想要为 group_id 包含那些行的 ALL。
例如,由于 55 在 group_id 10 和 group_id 20 中 我想将所有结果包含在 group_id 20 (IE 55,88,55,88) 中。
p_id | group_id | size | the_date
------+----------+-----------+--------
1 | 10 | 55 | 2012-10-24
1 | 10 | 54 | 2014-08-09
1 | 20 | 55 | 2013-05-20
1 | 20 | 88 | 2014-05-20
1 | 20 | 55 | 2015-05-20
1 | 30 | 33 | 2014-05-20
1 | 30 | 55 | 2015-05-20
1 | 30 | 33 | 2015-05-20
1 | 40 | 99 | 2015-05-20
我查看了堆栈上的一些 并尝试使用 row_number
和 first_value
但没有任何效果。下面是我想要的结果。
p_id | group_id | size | group_id_arr | size_arr | date_arr
------+----------+------+----------------------------+-----------------------------+-----------
1 | 10 | 55 | {10,20,30,20,10,30,30,20} | {55,55,33,88,55,55,33,55} | {2012-10-24,2013-05-20,2014-05-20,2014-05-20,2014-08-09,2015-05-20,2015-05-20,2015-05-20}
1 | 40 | 99 | {40} | {99} | {2015-05-20}
这是我的 DBFiddle 我正在努力实现以下目标的地方,以便我可以汇总。
rn | p_id | group_id | size | the_date
------+----------+----------+------+-----------
1 | 1 | 10 | 55 | 2012-10-24
2 | 1 | 20 | 55 | 2013-05-20
3 | 1 | 30 | 33 | 2014-05-20
4 | 1 | 20 | 88 | 2014-05-20
5 | 1 | 10 | 54 | 2014-08-09
6 | 1 | 30 | 55 | 2015-05-20
7 | 1 | 30 | 33 | 2015-05-20
8 | 1 | 20 | 55 | 2015-05-20
1 | 1 | 40 | 99 | 2015-05-20
如果您有任何问题,请告诉我。我对所有方法都持开放态度,谢谢。
select t.id as p_id,min(t.group_id) as group_id, t1.size as size,array_agg(t.size) as size_arr,array_agg(t.group_id) as grp_arr, array_agg(t.date_column) as date_arr from t
join
(select distinct group_id as grp_id, size from t where size=99 or size=55) t1
on t1.grp_id=t.group_id
group by t.id ,t1.size;
检查这个:)
我不太确定最终数组中的顺序,但这应该是您可以修复的细节:
WITH sizes as (
SELECT group_id, the_date, array_agg(size) sizes
FROM base_table
GROUP BY group_id, the_date
)
SELECT
a_group_id,
array_agg(b_group_id order by the_date),
array_agg(size order by the_date) as sizes,
array_agg(the_date order by the_date)
FROM (
SELECT
a.group_id as a_group_id,
b.group_id as b_group_id,
unnest(b.sizes) size, b.the_date
FROM sizes a
INNER JOIN sizes b
ON a.sizes && b.sizes
) s
GROUP BY a_group_id
- 汇总每个
group_id
的大小
- 将聚合与自身交叉连接,其中一个大小的数组至少有一个成员与另一个。这给了你一个你期望和描述的table。
- 按
group_id
. 分组
我需要对两个不同的列进行 GROUP BY 并合并。此外,如果具有不同 group_id 的 size 匹配另一个 size,那么我想要为 group_id 包含那些行的 ALL。
例如,由于 55 在 group_id 10 和 group_id 20 中 我想将所有结果包含在 group_id 20 (IE 55,88,55,88) 中。
p_id | group_id | size | the_date
------+----------+-----------+--------
1 | 10 | 55 | 2012-10-24
1 | 10 | 54 | 2014-08-09
1 | 20 | 55 | 2013-05-20
1 | 20 | 88 | 2014-05-20
1 | 20 | 55 | 2015-05-20
1 | 30 | 33 | 2014-05-20
1 | 30 | 55 | 2015-05-20
1 | 30 | 33 | 2015-05-20
1 | 40 | 99 | 2015-05-20
我查看了堆栈上的一些 row_number
和 first_value
但没有任何效果。下面是我想要的结果。
p_id | group_id | size | group_id_arr | size_arr | date_arr
------+----------+------+----------------------------+-----------------------------+-----------
1 | 10 | 55 | {10,20,30,20,10,30,30,20} | {55,55,33,88,55,55,33,55} | {2012-10-24,2013-05-20,2014-05-20,2014-05-20,2014-08-09,2015-05-20,2015-05-20,2015-05-20}
1 | 40 | 99 | {40} | {99} | {2015-05-20}
这是我的 DBFiddle 我正在努力实现以下目标的地方,以便我可以汇总。
rn | p_id | group_id | size | the_date
------+----------+----------+------+-----------
1 | 1 | 10 | 55 | 2012-10-24
2 | 1 | 20 | 55 | 2013-05-20
3 | 1 | 30 | 33 | 2014-05-20
4 | 1 | 20 | 88 | 2014-05-20
5 | 1 | 10 | 54 | 2014-08-09
6 | 1 | 30 | 55 | 2015-05-20
7 | 1 | 30 | 33 | 2015-05-20
8 | 1 | 20 | 55 | 2015-05-20
1 | 1 | 40 | 99 | 2015-05-20
如果您有任何问题,请告诉我。我对所有方法都持开放态度,谢谢。
select t.id as p_id,min(t.group_id) as group_id, t1.size as size,array_agg(t.size) as size_arr,array_agg(t.group_id) as grp_arr, array_agg(t.date_column) as date_arr from t
join
(select distinct group_id as grp_id, size from t where size=99 or size=55) t1
on t1.grp_id=t.group_id
group by t.id ,t1.size;
检查这个:)
我不太确定最终数组中的顺序,但这应该是您可以修复的细节:
WITH sizes as (
SELECT group_id, the_date, array_agg(size) sizes
FROM base_table
GROUP BY group_id, the_date
)
SELECT
a_group_id,
array_agg(b_group_id order by the_date),
array_agg(size order by the_date) as sizes,
array_agg(the_date order by the_date)
FROM (
SELECT
a.group_id as a_group_id,
b.group_id as b_group_id,
unnest(b.sizes) size, b.the_date
FROM sizes a
INNER JOIN sizes b
ON a.sizes && b.sizes
) s
GROUP BY a_group_id
- 汇总每个
group_id
的大小
- 将聚合与自身交叉连接,其中一个大小的数组至少有一个成员与另一个。这给了你一个你期望和描述的table。
- 按
group_id
. 分组