在 Contour 中,如何按组中的值过滤到前 N 个值?
In Contour, how do I filter down to the top N by values in a group?
在每行包含例如一个航班号,我想过滤我的活动数据集以仅保留每个航空公司的三个最延误的航班号。
如何在 Contour 中完成此操作?
这是一个 two-step 过程:(1) 分组和排序,以及 (2) 过滤。
组和顺序:添加一个表达式板,并通过为每条记录分配一个行号来创建一个新列。重置每个承运人组内的行号,并确保行号按照航班延误时间的顺序分配。
row_number() OVER ( PARTITION BY "carrier" ORDER BY "delay_duration" DESC ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW )
过滤器: 添加一个过滤器板和 select 上面创建的那些小于或等于 3 的行号,以仅保留三个最晚延误的航班运营商。
在每行包含例如一个航班号,我想过滤我的活动数据集以仅保留每个航空公司的三个最延误的航班号。
如何在 Contour 中完成此操作?
这是一个 two-step 过程:(1) 分组和排序,以及 (2) 过滤。
组和顺序:添加一个表达式板,并通过为每条记录分配一个行号来创建一个新列。重置每个承运人组内的行号,并确保行号按照航班延误时间的顺序分配。
row_number() OVER ( PARTITION BY "carrier" ORDER BY "delay_duration" DESC ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW )
过滤器: 添加一个过滤器板和 select 上面创建的那些小于或等于 3 的行号,以仅保留三个最晚延误的航班运营商。