Polars:return 具有 N 列所有唯一值的数据框
Polars: return dataframe with all unique values of N columns
我有一个数据框,每个 'PROGRAM'、'VERSION' 和 'RELEASE_DATE' 列的组合都有很多行。我想获得一个数据框,其中包含这三列的所有组合。这是 groupby
或 distinct
的工作吗?
感谢
因为您没有聚合任何东西,所以使用 distinct
df.select(['PROGRAM','VERSION','RELEASE_DATE']).distinct()
如果您不使用 Polars 的 Lazy 功能,这也可以写成:
df[['PROGRAM','VERSION','RELEASE_DATE']].distinct()
我有一个数据框,每个 'PROGRAM'、'VERSION' 和 'RELEASE_DATE' 列的组合都有很多行。我想获得一个数据框,其中包含这三列的所有组合。这是 groupby
或 distinct
的工作吗?
感谢
因为您没有聚合任何东西,所以使用 distinct
df.select(['PROGRAM','VERSION','RELEASE_DATE']).distinct()
如果您不使用 Polars 的 Lazy 功能,这也可以写成:
df[['PROGRAM','VERSION','RELEASE_DATE']].distinct()