如何找到数据框的最高百分比？

Question

我想在我的数据框中找到前 1% 并将所有值附加到列表中。然后我可以检查里面的第一个值并将它用作数据框中的过滤器，知道怎么做吗？或者，如果您有更简单的方法！

你可以在这里找到我使用的数据框：

https://raw.githubusercontent.com/srptwice/forstack/main/resultat_projet.csv

我尝试的是使用热图（来自 Seaborn）观察我的数据框并使用这样的过滤器：

df4 = df2[df2 > 50700]

Answer 1

您可以使用 df.<column name>.quantile(<percentile>) 获取数据帧的前 %。例如，下面的代码将为您提供 df2 的行，其中 bfly 列位于前 10%（第 90 个百分位数）

import pandas as pd

df = pd.read_csv('./resultstat_projet.csv')
df.columns = df.columns.str.replace(' ', '') # remove blank spaces in columns
df2 = df[df.bfly > df.bfly.quantile(0.9)]
print(df2)

如何找到数据框的最高百分比？

How to find the top any % of a dataframe?

python

list

filter

percentile

dataframe