如何找到数据框的最高百分比?

How to find the top any % of a dataframe?

我想在我的数据框中找到前 1% 并将所有值附加到列表中。然后我可以检查里面的第一个值并将它用作数据框中的过滤器,知道怎么做吗?或者,如果您有更简单的方法!

你可以在这里找到我使用的数据框:

https://raw.githubusercontent.com/srptwice/forstack/main/resultat_projet.csv

我尝试的是使用热图(来自 Seaborn)观察我的数据框并使用这样的过滤器:

df4 = df2[df2 > 50700]

您可以使用 df.<column name>.quantile(<percentile>) 获取数据帧的前 %。例如,下面的代码将为您提供 df2 的行,其中 bfly 列位于前 10%(第 90 个百分位数)

import pandas as pd

df = pd.read_csv('./resultstat_projet.csv')
df.columns = df.columns.str.replace(' ', '') # remove blank spaces in columns
df2 = df[df.bfly > df.bfly.quantile(0.9)]
print(df2)