如何找到数据框的最高百分比?
How to find the top any % of a dataframe?
我想在我的数据框中找到前 1% 并将所有值附加到列表中。然后我可以检查里面的第一个值并将它用作数据框中的过滤器,知道怎么做吗?或者,如果您有更简单的方法!
你可以在这里找到我使用的数据框:
https://raw.githubusercontent.com/srptwice/forstack/main/resultat_projet.csv
我尝试的是使用热图(来自 Seaborn)观察我的数据框并使用这样的过滤器:
df4 = df2[df2 > 50700]
您可以使用 df.<column name>.quantile(<percentile>)
获取数据帧的前 %。例如,下面的代码将为您提供 df2
的行,其中 bfly
列位于前 10%(第 90 个百分位数)
import pandas as pd
df = pd.read_csv('./resultstat_projet.csv')
df.columns = df.columns.str.replace(' ', '') # remove blank spaces in columns
df2 = df[df.bfly > df.bfly.quantile(0.9)]
print(df2)
我想在我的数据框中找到前 1% 并将所有值附加到列表中。然后我可以检查里面的第一个值并将它用作数据框中的过滤器,知道怎么做吗?或者,如果您有更简单的方法!
你可以在这里找到我使用的数据框:
https://raw.githubusercontent.com/srptwice/forstack/main/resultat_projet.csv
我尝试的是使用热图(来自 Seaborn)观察我的数据框并使用这样的过滤器:
df4 = df2[df2 > 50700]
您可以使用 df.<column name>.quantile(<percentile>)
获取数据帧的前 %。例如,下面的代码将为您提供 df2
的行,其中 bfly
列位于前 10%(第 90 个百分位数)
import pandas as pd
df = pd.read_csv('./resultstat_projet.csv')
df.columns = df.columns.str.replace(' ', '') # remove blank spaces in columns
df2 = df[df.bfly > df.bfly.quantile(0.9)]
print(df2)