正在为新号码分配 Pandas 个类别

Assigning Pandas categories to new number

df["A"].value_counts()

(25.0, 38.0]      361594
(12.999, 25.0]    330552
(55.0, 218.0]     305439
(38.0, 55.0]      231683
Name: A, dtype: int64

我们有以下间隔,每当有新数据点出现时,我都需要映射到以下间隔。我想要这样的东西。

def func_(x):
    if (x> 12.999) & (x< 25.0):
      return (12.999, 25.0]
    elif:
        for rest of bucket range 

您可以按 CategoricalIndex.categories 生成的类别重复使用 bins 参数:

s = df["A"].value_counts()

print (pd.cut(df['new'], bins=s.index.categories))