如何使用 Python 中的 "imblearn" 库 undersample/oversample 两个以上的 类' 数据集?

How to undersample/oversample more than two classes' dataset using "imblearn" library in Python?

我正在使用 "imblearn" 库进行欠采样。我的数据集中有四个 classes,每个都有 20、30、40 和 50 个数据(因为它是不平衡的 class)。

但是当我尝试使用 "fit_resample(X, y)" 对数据集进行欠采样时,它只会对第一个和最后一个 classes 进行欠采样。

有什么方法可以使用 "imblearn" 对所有四个 classes 进行欠采样?

所需代码:

undersample = RandomUnderSampler(sampling_strategy='majority')
X_over, y_over = undersample.fit_resample(X, y)

问题已解决设置smapling_strategy='all'.