较少是 (6%) 和较多否 (94%) 的数据集。 SPSS 中的所有分类器算法(ANN、C4、CART)都将测试集中的所有值预测为否。我该怎么办?

Dataset with less yes (6%) and more No (94%). All classifier algorithms (ANN, C4, CART) in SPSS predicts all values as No in test set. What do i do?

是的数据集较少(6%),否的数据较多(94%)。 SPSS 中的所有分类器算法(ANN、C4、CART)都将测试集中的所有值预测为否。我该怎么办?

数据大约有 2500 行和 85 列。

研究过采样技术,例如通过 DMwR package 中的 SMOTE 函数在 R 中实现的技术。

这是一个简短的教程:http://amunategui.github.io/smote/
这里是 Youtube 视频:https://www.youtube.com/watch?v=1Mt7EuVJf1A

The SMOTE function oversamples your rare event by using bootstrapping and k-nearest neighbor to synthetically create additional observations of that event. The definition of rare event is usually attributed to any outcome/dependent/target/response variable that happens less than 15% of the time.