机器学习中的偏斜 class 和不平衡 class

Skewed class and Imbalanced class in machine learning

在机器学习中,倾斜 class && 不平衡 class 之间有什么区别吗?或者两者相同但术语不同?

基本上,是的,它们的意思相同,并且通常在相同的上下文中使用。

在机器学习中偏斜 class 表示数据集中属于两个 class 之一的数据集中的观测值比其他观测值的百分比最高。例如在癌症class化问题中,患有癌症的人是 1%,所以 y = 1 而没有癌症的人是 99% 那么 y = 0。他们在 class 之间是不平衡的数据集。 所以倾斜 class 和不平衡 class 一回事。