当 k=4 时,KNN 选择 class 标签

KNN choosing class label when k=4

在 k-NN class化中,输出是 class 成员资格。一个对象 class 由其邻居的多数投票确定,该对象被分配给它的 k 个最近邻居中最常见的 class 个(k 是一个正整数,通常很小)。

  1. 如果 k = 1,则对象将简单地分配给那个最近邻居的 class。
  2. 如果k=3,并且class标签是Good =2 Bad=1,那么预测的class标签将是Good,包含多数票。
  3. 如果 k=4,并且 class 标签是 Good =2 Bad=2,那么 class 标签是什么?

有不同的方法。例如 Matlab 使用 'random' 或 'nearest' 记录 here.

When classifying to more than two groups or when using an even value for k, it might be necessary to break a tie in the number of nearest neighbors. Options are 'random', which selects a random tiebreaker, and 'nearest', which uses the nearest neighbor among the tied groups to break the tie.

此问题不特定于 k=4

考虑一个包含 3 类 的数据集。在k=2时,可能会出现两个不同的类。在k=3时,可能会出现三个不同的类,在k=4时,可能是0,2,2...任何超过1的k都有平[=19=的风险].

随机选择一个,或使用加权(即赋予 1NN 比第二个最近的邻居更多的权重等)以进一步降低平局的风险。