当 k=4 时,KNN 选择 class 标签
KNN choosing class label when k=4
在 k-NN class化中,输出是 class 成员资格。一个对象 class 由其邻居的多数投票确定,该对象被分配给它的 k 个最近邻居中最常见的 class 个(k 是一个正整数,通常很小)。
- 如果 k = 1,则对象将简单地分配给那个最近邻居的 class。
- 如果k=3,并且class标签是Good =2 Bad=1,那么预测的class标签将是Good,包含多数票。
- 如果 k=4,并且 class 标签是 Good =2 Bad=2,那么 class 标签是什么?
有不同的方法。例如 Matlab 使用 'random' 或 'nearest' 记录 here.
When classifying to more than two groups or when using an even value
for k, it might be necessary to break a tie in the number of nearest
neighbors. Options are 'random', which selects a random tiebreaker,
and 'nearest', which uses the nearest neighbor among the tied groups
to break the tie.
此问题不特定于 k=4。
考虑一个包含 3 类 的数据集。在k=2时,可能会出现两个不同的类。在k=3时,可能会出现三个不同的类,在k=4时,可能是0,2,2...任何超过1的k都有平[=19=的风险].
随机选择一个,或使用加权(即赋予 1NN 比第二个最近的邻居更多的权重等)以进一步降低平局的风险。
在 k-NN class化中,输出是 class 成员资格。一个对象 class 由其邻居的多数投票确定,该对象被分配给它的 k 个最近邻居中最常见的 class 个(k 是一个正整数,通常很小)。
- 如果 k = 1,则对象将简单地分配给那个最近邻居的 class。
- 如果k=3,并且class标签是Good =2 Bad=1,那么预测的class标签将是Good,包含多数票。
- 如果 k=4,并且 class 标签是 Good =2 Bad=2,那么 class 标签是什么?
有不同的方法。例如 Matlab 使用 'random' 或 'nearest' 记录 here.
When classifying to more than two groups or when using an even value for k, it might be necessary to break a tie in the number of nearest neighbors. Options are 'random', which selects a random tiebreaker, and 'nearest', which uses the nearest neighbor among the tied groups to break the tie.
此问题不特定于 k=4。
考虑一个包含 3 类 的数据集。在k=2时,可能会出现两个不同的类。在k=3时,可能会出现三个不同的类,在k=4时,可能是0,2,2...任何超过1的k都有平[=19=的风险].
随机选择一个,或使用加权(即赋予 1NN 比第二个最近的邻居更多的权重等)以进一步降低平局的风险。