K近邻算法的分类

Classification of K-nearest neighbours algorithm

此散点图中的 x 轴和 y 轴具有不同的比例。 假设每个形状的中心是数据点。

问:使用这个训练集的 9 最近邻 classifier 的测试点class化是什么,同时使用这两个特征?

问:在页面顶部的散点图上,按任意顺序,为左下未知点命名三个最近邻的class,使用两个特征计算距离。


这是我的尝试:

1:更高的 K,在本例中为 9,表示每个预测中有更多选民,因此对异常值更有弹性。较大的 K 值将有更平滑的决策边界来决定这里是 Pet 还是 Wild,这意味着方差较小但偏差增加。

2:利用勾股定理,距离左下未知点最近class的三个距离为,

  1. 宠物,距离 = 0.02
  2. 宠物,距离 = 2.20
  3. 狂野,距离 = 2.60

因此,class是宠物

问题 1 要求您提供具体答案(宠物或野生动物),您尚未提供。您所做的陈述通常是正确的,但实际上并没有回答问题。请注意,只有 4 个 Pet 点,其余均为 Wild。所以无论哪 9 个点是最近的邻居,至少有 5 个(大多数)是 Wild。因此,K = 9 的 KNN 分类器将始终使用此数据预测 Wild。

问题 2 看起来大部分是正确的。我没有这些点的确切坐标,但你的数字似乎在正确的范围内,除了你可能在第一个距离有错字。 类 是正确的,结果预测(问题没有明确要求)也是正确的(假设 K = 3)。