缺失值的全局最接近计算

Global closest fit calculation of missing value

我正在尝试了解全局最接近拟合方法的计算以计算缺失的属性值。我试图理解第 10 页上显示的示例 here,章节:2.8 GLOBAL CLOSEST FIT

我想了解他们是如何计算出 table 1.10

中案例 1 和案例 3 之间的距离的

我将非常感谢任何类似人类的解释:)。

两个案例之间的距离是它们属性之间距离的总和。个案具有三个属性:体温、头痛和恶心。我们一一比较:

温度

| Case 1 | Case 3 |
| high   | ?      |

距离 = 1.

原因:其中一个case有?,所以属于distance(xi, yi)公式的条件2("xi = ? or yi = ?").

头痛

| Case 1 | Case 3 |
|--------|--------|
| ?      | no     |

距离 = 1.

原因:其中一个案例有一个?再次.

恶心

| Case 1 | Case 3 |
|--------|--------|
| no     | no     |

距离 = 0

原因:两者相同,属于条件1("xi = yi")

结论

| Attribute   | Case 1 | Case 3 | Distance |
|-------------|--------|--------|----------|
| Temperature | high   | ?      | 1        |
| Headache    | ?      | no     | 1        |
| Nausea      | no     | no     | 0        |
|-------------|--------|--------|----------|
| Total       |        |        | 2        |

距离 = 2

原因:我们根据第10页顶部的公式总结了属性之间的距离。