SOM 中误差度量的量化

Quantization of a measure of error in SOM

我想使用 R 计算我的 SOM 模型中的量化误差 (qe)。这是我试过的代码:

data(yeast)## take only complete 
x <- yeast[[3]][apply(yeast[[3]], 1, function(x) sum(is.na(x))) == 0,]
yeast.som <- som(x, somgrid(5, 8, "hexagonal"))
## quantization error:
mean(yeast.som$distances)

那个代码对吗?还有其他方法可以计算qe吗?

使用yeast.som$distances给出与SOM相关的错误度量是正确的,因为它表示元素与其码本的平均距离。如果我只能选择一个功能,我会选择那个。

然而,这不是唯一的:例如,您可以从 yeast.som$unit.classif 开始计算空单元格(未分配元素的单元格)的数量。空格数越少,SOM越好。

你还有另一个关于每个密码本与其他密码本的距离的度量。你可以看到它在做:plot(yeast.som, type = "quality").

衡量 SOM 优劣的方法可以是上述各项的组合。