它使用哪种缩放技术?

Which scaling technique does it use?

我有一个矩阵X,它的大小是100*2000 double。我想知道在下面的命令中对矩阵 X 应用了哪种缩放技术,为什么它不使用 z-score 进行缩放?

X = X./repmat(sqrt(sum(X.^2)),size(X,1),1); 

缩放比例来自线性代数。这就是我们所说的通过产生 a unit vector 来规范化。假设每一行是一个观察值,每一列是一个特征,这里发生的是我们正在检查您收集的每个观察值,并对所有观察值的每个特征值进行归一化,以便所有观察值的特定特征的总长度/大小设置为 1。

底部的部分查看每个特征并确定特征在所有观察中的范数或大小。找到这些量级后,您就可以为每个观察获取每个特征并除以它们各自的量级。

之所以经常使用单位向量,是为了用一组基向量来描述特征space中的一个点。通过生成单位向量进行归一化为您提供了表示特征 space 中的一个组件的最小可能方式,因此这里可能发生的是现在正在转换观察结果,以便每个组件/特征都以一组的形式表示的基础向量。每个基向量是数据中的一个特征。

查看关于单位向量的维基百科文章了解更多详情:http://en.wikipedia.org/wiki/Unit_vector