它使用哪种缩放技术？

Question

我有一个矩阵X，它的大小是100*2000 double。我想知道在下面的命令中对矩阵 X 应用了哪种缩放技术，为什么它不使用 z-score 进行缩放？

X = X./repmat(sqrt(sum(X.^2)),size(X,1),1);

Answer 1

缩放比例来自线性代数。这就是我们所说的通过产生 a unit vector 来规范化。假设每一行是一个观察值，每一列是一个特征，这里发生的是我们正在检查您收集的每个观察值，并对所有观察值的每个特征值进行归一化，以便所有观察值的特定特征的总长度/大小设置为 1。

底部的部分查看每个特征并确定特征在所有观察中的范数或大小。找到这些量级后，您就可以为每个观察获取每个特征并除以它们各自的量级。

之所以经常使用单位向量，是为了用一组基向量来描述特征space中的一个点。通过生成单位向量进行归一化为您提供了表示特征 space 中的一个组件的最小可能方式，因此这里可能发生的是现在正在转换观察结果，以便每个组件/特征都以一组的形式表示的基础向量。每个基向量是数据中的一个特征。

查看关于单位向量的维基百科文章了解更多详情：http://en.wikipedia.org/wiki/Unit_vector

Which scaling technique does it use?