数据挖掘,维数灾难

Data mining, curse of dimensionality

假设我有一个表示为矩阵 X 的数据集,维度为 n x m,高度为 m。我想快速减小维度 m,以便 X 中每一行中的对象保持彼此之间的距离。实现这一目标的一种方法是: 创建一个映射矩阵 A,方法是用全 0 初始化它,然后随机选择其值的 1/6 为 +1,其值的 1/6 为-1,然后将 X 乘以 A.

我是对还是错?

如果你保留了距离,那么你也保留了维数灾难。距离仍然太相似以至于没有用...