什么是数据维度?
What is dimension in data?
假设我有一个如下图所示的数据集。问题是这里的维度是行还是列?
对于您在评论中建议的聚类算法,每一行都应该代表一个点。该点位于 space 中,具有以列数为特征的维度。所以这里有四维 space 中的四个点(Row1、Row2、Row3、Row4)。当您在数据科学上下文中阅读 "dimensionality" 时,它谈论的是每个数据点的属性数量,而不是数据点的数量。这与数据的表示形式是分开的,例如,二维数组。
假设我有一个如下图所示的数据集。问题是这里的维度是行还是列?
对于您在评论中建议的聚类算法,每一行都应该代表一个点。该点位于 space 中,具有以列数为特征的维度。所以这里有四维 space 中的四个点(Row1、Row2、Row3、Row4)。当您在数据科学上下文中阅读 "dimensionality" 时,它谈论的是每个数据点的属性数量,而不是数据点的数量。这与数据的表示形式是分开的,例如,二维数组。