通过识别重要变量来降维

Dimension reduction by identifying important Variables

我有一个包含 400 个条目的 np.array,每个条目包含具有 1000 个点的光谱值。 我想确定频谱中 n 个最有趣的指标并 return 它们。所以我可以将它们可视化并用作我的分类器的输入向量。

最好是计算方差、应用 PCA 还是有更适合的算法? 我如何计算该选择的核算方差?

谢谢

降维可以通过两种不同的方式进行:feature extraction and feature selection. PCA is more suited for feature extraction, while "identify the n most interesting indices" is a feature selection problem. More details and how to code it up here: sklearn.feature_selection