OpenCV 主成分分析术语 - 'sample' 实际上是什么?

OpenCV Principal Component Analysis terminology - what actually is a 'sample'?

我正在使用 openCV 中的主成分分析 (PCA)。我感兴趣的案例的构造函数输入是:

PCA(InputArray data, InputArray mean, int flags, double retainedVariance);

关于 InputArray 'data' 文档指出适当的标志应该是:

CV_PCA_DATA_AS_ROW indicates that the input samples are stored as matrix rows. CV_PCA_DATA_AS_COL indicates that the input samples are stored as matrix columns.

我的问题与术语 'samples' 的使用有关,因为我不确定在这种情况下样本是什么。

例如,假设我有 4 组数据,为了便于说明,我们将它们标记为 A-D。现在每个集合 A 到 D 都有 8 个元素。然后将它们设置在我将用作 InputArray 的 Mat 变量中,如下所示:

问题是,是哪个:

另一种提问方式:

?

作为 猜测,我会选择 CV_PCA_DATA_AS_COL(即我有 4 个样本)- 但这就是我的脑子在……在我学会正确的术语之前,'sample' 这个词似乎可以适用于任何一种推理。

呃...

所以通过反转 PCA::project 步骤文档背后的逻辑找到了答案...

Mat PCA::project(InputArray vec)

vec – input vector(s); must have the same dimensionality and the same layout as the input data used at PCA phase, that is, if CV_PCA_DATA_AS_ROW are specified, then vec.cols==data.cols (vector dimensionality)

'sample'等价于'set',元素为'dimension'.

(我的猜测是正确的:)