图像数据集是线性可分的吗?

is image dataset linearly separable?

我有 6 个 类 的图像数据集(来自 Kaggle 的番茄病)。使用预训练模型 vgg16 我提取了特征,然后将它们展平为一维特征向量。之后,我将这个向量用作我的线性核 SVM 分类器的输入。

  1. 如何测试我的图像数据集是否线性可分?
  2. 在 SVM 分类器中应用不同的内核我得到了线性内核的最佳结果,这是否意味着我的图像数据集是线性可分的?

通常不是您的图像直接“线性可分”,它们是您从线性可分的图像中提取的特征所产生的点。

这些功能可以看作是应用于原始图像的内核,将图像投影到 space。最后space,图像对应的数据点可以线性分离,那么线性核的SVM将是最佳选择。

因此,这实际上取决于您从图像中提取的特征,以及您如何将它们表示为 SVM 的输入。当您使用(或多或少深度的)神经网络时,N-1 第一层可以看作是特征提取器(即参数化内核),最后一层是应用于结果表示的线性鉴别器 space(您希望其中的数据是线性可分的)

第一个问题:

但是,如果你有两个以上的特征,就很难将可分离性可视化。 Cherkassky, Vladimir & Dhar, Sauptik (2010) 中的一种方法是判别分析或单变量预测直方图:

第二个问题:

乍一看,是的,但不幸的是你没有提供你的结果。

作为旁注。具有线性核的SVM是唯一能够对非线性数据进行分类的线性模型,因为SVM在更高(可能无限)的维度上实现了线性可分性。