无法理解 SVM 返回的混淆矩阵
Unable to make sense of the confusion matrix returned by SVM
我想了解为什么 SVM 分类器无法正确分类我的数据。我只展示了 2000 个原始数据样本中的 10 个样本 XX
。我无法理解 Matlab 返回的混淆矩阵。我使用了 SVM 分类器。是不是我的代码错了,尤其是我做交叉验证的方式?
XX
归一化为X
,Y
是标签。每个特征向量的长度为 8.
**问题**) 有人可以帮忙解决这个问题吗?
pred 0 pred 1
actual 0 100 0
actual 1 100 0
谢谢
你有:
- 一个不平衡的数据集(7和3个样本),
- 一个 8 维特征 space 只有 7 个和 3 个样本,非常不足以填充它(参见维数灾难),并且
- 你只使用了一半的样本进行训练,这意味着你离填充特征更远 space。
因此,我并不惊讶 SVM 提出的泛化是将所有内容分类为 "class 0"。
尝试仅使用其中一个特征(XX
的第一列),并使用留一法交叉验证。
我想了解为什么 SVM 分类器无法正确分类我的数据。我只展示了 2000 个原始数据样本中的 10 个样本 XX
。我无法理解 Matlab 返回的混淆矩阵。我使用了 SVM 分类器。是不是我的代码错了,尤其是我做交叉验证的方式?
XX
归一化为X
,Y
是标签。每个特征向量的长度为 8.
**问题**) 有人可以帮忙解决这个问题吗?
pred 0 pred 1
actual 0 100 0
actual 1 100 0
谢谢
你有:
- 一个不平衡的数据集(7和3个样本),
- 一个 8 维特征 space 只有 7 个和 3 个样本,非常不足以填充它(参见维数灾难),并且
- 你只使用了一半的样本进行训练,这意味着你离填充特征更远 space。
因此,我并不惊讶 SVM 提出的泛化是将所有内容分类为 "class 0"。
尝试仅使用其中一个特征(XX
的第一列),并使用留一法交叉验证。