结合图像分类器和专家系统
Combining an image classifier and an expert system
在图像分类应用程序中包含专家系统是否准确? (我正在使用 Matlab,有一些图像处理经验,但没有专家系统经验。)
我打算做的是添加一个额外的特征向量,它实际上是对问题的回答。这样可以吗?
例如:假设我有两个问题需要答案:Question 1
和 Question 2
。知道这 2 个问题的答案应该有助于更准确地对测试图像进行分类。我知道 expert systems
的编码与图像分类器不同,但我的问题是包含这两个问题的答案是否错误,以数字形式(1 可以是是, 0 可以是 no) 并将此信息与其他特征向量一起传递到分类器中。
如果重要的话,我当前的分类器是 SVM。
关于训练图像:是的,它们也将使用 2 个额外的特征向量进行训练。
将一组评论转换为答案:
交叉验证中的 similar question 已经说明只要数据经过适当的预处理就可以做到。
简而言之:只要对训练(和测试)数据进行了适当的预处理(例如 standardized). Standardization improves the performance of most linear classifiers because it scales the variables so they have the similar weight in the learning process and improves the numerical stability (and performance) 当变量从类高斯分布(通过标准化实现)中采样时,您就可以将它们组合起来。
这样,如果连续变量被标准化并且分类变量被编码为 (-1, +1)
,SVM 应该可以正常工作。它是否会提高分类器的性能取决于那些分类变量的质量。
回答评论中的其他问题.. 当使用带有例如 卡方核 的内核 SVM 时,训练数据的行假设表现得像直方图(所有正且通常是 l1 归一化),因此引入 (-1, +1)
功能会破坏内核。使用 RBF 内核 数据行被假设为 L2 规范化,并且再次引入 (-1, +1)
特性可能会引入意外行为(我不太确定到底是什么效果会是..).
我处理过类似的问题。如果可以从图像中提取多个特征,那么您可以使用不同的特征来训练不同的分类器。您可以将这些分类器视为专家,根据它们在训练中使用的特征来回答问题。与其使用标签作为输出,不如使用置信度值。以这种方式,不确定性可能非常重要。您可以使用这些专家来产生价值。这些值可以组合起来用于训练另一个分类器。
在图像分类应用程序中包含专家系统是否准确? (我正在使用 Matlab,有一些图像处理经验,但没有专家系统经验。)
我打算做的是添加一个额外的特征向量,它实际上是对问题的回答。这样可以吗?
例如:假设我有两个问题需要答案:Question 1
和 Question 2
。知道这 2 个问题的答案应该有助于更准确地对测试图像进行分类。我知道 expert systems
的编码与图像分类器不同,但我的问题是包含这两个问题的答案是否错误,以数字形式(1 可以是是, 0 可以是 no) 并将此信息与其他特征向量一起传递到分类器中。
如果重要的话,我当前的分类器是 SVM。
关于训练图像:是的,它们也将使用 2 个额外的特征向量进行训练。
将一组评论转换为答案:
交叉验证中的 similar question 已经说明只要数据经过适当的预处理就可以做到。
简而言之:只要对训练(和测试)数据进行了适当的预处理(例如 standardized). Standardization improves the performance of most linear classifiers because it scales the variables so they have the similar weight in the learning process and improves the numerical stability (and performance) 当变量从类高斯分布(通过标准化实现)中采样时,您就可以将它们组合起来。
这样,如果连续变量被标准化并且分类变量被编码为 (-1, +1)
,SVM 应该可以正常工作。它是否会提高分类器的性能取决于那些分类变量的质量。
回答评论中的其他问题.. 当使用带有例如 卡方核 的内核 SVM 时,训练数据的行假设表现得像直方图(所有正且通常是 l1 归一化),因此引入 (-1, +1)
功能会破坏内核。使用 RBF 内核 数据行被假设为 L2 规范化,并且再次引入 (-1, +1)
特性可能会引入意外行为(我不太确定到底是什么效果会是..).
我处理过类似的问题。如果可以从图像中提取多个特征,那么您可以使用不同的特征来训练不同的分类器。您可以将这些分类器视为专家,根据它们在训练中使用的特征来回答问题。与其使用标签作为输出,不如使用置信度值。以这种方式,不确定性可能非常重要。您可以使用这些专家来产生价值。这些值可以组合起来用于训练另一个分类器。