我应该为多 class 逻辑回归 class 计算器绘制多少条学习曲线?
How many learning curves should I plot for a multi-class logistic regression classifier?
如果我们有 K 类,我是否必须绘制 K 条学习曲线?
因为对我来说,一次计算所有 K θ 向量的 train/validation 误差似乎是不可能的。
需要说明的是,学习曲线是训练和交叉 validation/test 集 error/cost 与训练集大小的关系图。该图应该允许您查看增加训练集大小是否会提高性能。更一般地说,学习曲线可以让您确定您的算法是否存在偏差(欠拟合)或方差(过度拟合)问题。
视情况而定。学习曲线与 classes 的数量无关。就像你说的,它是训练集和测试集误差的图,其中误差是一个数值。这就是所有的学习曲线。
该错误可以是您想要的任何东西:准确度、精确度、召回率、F1 分数等(甚至 MAE、MSE 和其他回归)。
但是,您选择使用的错误适用于或不适用于您的特定问题,这反过来会间接影响您应该如何使用学习曲线。
精确度对于任意数量的 classes 都有很好的定义,所以如果你使用它,一个图就足够了。
但是,精度和召回率仅针对二元问题定义。您可以通过考虑每个 class x
的 classes x
和 not x
的二进制问题来稍微概括它们(例如参见 [=13=]) .在这种情况下,您可能希望为每个 class 绘制学习曲线。这也将帮助您更好地识别与某些 class 相关的问题。
如果您想阅读更多关于性能指标的信息,我非常喜欢this paper。
如果我们有 K 类,我是否必须绘制 K 条学习曲线? 因为对我来说,一次计算所有 K θ 向量的 train/validation 误差似乎是不可能的。
需要说明的是,学习曲线是训练和交叉 validation/test 集 error/cost 与训练集大小的关系图。该图应该允许您查看增加训练集大小是否会提高性能。更一般地说,学习曲线可以让您确定您的算法是否存在偏差(欠拟合)或方差(过度拟合)问题。
视情况而定。学习曲线与 classes 的数量无关。就像你说的,它是训练集和测试集误差的图,其中误差是一个数值。这就是所有的学习曲线。
该错误可以是您想要的任何东西:准确度、精确度、召回率、F1 分数等(甚至 MAE、MSE 和其他回归)。
但是,您选择使用的错误适用于或不适用于您的特定问题,这反过来会间接影响您应该如何使用学习曲线。
精确度对于任意数量的 classes 都有很好的定义,所以如果你使用它,一个图就足够了。
但是,精度和召回率仅针对二元问题定义。您可以通过考虑每个 class x
的 classes x
和 not x
的二进制问题来稍微概括它们(例如参见 [=13=]) .在这种情况下,您可能希望为每个 class 绘制学习曲线。这也将帮助您更好地识别与某些 class 相关的问题。
如果您想阅读更多关于性能指标的信息,我非常喜欢this paper。