'mean' 机器学习中的 f1 分数是多少?

What is 'mean' f1 score in machine learning?

我知道使用精确率和召回率的 f1 分数。 但是,平均 f1 分数中的 'mean' 是多少? 我们什么时候使用它以及如何计算'mean'?

编辑以明确解释我的问题: 我知道 f1 分数是精度和召回率的调和平均值。 而我们在计算f1 score的时候,需要多个分类结果来计算precision和recall。

例如,如果我们有一个包含1000个实例的数据集,我们可以得到1000个分类结果。然后我们把它放入contingencytable,这样我们就可以计算出f1 score.

现在这就是我对 'mean' f1 分数感到困惑的地方。我们从偶然性 table 中计算出 f1 分数,但是 'mean' 是什么?只有我能计算的是f1分数,那什么是'mean'以及如何计算'mean' f1分数?

F1 分数是衡量二元分类任务测试准确性的指标。在多标签分类任务中,每个文档都有一个 F1 分数。因此,平均 F1 分数为:

其中 N 是训练集的行大小