机器学习的数据注释

Data Annotation for Machine Learning

我要开发一个机器学习模型。我有大数据集(文本)。我需要总体上更准确的 F1 分数等。我正在使用数据注释工具 (Dataturks)。哪种方法最好将数据标记为每个实体的单个标签或每个实体的多个标签(比如有 5 次 GUI,所以我们必须将其标记为 1 次或 5 次以获得更好的总分)。非常感谢您的帮助。

如果您有任何所有特征都相同的重复示例,您需要删除它们