机器学习模型错误预测
Machine Learning model Wrong Prediction
我有一个来自 create ML 的机器学习分类器。该模型使用 3400 个样本进行训练,总体而言其准确性令人印象深刻。然而,该模型经常做出错误的预测,我似乎无法弄清楚如何将其添加到模型中,以便它对其中一些错误预测没有如此高的信心。 How/can 我用这个分类错误的新数据重新训练模型,它不属于这个分类?我应该创建一个新的分类文件夹并向其中添加这些错误的分类,还是有办法训练模型作为非分类类型传入,以便它可以尝试理解它们之间的区别?
Disclaimer: So far I have not been working with createML. As I
understand from the question you provide your training data via a
folder structure and training and evaluation is then done by pressing
a button. Correct me if I have made some bad assumption.
很高兴知道您使用的是哪种模型/架构以及您的训练样本是什么样的。
对我来说,你的问题听起来像是这些预测不佳的样本在你的整个数据集中可能代表性不足。您可以在这里尝试一些技巧:
- 只需复制(在您的训练样本文件夹中复制粘贴)这些样本用于您的训练过程,以便将这些特定样本的错误反馈加倍。
- 一种更复杂的方法是对这些样本应用数据扩充 策略,然后将扩充后的样本添加到您的训练数据集中。
根据您的样本类型,有 Python 可用的增强包,它们使用起来非常简单直接。
我有一个来自 create ML 的机器学习分类器。该模型使用 3400 个样本进行训练,总体而言其准确性令人印象深刻。然而,该模型经常做出错误的预测,我似乎无法弄清楚如何将其添加到模型中,以便它对其中一些错误预测没有如此高的信心。 How/can 我用这个分类错误的新数据重新训练模型,它不属于这个分类?我应该创建一个新的分类文件夹并向其中添加这些错误的分类,还是有办法训练模型作为非分类类型传入,以便它可以尝试理解它们之间的区别?
Disclaimer: So far I have not been working with createML. As I understand from the question you provide your training data via a folder structure and training and evaluation is then done by pressing a button. Correct me if I have made some bad assumption.
很高兴知道您使用的是哪种模型/架构以及您的训练样本是什么样的。
对我来说,你的问题听起来像是这些预测不佳的样本在你的整个数据集中可能代表性不足。您可以在这里尝试一些技巧:
- 只需复制(在您的训练样本文件夹中复制粘贴)这些样本用于您的训练过程,以便将这些特定样本的错误反馈加倍。
- 一种更复杂的方法是对这些样本应用数据扩充 策略,然后将扩充后的样本添加到您的训练数据集中。
根据您的样本类型,有 Python 可用的增强包,它们使用起来非常简单直接。