哪些数据用于入围有前途的模型?
Which data use to shortlist promising models?
执行数据准备步骤(数据清理、特征选择、特征工程...)后:
- 我是否应该通过为它们提供数据准备步骤的结果数据集来筛选有前途的模型?
- 或者我应该只使用原始数据集的缩放和编码版本吗?
- 两者都有?
没有办法预测结果。如果您可以根据特征工程、选择和其他 EDA 活动推断出结果。正如 Andrew NG 所说,继续并首先训练模型作为基线。
只要您的模型没有过拟合或欠拟合 - 您可以选择以上任何一项。
执行数据准备步骤(数据清理、特征选择、特征工程...)后:
- 我是否应该通过为它们提供数据准备步骤的结果数据集来筛选有前途的模型?
- 或者我应该只使用原始数据集的缩放和编码版本吗?
- 两者都有?
没有办法预测结果。如果您可以根据特征工程、选择和其他 EDA 活动推断出结果。正如 Andrew NG 所说,继续并首先训练模型作为基线。
只要您的模型没有过拟合或欠拟合 - 您可以选择以上任何一项。