如何处理不在训练数据中的测试数据中的其他列

How to handle additional columns in test data that are not in Train data

我一直在使用随机开发模型 Forest.My 训练数据集有 15 列让我们说 A 到 O。模型是使用上述特征训练的。假设测试集也将具有相同数量的特征或 Columns.But 现在客户端添加了几个列并且模型无法预测新数据。它适用于回归和分类问题。

除了 Train 中可用的内容之外,是否有任何方法/机制来处理或避免新添加的列?我们是否必须显式编写代码或可用于处理此类情况的任何参数/内置函数。感谢你的帮助。谢谢 !

只需保留训练数据中的列列表,并将此列表中的列仅用于测试数据。