使用 RFC 解决 Titanic(Kaggle) 数据集,未知标签类型:'unknown'
Solving Titanic(Kaggle) Dataset using RFC, Unknown label type: 'unknown'
我正在使用 RFC 求解 Titanic Kaggle 数据集,我在将数据拟合到模型时收到错误提示“未知标签类型:'unknown'”。我觉得错误在 y 中,但我找不到任何东西。
data = pd.read_csv('train.csv')
data = data.fillna(data.mean())
data = data.replace('male',1)
data = data.replace('female',0)
data = data.replace('S',0)
data = data.replace('C',1)
data = data.replace('Q',2)
data['Embarked'] = data['Embarked'].fillna('S')
data = data[data.Embarked != 'S']
y = data.Survived
np.unique(y)
features = ['Pclass','Sex','Age','Fare','SibSp','Parch','Embarked']
X = data[features]
trainX,trainY,valX,valY = train_test_split(X,y,random_state = 1)
titanmodel = RandomForestClassifier(random_state = 1)
titanmodel.fit(trainX,trainY)
模型拟合错误的部分
ValueError:未知标签类型:'unknown'
另外,如果您有更好的方法来解决这个问题,请告诉我。
提前致谢
train_test_split() 的结果是 X_train、X_test、y_train、y_test,并且您在代码中以不同的顺序分配值。
换行:
trainX,trainY,valX,valY = train_test_split(X,y,random_state = 1)
通过这个:
trainX,valX,trainY,valY = train_test_split(X,y,random_state = 1)
您将能够使用正确的参数拟合模型。
我正在使用 RFC 求解 Titanic Kaggle 数据集,我在将数据拟合到模型时收到错误提示“未知标签类型:'unknown'”。我觉得错误在 y 中,但我找不到任何东西。
data = pd.read_csv('train.csv')
data = data.fillna(data.mean())
data = data.replace('male',1)
data = data.replace('female',0)
data = data.replace('S',0)
data = data.replace('C',1)
data = data.replace('Q',2)
data['Embarked'] = data['Embarked'].fillna('S')
data = data[data.Embarked != 'S']
y = data.Survived
np.unique(y)
features = ['Pclass','Sex','Age','Fare','SibSp','Parch','Embarked']
X = data[features]
trainX,trainY,valX,valY = train_test_split(X,y,random_state = 1)
titanmodel = RandomForestClassifier(random_state = 1)
titanmodel.fit(trainX,trainY)
模型拟合错误的部分
ValueError:未知标签类型:'unknown'
另外,如果您有更好的方法来解决这个问题,请告诉我。
提前致谢
train_test_split() 的结果是 X_train、X_test、y_train、y_test,并且您在代码中以不同的顺序分配值。
换行:
trainX,trainY,valX,valY = train_test_split(X,y,random_state = 1)
通过这个:
trainX,valX,trainY,valY = train_test_split(X,y,random_state = 1)
您将能够使用正确的参数拟合模型。