kaggle titanic 子集女性和 Children

kaggle titanic Subset Women and Children

我试图通过从两个变量中提取特定信息来从 kaggle 上的泰坦尼克号数据集创建一个特征变量,但我不知道如何对其进行编码。我想组合 "Sex" 变量和 "Parch" 变量。我想要的是,如果乘客是 children 或 parents 的女性,则应在名为 "WomenandChildren." 的新变量中将其编码为 1 如果他们是没有 children/parents 或有或没有 children 的男性应编码为 0.

我的理论是 children 的女性比没有 children 的女性或有或没有 children 的男性更有可能存活。

通过使用 panda 或 scikit 学习 python 库,并通过使用 python 语言,您可以组合特征变量。