CSV 数据集提取和匹配列中的数据
CSV Dataset extract and match data in columns
我有一个数据集,其中有机场 'type' 和 'name' 列。我想要做的是从这个数据框创建新的数据框,其中我有 'small'、'medium' 和 'large' 机场及其物品名称。请看下面的截图
我不知道应该使用什么方法。任何人都可以告诉我方向。我不知道如何将机场类型与其名称相匹配,然后从中创建一个新的 table。结果应如下所示:
等等。
非常感谢任何方向。
虚拟数据帧
df = pd.DataFrame(
{
"type": ["hellport", "small_airport", "large_airport", "medium_airport", "small_airport"],
"name": ["name1", "name2", "name3", "name4", "name5"],
"etc1": [1, 0, 1, 0, 2],
"etc2": [1, 1, 1, 1, 2]
}
)
打印数据帧
type name etc1 etc2
0 hellport name1 1 1
1 small_airport name2 0 1
2 large_airport name3 1 1
3 medium_airport name4 0 1
4 small_airport name5 2 2
你想要什么
df_group = df.groupby('type')['name'].unique().reset_index()
df_group = pd.concat([df_group, df_group['name'].apply(pd.Series)], axis=1).set_index('type').drop(columns='name').T
打印df_group
type hellport large_airport medium_airport small_airport
0 name1 name3 name4 name2
1 NaN NaN NaN name5
我有一个数据集,其中有机场 'type' 和 'name' 列。我想要做的是从这个数据框创建新的数据框,其中我有 'small'、'medium' 和 'large' 机场及其物品名称。请看下面的截图
我不知道应该使用什么方法。任何人都可以告诉我方向。我不知道如何将机场类型与其名称相匹配,然后从中创建一个新的 table。结果应如下所示:
等等。 非常感谢任何方向。
虚拟数据帧
df = pd.DataFrame(
{
"type": ["hellport", "small_airport", "large_airport", "medium_airport", "small_airport"],
"name": ["name1", "name2", "name3", "name4", "name5"],
"etc1": [1, 0, 1, 0, 2],
"etc2": [1, 1, 1, 1, 2]
}
)
打印数据帧
type name etc1 etc2
0 hellport name1 1 1
1 small_airport name2 0 1
2 large_airport name3 1 1
3 medium_airport name4 0 1
4 small_airport name5 2 2
你想要什么
df_group = df.groupby('type')['name'].unique().reset_index()
df_group = pd.concat([df_group, df_group['name'].apply(pd.Series)], axis=1).set_index('type').drop(columns='name').T
打印df_group
type hellport large_airport medium_airport small_airport
0 name1 name3 name4 name2
1 NaN NaN NaN name5