Python 根据另一个变量在数据框中生成虚拟对象
Python Generate dummy in dataframe based on another variable
我的数据框有很多变量。例如,我想根据第 1 列生成一个虚拟变量。如果第 1 列的观察结果为 NaN,则虚拟变量填充为 0。如果第 1 列的观察结果不缺失,则虚拟变量填充为 1。有什么想法吗?非常感谢。
这是最简单的方法:
# sample data
import pandas as pd
import numpy as np
df = pd.DataFrame()
df['sample'] = [1,2,np.nan,4,5,np.nan]
# create dummy column
df['dummy'] = np.where(df['sample'].isna(),0,1)
我的数据框有很多变量。例如,我想根据第 1 列生成一个虚拟变量。如果第 1 列的观察结果为 NaN,则虚拟变量填充为 0。如果第 1 列的观察结果不缺失,则虚拟变量填充为 1。有什么想法吗?非常感谢。
这是最简单的方法:
# sample data
import pandas as pd
import numpy as np
df = pd.DataFrame()
df['sample'] = [1,2,np.nan,4,5,np.nan]
# create dummy column
df['dummy'] = np.where(df['sample'].isna(),0,1)