使用 loc returns 空数据帧在多个条件下过滤 pandas 数据帧
Filtering pandas dataframe on multiple conditions using loc returns empty dataframe
我正在尝试使用 loc
在多个条件下过滤我的数据框
数据来自我使用 df = pd.read_csv()
导入到数据框中的 Excel 文件
这是使用 df.head() 的 df 的示例结构:
df.head()
我需要根据以下条件进行筛选:州政府、单身汉、未婚、行政文员、非家庭成员、白人、男性、美国、<=50k
这是我写的代码。它 returns 正确的列,但没有行 df 为空:
df.loc[(df['Sector']=='State-Gov') & (df['Education']=='Bachelors') & (df['Married']=='Never-Married') &
(df['Job']=='Adm-Clerical') & (df['Family']=='Not-in-Family') & (df['Race']=='White') & (df['Gender']=='Male') &
(df['Location']=='United-States') & (df['Income']=='<=50k'), ['Sector', 'Education', 'Married', 'Job', 'Family', 'Race', 'Gender', 'Location', 'Income']]
感谢任何帮助,谢谢!
问题似乎出在“未清理”数据(字符串值前后的空格)中。
解决方法是清理数据(使用.str.strip()
等),例如:
print(df.loc[df["Sector"].str.strip() == "State-gov"])
我正在尝试使用 loc
在多个条件下过滤我的数据框数据来自我使用 df = pd.read_csv()
导入到数据框中的 Excel 文件这是使用 df.head() 的 df 的示例结构:
df.head()
我需要根据以下条件进行筛选:州政府、单身汉、未婚、行政文员、非家庭成员、白人、男性、美国、<=50k
这是我写的代码。它 returns 正确的列,但没有行 df 为空:
df.loc[(df['Sector']=='State-Gov') & (df['Education']=='Bachelors') & (df['Married']=='Never-Married') &
(df['Job']=='Adm-Clerical') & (df['Family']=='Not-in-Family') & (df['Race']=='White') & (df['Gender']=='Male') &
(df['Location']=='United-States') & (df['Income']=='<=50k'), ['Sector', 'Education', 'Married', 'Job', 'Family', 'Race', 'Gender', 'Location', 'Income']]
感谢任何帮助,谢谢!
问题似乎出在“未清理”数据(字符串值前后的空格)中。
解决方法是清理数据(使用.str.strip()
等),例如:
print(df.loc[df["Sector"].str.strip() == "State-gov"])