如何在修改值时为 Dataframe 设置多个条件?
How to set multiple conditions for a Dataframe while modifying the values?
因此,我正在寻找一种有效的方法来在现有列中设置值并根据某些条件为新列设置值。如果我在一个大数据集中有10个条件,我是否必须写10行?或者我能以某种方式将它们结合起来......还没有弄清楚。
你们能推荐点什么吗?
例如:
data_frame.loc[data_frame.col1 > 50 ,["col1","new_col"]] = "酷"
data_frame.loc[data_frame.col2 < 100 ,["col1","new_col"]] = "酷"
可以写成一个表达式吗? “&”或“和”不起作用...
谢谢!
你可以试试:
all_conditions = [condition_1, condition_2]
fill_with = [fill_condition_1_with, fill_condition_2_with]
df[["col1","new_col"]] = np.select(all_conditions, fill_with, default=default_value_here)
是的,你可以做到,
这是一个例子:
data_frame.loc[(data_frame["col1"]>100) & (data_frame["col2"]<10000) | (data_frame["col3"]<500),"测试"] = 0
解释:
我使用的过滤器是(带有“and”和“or”条件):(data_frame["col1"]>100) & (data_frame["col2"]<10000 ) | (data_frame["col3"]<500)
将更改的列是“test”,值将为 0
因此,我正在寻找一种有效的方法来在现有列中设置值并根据某些条件为新列设置值。如果我在一个大数据集中有10个条件,我是否必须写10行?或者我能以某种方式将它们结合起来......还没有弄清楚。 你们能推荐点什么吗?
例如:
data_frame.loc[data_frame.col1 > 50 ,["col1","new_col"]] = "酷"
data_frame.loc[data_frame.col2 < 100 ,["col1","new_col"]] = "酷"
可以写成一个表达式吗? “&”或“和”不起作用...
谢谢!
你可以试试:
all_conditions = [condition_1, condition_2]
fill_with = [fill_condition_1_with, fill_condition_2_with]
df[["col1","new_col"]] = np.select(all_conditions, fill_with, default=default_value_here)
是的,你可以做到, 这是一个例子:
data_frame.loc[(data_frame["col1"]>100) & (data_frame["col2"]<10000) | (data_frame["col3"]<500),"测试"] = 0
解释:
我使用的过滤器是(带有“and”和“or”条件):(data_frame["col1"]>100) & (data_frame["col2"]<10000 ) | (data_frame["col3"]<500)
将更改的列是“test”,值将为 0