根据 python 中的列数据类型向显示布尔值的数据框添加列
Adding columns to dataframe that show boolean based on column data type in python
我正在尝试根据确定当前正在迭代的列是字母数字、字母顺序还是数字来向数据框添加布尔值列。不幸的是,每个列都为每个布尔测试给出 False。目标是对于给定的列,如何添加另一列来显示给定列中的行是否为字母数字?我不想遍历列中的每一行,因为这非常耗时。我需要这样做,因为在某些情况下我不知道给定列中将包含什么数据类型。
def add_numeric_alpha_alphanum_tests(dataframe, dataframe_column_names):
for column_name in dataframe_column_names:
column_name_is_alphanumeric = column_name + "_is_alphanumeric"
data_to_test = str(dataframe[column_name].values)
dataframe[column_name_is_alphanumeric] = np.where(data_to_test.isalnum(), True, False)
column_name_is_alpha = column_name + "_is_alpha"
dataframe[column_name_is_alpha] = np.where(data_to_test.isalpha(), True, False)
column_name_is_digit = column_name + "_is_digit"
dataframe[column_name_is_digit] = np.where(data_to_test.isdigit(), True, False)
return dataframe
您可以利用Pandas中的apply
功能,享受效率,例如:
dataframe['column1_is_alphanumeric'] = dataframe['column1'].apply(lambda x: True if str(x).isalnum() else False)
dataframe['column1_is_alpha'] = dataframe['column1'].apply(lambda x: True if str(x).isalpha() else False)
dataframe['column1_is_digit'] = dataframe['column1'].apply(lambda x: True if str(x).isdigit() else False)
我正在尝试根据确定当前正在迭代的列是字母数字、字母顺序还是数字来向数据框添加布尔值列。不幸的是,每个列都为每个布尔测试给出 False。目标是对于给定的列,如何添加另一列来显示给定列中的行是否为字母数字?我不想遍历列中的每一行,因为这非常耗时。我需要这样做,因为在某些情况下我不知道给定列中将包含什么数据类型。
def add_numeric_alpha_alphanum_tests(dataframe, dataframe_column_names):
for column_name in dataframe_column_names:
column_name_is_alphanumeric = column_name + "_is_alphanumeric"
data_to_test = str(dataframe[column_name].values)
dataframe[column_name_is_alphanumeric] = np.where(data_to_test.isalnum(), True, False)
column_name_is_alpha = column_name + "_is_alpha"
dataframe[column_name_is_alpha] = np.where(data_to_test.isalpha(), True, False)
column_name_is_digit = column_name + "_is_digit"
dataframe[column_name_is_digit] = np.where(data_to_test.isdigit(), True, False)
return dataframe
您可以利用Pandas中的apply
功能,享受效率,例如:
dataframe['column1_is_alphanumeric'] = dataframe['column1'].apply(lambda x: True if str(x).isalnum() else False)
dataframe['column1_is_alpha'] = dataframe['column1'].apply(lambda x: True if str(x).isalpha() else False)
dataframe['column1_is_digit'] = dataframe['column1'].apply(lambda x: True if str(x).isdigit() else False)