添加列名以列出给定条件
Add column names to list given criteria
我正在尝试将数据框中的列名(以元组的形式)添加到给定特定条件的列表中。条件很简单,如果每列下的数据为 1(就其本身而言,不作为字符串或浮点数的一部分)。这是我通常使用的,它有效,但仅适用于较小的数据集(当按比例放大时,它会呈现 TypeError -- unsupported operand type(s) for +: 'int' and 'tuple'):
peaks_to_delete = []
for col in df3.columns: #dataframe is df3
if sum(df3[col]) == 1:
peaks_to_delete.append(col)
列名称类似于 (125.98617542491242, 14.707909313725589)
(332.3316802978516, 14.558341666666749)
等等...
我理解错误,但不明白为什么代码适用于较小的数据集而不适用于较大的数据集。
提前致谢!
这很可能与您 运行 它反对的列数无关。听起来您在最后一列中有一些值,其中包含一个或多个元组,其余为数字。您可以 运行 对列进行 for 循环以查看哪些不求和
for col in df.columns:
try:
x=sum(df[col])
except:
print(col)
我正在尝试将数据框中的列名(以元组的形式)添加到给定特定条件的列表中。条件很简单,如果每列下的数据为 1(就其本身而言,不作为字符串或浮点数的一部分)。这是我通常使用的,它有效,但仅适用于较小的数据集(当按比例放大时,它会呈现 TypeError -- unsupported operand type(s) for +: 'int' and 'tuple'):
peaks_to_delete = []
for col in df3.columns: #dataframe is df3
if sum(df3[col]) == 1:
peaks_to_delete.append(col)
列名称类似于 (125.98617542491242, 14.707909313725589)
(332.3316802978516, 14.558341666666749)
等等...
我理解错误,但不明白为什么代码适用于较小的数据集而不适用于较大的数据集。
提前致谢!
这很可能与您 运行 它反对的列数无关。听起来您在最后一列中有一些值,其中包含一个或多个元组,其余为数字。您可以 运行 对列进行 for 循环以查看哪些不求和
for col in df.columns:
try:
x=sum(df[col])
except:
print(col)