添加列名以列出给定条件

Add column names to list given criteria

我正在尝试将数据框中的列名(以元组的形式)添加到给定特定条件的列表中。条件很简单,如果每列下的数据为 1(就其本身而言,不作为字符串或浮点数的一部分)。这是我通常使用的,它有效,但仅适用于较小的数据集(当按比例放大时,它会呈现 TypeError -- unsupported operand type(s) for +: 'int' and 'tuple'):

peaks_to_delete = []
for col in df3.columns:   #dataframe is df3
    if sum(df3[col]) == 1:
        peaks_to_delete.append(col)

列名称类似于 (125.98617542491242, 14.707909313725589) (332.3316802978516, 14.558341666666749) 等等...

我理解错误,但不明白为什么代码适用于较小的数据集而不适用于较大的数据集。

提前致谢!

这很可能与您 运行 它反对的列数无关。听起来您在最后一列中有一些值,其中包含一个或多个元组,其余为数字。您可以 运行 对列进行 for 循环以查看哪些不求和

for col in df.columns: 
    try: 
        x=sum(df[col])
    except:
        print(col)