添加列名以列出给定条件

Question

我正在尝试将数据框中的列名（以元组的形式）添加到给定特定条件的列表中。条件很简单，如果每列下的数据为 1（就其本身而言，不作为字符串或浮点数的一部分）。这是我通常使用的，它有效，但仅适用于较小的数据集（当按比例放大时，它会呈现 TypeError -- unsupported operand type(s) for +: 'int' and 'tuple'）：

peaks_to_delete = []
for col in df3.columns:   #dataframe is df3
    if sum(df3[col]) == 1:
        peaks_to_delete.append(col)

列名称类似于 (125.98617542491242, 14.707909313725589) (332.3316802978516, 14.558341666666749) 等等...

我理解错误，但不明白为什么代码适用于较小的数据集而不适用于较大的数据集。

提前致谢！

Answer 1

这很可能与您运行它反对的列数无关。听起来您在最后一列中有一些值，其中包含一个或多个元组，其余为数字。您可以运行对列进行 for 循环以查看哪些不求和

for col in df.columns: 
    try: 
        x=sum(df[col])
    except:
        print(col)

添加列名以列出给定条件

Add column names to list given criteria

python

tuples

unsupportedoperation