从有问题的值位于单独列表中的数据框中删除行

Question

我有一个问题行列表，其中有一个唯一标识符，我想从数据框中删除所有这些行。

我试过使用 loc 来索引它们，如下所示：

df.loc[df['GUID'] != toDel['GUID']]

其中 df 是 5063 行 x 28 列，toDel['GUID'] 是我想从 df 中删除的 GUID 列表。

我希望这会给我一个不包含有问题的行的 df。但是，我得到一个 'valueError: Can only compare identically-labeled Series objects.' 我想这意味着它们必须是相同大小的系列，但是我如何使用此 toDel['GUID'] 列表摆脱有问题的 GUID？

Answer 1

要仅保留 GUID 在 toDel['GUID'] 中的行，您可以这样做

df.loc[df['GUID'].isin(toDel['GUID'])]

从有问题的值位于单独列表中的数据框中删除行

Drop rows from dataframe where problematic values are in separate list

python

pandas

pandas-loc