jupyter 中是否有删除行中重复值的函数?

Is there any function to remove duplicate values in rows in jupyter?

我有一个 csv 文件。我需要删除 street_name 下的重复值。例如:我有多个 hwy-1w!

我使用了这个查询:joinedResult.groupby('roadId')['street_name'].apply(', '.join).reset_index().to_csv(f'./2{areaId}.csv', index = False)

如果您希望每行唯一, 可能会有所帮助。如果您想将数据保留在行中而不关心后面行中字符串的顺序,也许这会有所帮助:

df['street_name'] = df['street_name'].apply(lambda x: ', '.join(set(x.split(', '))

转换为集始终是删除重复项的好方法。

如果需要保持顺序,可以使用计数器。不过,它会比使用集合慢:

from collections import Counter
df['street_name'] = df['street_name'].apply(lambda x: ', '.join(Counter(x.split(', ')).keys()))