数据框单元格内重复的数据清理

Data cleaning for duplications within cells of a dataframe

我刚刚从一个网站上抓取了一个姓名数据集,但这些姓名进入数据框时出现了重复。示例:

    [MarkMark, SarahSarah, BenBen]

我正在抓取的网站在 table 中有图像,当我将 table 拉入数据框格式时,它似乎复制了名称。我将如何清理这些数据以便我只有一个名字?

尝试在中间拆分名称字符串

df["name"] = df["name"].apply(lambda name: name[:len(name)/2])