我怎样才能摆脱 csv 语言列中的括号和撇号 (')

How can I get ride of the brackets and apostrophe (') in the language column in csv

我需要数据清理方面的帮助。 我如何将语言列(D)变成列(F)中的形式 基本上只是去掉括号和撇号,并保留每种语言之间的逗号。 可以使用 python 或 excel 本身来完成 谢谢!

我试过 google 但没成功

您可以使用 pandas 将 csv 读入数据框,然后将一个函数“应用”到执行如下操作的列:

def clean(value: str) -> str:
    for c in "[']":
        value = value.replace(c, "")
    return value

值得注意的是,如果您删除括号,您将拥有一个“嵌入式”分隔符,这意味着您将无法轻松地将其保存为“csv”。

如果你想在 Excel 中清理它,你可以像我上面的公式一样,添加一个公式,用一个空字符串替换所有不需要的字符,如下所示:

=SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(D2,"'",""),"[",""),"]","")

*其中 D2 是第一个语言单元格

FWIW,我也会花几分钟时间在 pandas 中玩这个 - 掌握一项新技能总是好的

根据图像,第 'D' 列中的数据类型似乎是一个元素列表,因此在写入单元格时,包含方括号。

他们有一个简单的技巧来处理这个问题: 当您遍历列和行(基本上是单元格)时,只需 运行 一个在连接之前的列表理解,如下所示

''.join[_val for _val in str(_cell_val) if str(_val) not in ['[', ']', '\'']

使用列表理解搜索列表到字符串的转换,您应该有足够的样本。