Concatenate/join 将多行字符串合并为整个数据帧的一行

Concatenate/join multiple rows of strings into one single row for the entire dataframe

我在 CSV 文件中有一个包含 60,000 条推文的数据集。有些推文是多行的,但我需要将它们全部设为一行。举个例子:

正如您从上面的示例中看到的,推文是多行的。我想把它变成一行:

index Tweet ID "On the other side we could do it over I will hold you closer Maybe not this time But I find you again and again again #missuniverse #emin", Label

我已尝试使用以下代码但得到以下结果:

df7['Tweet']= df7['Tweet'].str.join(sep=' ')

代码实际上没有加入,而是进一步分裂。这没有帮助。我缺少什么?

请注意,此数据框包含上述示例的多个实例,我想为整个数据集制作一行。

这是一个您可以使用的简单解决方案:

df7['Tweet'] = df7['Tweet'].str.replace('\n', ' ')

请记住,在 ASCII 编码中,换行符由 转义序列 表示:\n.

用空格替换它会得到你正在寻找的结果。