Concatenate/join 将多行字符串合并为整个数据帧的一行
Concatenate/join multiple rows of strings into one single row for the entire dataframe
我在 CSV 文件中有一个包含 60,000 条推文的数据集。有些推文是多行的,但我需要将它们全部设为一行。举个例子:
正如您从上面的示例中看到的,推文是多行的。我想把它变成一行:
index Tweet ID "On the other side we could do it over I will hold you closer Maybe not this time But I find you again and again again #missuniverse #emin", Label
我已尝试使用以下代码但得到以下结果:
df7['Tweet']= df7['Tweet'].str.join(sep=' ')
代码实际上没有加入,而是进一步分裂。这没有帮助。我缺少什么?
请注意,此数据框包含上述示例的多个实例,我想为整个数据集制作一行。
这是一个您可以使用的简单解决方案:
df7['Tweet'] = df7['Tweet'].str.replace('\n', ' ')
请记住,在 ASCII 编码中,换行符由 转义序列 表示:\n
.
用空格替换它会得到你正在寻找的结果。
我在 CSV 文件中有一个包含 60,000 条推文的数据集。有些推文是多行的,但我需要将它们全部设为一行。举个例子:
正如您从上面的示例中看到的,推文是多行的。我想把它变成一行:
index Tweet ID "On the other side we could do it over I will hold you closer Maybe not this time But I find you again and again again #missuniverse #emin", Label
我已尝试使用以下代码但得到以下结果:
df7['Tweet']= df7['Tweet'].str.join(sep=' ')
代码实际上没有加入,而是进一步分裂。这没有帮助。我缺少什么?
请注意,此数据框包含上述示例的多个实例,我想为整个数据集制作一行。
这是一个您可以使用的简单解决方案:
df7['Tweet'] = df7['Tweet'].str.replace('\n', ' ')
请记住,在 ASCII 编码中,换行符由 转义序列 表示:\n
.
用空格替换它会得到你正在寻找的结果。