将文本数据转换为 table/csv 格式
Converting text data to table/csv format
我需要使用 R 将文本数据(例如,段落)转换为数据框(以保存为 csv 文件)。具体需要是将每个段落中的每个单词放在列中的单独单元格中。以下代码将文本转换为 table,但它将每行中的单词放在单个单元格中。你能帮忙创建一个单列数据集,每个单词都在一个单独的单元格中吗?
merchant <- read.delim("merchant.txt")
write.table(merchant,file="merchant.csv",sep=",",col.names=FALSE,row.names=FALSE)
这是我基于 tidyverse 的尝试。不是以 table 形式读入,而是以字符串形式读入,然后分成单个单词的向量:
library(tidyverse)
## Read in text file as string
merchant <- read_file("merchant.txt") %>%
## Remove all punctuation
gsub('[[:punct:] ]+',' ',.) %>%
## Split individual words into list vector
strsplit(" ")
## Set column equal to the vector of individual words
para <- merchant[[1]]
要将其转换为数据帧:
para <- as.data.frame(para)
我需要使用 R 将文本数据(例如,段落)转换为数据框(以保存为 csv 文件)。具体需要是将每个段落中的每个单词放在列中的单独单元格中。以下代码将文本转换为 table,但它将每行中的单词放在单个单元格中。你能帮忙创建一个单列数据集,每个单词都在一个单独的单元格中吗?
merchant <- read.delim("merchant.txt")
write.table(merchant,file="merchant.csv",sep=",",col.names=FALSE,row.names=FALSE)
这是我基于 tidyverse 的尝试。不是以 table 形式读入,而是以字符串形式读入,然后分成单个单词的向量:
library(tidyverse)
## Read in text file as string
merchant <- read_file("merchant.txt") %>%
## Remove all punctuation
gsub('[[:punct:] ]+',' ',.) %>%
## Split individual words into list vector
strsplit(" ")
## Set column equal to the vector of individual words
para <- merchant[[1]]
要将其转换为数据帧:
para <- as.data.frame(para)