将单元格中的单词移动到单独的列
Moving words in a cell to individual columns
我有一个 csv 文件,其中有一列每个单元格中有多个单词。我想知道是否有任何 R 函数可以将每个单元格中的单词移动到单个单元格。
以下是数据集中两个单元格的数据:
arecapalm,betelnut,konkan,nature,traveldiaries,无反相框
passangerstories,chakarmanee,atranginikhil,马哈拉施特拉邦,印度
谢谢。任何帮助表示赞赏。
查米尔
让我们假设这个 data.frame:
require(dplyr)
require(tidyr)
df<-data.frame(id=1:2, words=c("arecapalm,betelnut,konkan,nature,traveldiaries,mirrorlessframes","passangerstories,chakarmanee,atranginikhil,maharashtra,india"))
df
# id words
#1 1 arecapalm,betelnut,konkan,nature,traveldiaries,mirrorlessframes
#2 2 passangerstories,chakarmanee,atranginikhil,maharashtra,india
然后我们可以 运行 使用 dplyr
和 tidyr
将单词单元格分解成多个列:
df %>% separate_rows(words) %>%
group_by(id) %>%
mutate(wordid=row_number()) %>%
spread(wordid,words,sep=".")
# A tibble: 2 x 7
# Groups: id [2]
id wordid.1 wordid.2 wordid.3 wordid.4 wordid.5 wordid.6
<int> <chr> <chr> <chr> <chr> <chr> <chr>
1 1 arecapalm betelnut konkan nature traveldiaries mirrorlessframes
2 2 passangerstories chakarmanee atranginikhil maharashtra india NA
我有一个 csv 文件,其中有一列每个单元格中有多个单词。我想知道是否有任何 R 函数可以将每个单元格中的单词移动到单个单元格。 以下是数据集中两个单元格的数据:
arecapalm,betelnut,konkan,nature,traveldiaries,无反相框 passangerstories,chakarmanee,atranginikhil,马哈拉施特拉邦,印度
谢谢。任何帮助表示赞赏。
查米尔
让我们假设这个 data.frame:
require(dplyr)
require(tidyr)
df<-data.frame(id=1:2, words=c("arecapalm,betelnut,konkan,nature,traveldiaries,mirrorlessframes","passangerstories,chakarmanee,atranginikhil,maharashtra,india"))
df
# id words
#1 1 arecapalm,betelnut,konkan,nature,traveldiaries,mirrorlessframes
#2 2 passangerstories,chakarmanee,atranginikhil,maharashtra,india
然后我们可以 运行 使用 dplyr
和 tidyr
将单词单元格分解成多个列:
df %>% separate_rows(words) %>%
group_by(id) %>%
mutate(wordid=row_number()) %>%
spread(wordid,words,sep=".")
# A tibble: 2 x 7
# Groups: id [2]
id wordid.1 wordid.2 wordid.3 wordid.4 wordid.5 wordid.6
<int> <chr> <chr> <chr> <chr> <chr> <chr>
1 1 arecapalm betelnut konkan nature traveldiaries mirrorlessframes
2 2 passangerstories chakarmanee atranginikhil maharashtra india NA