group_by() 和 unnest_tokens() 之后的 row_number() 错误
Error in row_number() after group_by() and unnest_tokens()
我试图在 group_by 块中标记化后更改行号并收到错误消息:
错误:无法将大小为 73422 的输入回收到大小 37055。
运行 rlang::last_error()
查看错误发生的地方。
library(tidyverse)
library(tidytext)
library(janeaustenr)
all_sentences <- austen_books() %>%
group_by(book) %>%
unnest_tokens(sentence, text, token = "sentences") %>%
mutate(s_number = row_number()) %>%
ungroup()
取消分组并重新分组后o.k。
all_sentences <- austen_books() %>%
group_by(book) %>%
unnest_tokens(sentence, text, token = "sentences") %>%
ungroup() %>%
group_by(book) %>%
mutate(s_number = row_number()) %>%
ungroup()
不过好像有点别扭
请指教
只需将 group_by 移到 unnest_tokens
语句之后。像这样:
all_sentences <- austen_books() %>%
unnest_tokens(sentence, text, token = "sentences") %>%
group_by(book) %>%
mutate(s_number = row_number()) %>%
ungroup()
我试图在 group_by 块中标记化后更改行号并收到错误消息:
错误:无法将大小为 73422 的输入回收到大小 37055。
运行 rlang::last_error()
查看错误发生的地方。
library(tidyverse)
library(tidytext)
library(janeaustenr)
all_sentences <- austen_books() %>%
group_by(book) %>%
unnest_tokens(sentence, text, token = "sentences") %>%
mutate(s_number = row_number()) %>%
ungroup()
取消分组并重新分组后o.k。
all_sentences <- austen_books() %>%
group_by(book) %>%
unnest_tokens(sentence, text, token = "sentences") %>%
ungroup() %>%
group_by(book) %>%
mutate(s_number = row_number()) %>%
ungroup()
不过好像有点别扭 请指教
只需将 group_by 移到 unnest_tokens
语句之后。像这样:
all_sentences <- austen_books() %>%
unnest_tokens(sentence, text, token = "sentences") %>%
group_by(book) %>%
mutate(s_number = row_number()) %>%
ungroup()