group_by() 和 unnest_tokens() 之后的 row_number() 错误

Error in row_number() after group_by() and unnest_tokens()

我试图在 group_by 块中标记化后更改行号并收到错误消息: 错误:无法将大小为 73422 的输入回收到大小 37055。 运行 rlang::last_error() 查看错误发生的地方。

library(tidyverse)
library(tidytext)
library(janeaustenr)

all_sentences <- austen_books() %>%
  group_by(book) %>%
  unnest_tokens(sentence, text, token = "sentences") %>%
  mutate(s_number = row_number()) %>%
  ungroup()

取消分组并重新分组后o.k。

all_sentences <- austen_books() %>%
  group_by(book) %>%
  unnest_tokens(sentence, text, token = "sentences") %>%
  ungroup() %>%
  group_by(book) %>%
  mutate(s_number = row_number()) %>%
  ungroup()

不过好像有点别扭 请指教

只需将 group_by 移到 unnest_tokens 语句之后。像这样:

all_sentences <- austen_books() %>%
  unnest_tokens(sentence, text, token = "sentences") %>%
  group_by(book) %>%
  mutate(s_number = row_number()) %>%
  ungroup()