交叉 table 与包含 R 中多个值的列
cross table with a column containing multiple values in R
我想知道我的数据框中有多少低、中和高的戏剧性,以及我的数据框中有多少低、中和高的犯罪。
这是我的数据框示例:
genres class_rentabilite
Crime, Drama Medium
Action, Crime, Drama, Thriller High
Action, Adventure, Sci-Fi, Thriller Medium
Drama Low
Crime, Drama High
Comedy, Drama high
我将 table()
用于数据中的另一列,并且有效:
table(df$language, df$class_rentabilite)
上面的代码给出了这个:
Low Medium High NA
1 1 0 3
Aboriginal 0 0 2 0
Arabic 0 0 1 3
Aramaic 1 0 0 0
Bosnian 1 0 0 0
Cantonese 5 2 1 3
我想对示例数据使用这种方法,但是 table()
不起作用,因为我在 genres
的每一行中都有多个值。我该如何解决这种情况?
这是适合您的一种方法。您使用 separate_rows()
拆分流派并创建一个临时数据框。然后,你像以前一样使用table()
。
library(dplyr)
library(tidyr)
mydf %>%
separate_rows(genres, sep = ", ") -> foo
table(foo$genres, foo$class_rentabilite)
# High Low Medium
# Action 1 0 1
# Adventure 0 0 1
# Comedy 1 0 0
# Crime 2 0 1
# Drama 3 1 1
# Sci-Fi 0 0 1
# Thriller 1 0 1
数据
mydf <- structure(list(genres = c("Crime, Drama", "Action, Crime, Drama, Thriller",
"Action, Adventure, Sci-Fi, Thriller", "Drama", "Crime, Drama",
"Comedy, Drama"), class_rentabilite = c("Medium", "High", "Medium",
"Low", "High", "High")), .Names = c("genres", "class_rentabilite"
), row.names = c(NA, -6L), class = "data.frame")
我想知道我的数据框中有多少低、中和高的戏剧性,以及我的数据框中有多少低、中和高的犯罪。
这是我的数据框示例:
genres class_rentabilite
Crime, Drama Medium
Action, Crime, Drama, Thriller High
Action, Adventure, Sci-Fi, Thriller Medium
Drama Low
Crime, Drama High
Comedy, Drama high
我将 table()
用于数据中的另一列,并且有效:
table(df$language, df$class_rentabilite)
上面的代码给出了这个:
Low Medium High NA
1 1 0 3
Aboriginal 0 0 2 0
Arabic 0 0 1 3
Aramaic 1 0 0 0
Bosnian 1 0 0 0
Cantonese 5 2 1 3
我想对示例数据使用这种方法,但是 table()
不起作用,因为我在 genres
的每一行中都有多个值。我该如何解决这种情况?
这是适合您的一种方法。您使用 separate_rows()
拆分流派并创建一个临时数据框。然后,你像以前一样使用table()
。
library(dplyr)
library(tidyr)
mydf %>%
separate_rows(genres, sep = ", ") -> foo
table(foo$genres, foo$class_rentabilite)
# High Low Medium
# Action 1 0 1
# Adventure 0 0 1
# Comedy 1 0 0
# Crime 2 0 1
# Drama 3 1 1
# Sci-Fi 0 0 1
# Thriller 1 0 1
数据
mydf <- structure(list(genres = c("Crime, Drama", "Action, Crime, Drama, Thriller",
"Action, Adventure, Sci-Fi, Thriller", "Drama", "Crime, Drama",
"Comedy, Drama"), class_rentabilite = c("Medium", "High", "Medium",
"Low", "High", "High")), .Names = c("genres", "class_rentabilite"
), row.names = c(NA, -6L), class = "data.frame")