Chisq.test/prop.test 不同长度的向量

Question

我正在尝试对某些患者进行手术而其他患者未进行手术的数据进行 chisq.test 或 prop.test。我想看看两组中两种性别的比例是否相等。在我的手术组和非手术组人数不相等的情况下，最合适的测试是什么？

我正在尝试使用以下代码，使用 data.table 但我也发现了以下错误：

> chisq.test(lateral[Surgery == "No", "sex",with=F], lateral[Surgery == "Yes", "sex",with=F])

Error in chisq.test(lateral[Surgery == "No", "sex", with = F], lateral[Surgery ==  : 
  'x' and 'y' must have the same length

For prop.test():
Error in complete.cases(x, n) : not all arguments have the same length

数据

setDT(structure(list(sex = c(2L, 2L, 2L, 1L, 1L, 2L, 1L, 1L, 1L, 2L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 1L, 2L, 2L, 2L, 1L, 2L, 1L, 1L, 1L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 2L, 1L, 2L, 1L, 1L, 1L, 1L, 2L, 1L, 2L, 2L, 2L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 1L, 2L, 1L, 2L, 1L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 1L, 2L, 1L, 1L, 2L, 2L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 1L, 1L, 2L, 2L, 2L, 1L, 2L, 1L, 1L, 1L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 1L, 2L, 1L, 1L, 1L, 2L, 1L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 2L, 2L, 1L, 2L, 1L, 1L, 2L, 1L, 1L, 1L, 2L, 1L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 1L, 2L, 1L, 1L, 2L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 2L, 2L, 2L, 1L, 2L), Surgery = c("No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes" )), row.names = c(NA, -239L), class = c("data.table", "data.frame" )))

Answer 1

你可以传递一个table给函数chisq.test，让它更简单。例如

df <- structure(list(sex = c(2L, 2L, 2L, 1L, 1L, 2L, 1L, 1L, 1L, 2L, 
                       1L, 1L, 1L, 1L, 2L, 1L, 1L, 1L, 2L, 2L, 2L, 1L, 2L, 1L, 1L, 1L, 
                       2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 1L, 1L, 1L, 1L, 
                       1L, 1L, 2L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 2L, 1L, 2L, 1L, 1L, 1L, 
                       1L, 2L, 1L, 2L, 2L, 2L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 
                       2L, 1L, 2L, 1L, 2L, 1L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 
                       1L, 2L, 1L, 1L, 2L, 2L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 1L, 1L, 
                       2L, 2L, 2L, 1L, 2L, 1L, 1L, 1L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 2L, 
                       1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 
                       2L, 1L, 2L, 1L, 1L, 1L, 2L, 1L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 
                       1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 1L, 1L, 1L, 
                       2L, 1L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 
                       1L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 2L, 2L, 1L, 2L, 1L, 1L, 2L, 1L, 
                       1L, 1L, 2L, 1L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 1L, 2L, 1L, 1L, 2L, 
                       2L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 
                       2L, 2L, 2L, 1L, 2L), Surgery = c("No", "No", "No", "No", "No", 
                                                        "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", 
                                                        "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", 
                                                        "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", 
                                                        "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", 
                                                        "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", 
                                                        "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", 
                                                        "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", 
                                                        "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", 
                                                        "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", 
                                                        "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", 
                                                        "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", 
                                                        "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", 
                                                        "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", "No", 
                                                        "No", "No", "No", "No", "No", "No", "Yes", "Yes", "Yes", "Yes", 
                                                        "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", 
                                                        "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", 
                                                        "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", 
                                                        "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", 
                                                        "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", 
                                                        "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", 
                                                        "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", 
                                                        "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", 
                                                        "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes", "Yes"
                       )), row.names = c(NA, -239L), class = c("data.table", "data.frame"))

df$sex <- as.factor(df$sex)
df$Surgery <- as.factor(df$Surgery)
(prop_table <- table(df))
# Surgery
# sex No Yes
# 1 97  66
# 2 57  19
mod1 <- chisq.test(prop_table)
mod1
# Pearson's Chi-squared test with Yates' continuity correction
# 
# data:  prop_table
# X-squared = 4.7727, df = 1, p-value = 0.02892
str(mod1)
# List of 9
# $ statistic: Named num 4.77
# ..- attr(*, "names")= chr "X-squared"
# $ parameter: Named int 1
# ..- attr(*, "names")= chr "df"
# $ p.value  : num 0.0289
# $ method   : chr "Pearson's Chi-squared test with Yates' continuity correction"
# $ data.name: chr "prop_table"
# $ observed : 'table' int [1:2, 1:2] 97 57 66 19
# ..- attr(*, "dimnames")=List of 2
# .. ..$ sex    : chr [1:2] "1" "2"
# .. ..$ Surgery: chr [1:2] "No" "Yes"
# $ expected : num [1:2, 1:2] 105 49 58 27
# ..- attr(*, "dimnames")=List of 2
# .. ..$ sex    : chr [1:2] "1" "2"
# .. ..$ Surgery: chr [1:2] "No" "Yes"
# $ residuals: 'table' num [1:2, 1:2] -0.783 1.147 1.055 -1.544
# ..- attr(*, "dimnames")=List of 2
# .. ..$ sex    : chr [1:2] "1" "2"
# .. ..$ Surgery: chr [1:2] "No" "Yes"
# $ stdres   : 'table' num [1:2, 1:2] -2.33 2.33 2.33 -2.33
# ..- attr(*, "dimnames")=List of 2
# .. ..$ sex    : chr [1:2] "1" "2"
# .. ..$ Surgery: chr [1:2] "No" "Yes"
# - attr(*, "class")= chr "htest"

Chisq.test/prop.test 不同长度的向量

Chisq.test/prop.test on vectors of different lengths

r

chi-squared

data.table

proportions