R chisq.test - 通过 df 自动化,每个变量与每个变量,df 有数据,不是计数,宽形式

R chisq.test - automate through a df, each variable with each, df has data, not counts, wide form

我有一个如下所示的数据框:

    gend     domh   nat le re lf rf ad ab imp
1    f         R    fr  y  y  n  y  y  y   Y
2    f         R    fr  n  n  y  n  n  n   N
3    f         R    fr              y  y   Y
4    f         R    fr  n  n  n  n  n  n   N
5    m         L    fr  y  n  n  y  y  y   Y
6    m         R    fr  y  y  y  y  y  y   Y
7    m         R    fr  y  y  y  y  y  y   Y
8    f         L    fr  y  y  n  n  n  y   N
9    f         R    fr  n  n  n  n  n  y   N
10   m         R    fr  y  y  y  y  y  y   Y
11   f         R    fr  y  y  n  n  y  y   Y
12   m         R   pfr                 n   N
13   f         R   pfr  y  y  n  n  n  y   N
14   m         R   pfr  y  n  n  n  y  y   N
15   f         R   pfr  y  n  y  n  y  y   Y
16   f         R   pfr  y  n  y  y  y  y   Y
17   m         L   pfr  n  n  y  y  y  y   Y
18   m         R   pfr  y  y  y  y  y  y   Y
19   m         R   pfr  y  n  y  y  y  y   Y
20   f         R   pfr  y  y  y  y  y  y   Y
21   f         R   pfr                 n   N
22   f         R   pfr  y  y  y  y  y  y   Y

我希望每个变量都与每个变量“卡方”,即性别与 domh、nat、le 等,然后 domh 与其他每个变量,等等。我知道该怎么做这是手工制作的:

>chisq.test(df$gend, df$domh, simulate.p.value = T, B = 1000000)

必须 一种自动化的方法。我只需要测试中的 p 值(和对名称)。有人可以帮忙吗?

corrr 包中的函数 colpair_map 似乎提供了一种方法,因为您只需要 p 值。 (当然,遍历列是显而易见的选择)。

# you first need a function that just returns p-value
# to be used in colpair_map. The <htest> object returned
# by chisq.test doesn't work with colpair_map
chisq_pval <- function(...) {
    chisq.test(...)$p.value
}

# the chisq_pval function defined above can now be used directly
# in colpair_map, along with the additional arguments for chisq.test
corrr::colpair_map(df, chisq_pval, simulate.p.value = T, B = 1000000)