R chisq.test - 通过 df 自动化,每个变量与每个变量,df 有数据,不是计数,宽形式
R chisq.test - automate through a df, each variable with each, df has data, not counts, wide form
我有一个如下所示的数据框:
gend domh nat le re lf rf ad ab imp
1 f R fr y y n y y y Y
2 f R fr n n y n n n N
3 f R fr y y Y
4 f R fr n n n n n n N
5 m L fr y n n y y y Y
6 m R fr y y y y y y Y
7 m R fr y y y y y y Y
8 f L fr y y n n n y N
9 f R fr n n n n n y N
10 m R fr y y y y y y Y
11 f R fr y y n n y y Y
12 m R pfr n N
13 f R pfr y y n n n y N
14 m R pfr y n n n y y N
15 f R pfr y n y n y y Y
16 f R pfr y n y y y y Y
17 m L pfr n n y y y y Y
18 m R pfr y y y y y y Y
19 m R pfr y n y y y y Y
20 f R pfr y y y y y y Y
21 f R pfr n N
22 f R pfr y y y y y y Y
我希望每个变量都与每个变量“卡方”,即性别与 domh、nat、le 等,然后 domh 与其他每个变量,等等。我知道该怎么做这是手工制作的:
>chisq.test(df$gend, df$domh, simulate.p.value = T, B = 1000000)
但 必须 一种自动化的方法。我只需要测试中的 p 值(和对名称)。有人可以帮忙吗?
corrr
包中的函数 colpair_map
似乎提供了一种方法,因为您只需要 p 值。 (当然,遍历列是显而易见的选择)。
# you first need a function that just returns p-value
# to be used in colpair_map. The <htest> object returned
# by chisq.test doesn't work with colpair_map
chisq_pval <- function(...) {
chisq.test(...)$p.value
}
# the chisq_pval function defined above can now be used directly
# in colpair_map, along with the additional arguments for chisq.test
corrr::colpair_map(df, chisq_pval, simulate.p.value = T, B = 1000000)
我有一个如下所示的数据框:
gend domh nat le re lf rf ad ab imp
1 f R fr y y n y y y Y
2 f R fr n n y n n n N
3 f R fr y y Y
4 f R fr n n n n n n N
5 m L fr y n n y y y Y
6 m R fr y y y y y y Y
7 m R fr y y y y y y Y
8 f L fr y y n n n y N
9 f R fr n n n n n y N
10 m R fr y y y y y y Y
11 f R fr y y n n y y Y
12 m R pfr n N
13 f R pfr y y n n n y N
14 m R pfr y n n n y y N
15 f R pfr y n y n y y Y
16 f R pfr y n y y y y Y
17 m L pfr n n y y y y Y
18 m R pfr y y y y y y Y
19 m R pfr y n y y y y Y
20 f R pfr y y y y y y Y
21 f R pfr n N
22 f R pfr y y y y y y Y
我希望每个变量都与每个变量“卡方”,即性别与 domh、nat、le 等,然后 domh 与其他每个变量,等等。我知道该怎么做这是手工制作的:
>chisq.test(df$gend, df$domh, simulate.p.value = T, B = 1000000)
但 必须 一种自动化的方法。我只需要测试中的 p 值(和对名称)。有人可以帮忙吗?
corrr
包中的函数 colpair_map
似乎提供了一种方法,因为您只需要 p 值。 (当然,遍历列是显而易见的选择)。
# you first need a function that just returns p-value
# to be used in colpair_map. The <htest> object returned
# by chisq.test doesn't work with colpair_map
chisq_pval <- function(...) {
chisq.test(...)$p.value
}
# the chisq_pval function defined above can now be used directly
# in colpair_map, along with the additional arguments for chisq.test
corrr::colpair_map(df, chisq_pval, simulate.p.value = T, B = 1000000)