R 中有限制的组合数

Question

亲爱的 R 和统计社区，

总共 9 个对象中 select 3 个对象有多少种可能的组合，并且 3 个 selected 对象不会在一个外部特征中重复自身？

在我的示例中，三个 selected 标本的物种属性必须始终不同。也就是说，在 3 的 selection 中，应该总是有一个物种 A 的代表，一个物种 B 和一个物种 C，并且这个 selection 中的顺序无关紧要。

> mydata <- data.frame(specimens = paste("s", 1:9, sep = ""), species = LETTERS[1:3])
> mydata
  specimens species
1        s1       A
2        s2       B
3        s3       C
4        s4       A
5        s5       B
6        s6       C
7        s7       A
8        s8       B
9        s9       C

一共有多少种组合？我知道如何计算任意一组三个对象的组合，例如arrangements::ncombinations(9,3) 或 choose(9,3).

我看到了一种生成组合的方法，它允许粘贴自定义函数，这有助于 selecting 具有所需属性的组合。

library(utils)
combn(mydata$specimens, 3, FUN)

我无法自己设计这样的功能。其中一项不成功的试验是

library(utils)
outp <- combn(as.character(mydata$specimens), 3, function(x) !duplicated(mydata$species))
> outp[, 1:10]
       [,1]  [,2]  [,3]  [,4]  [,5]  [,6]  [,7]  [,8]  [,9] [,10]
 [1,]  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE
 [2,]  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE
 [3,]  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE
 [4,] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
 [5,] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
 [6,] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
 [7,] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
 [8,] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
 [9,] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE

在此先感谢您的帮助。

Answer 1

必须有一个A，一个B和一个C。有3种可能的A。这些中的每一个都必须与其中一个 B 一起出现，因此有 3 * 3 = 9 对可能的 A 和 B。这些对中的每一对都可以与 3 个 C 中的一个组合在一起，因此有 3 * 3 * 3 = 27 种可能的组合。

您可以使用此 one-liner:

查看所有内容

expand.grid(split(mydata$specimens, mydata$species))
#>     A  B  C
#> 1  s1 s2 s3
#> 2  s4 s2 s3
#> 3  s7 s2 s3
#> 4  s1 s5 s3
#> 5  s4 s5 s3
#> 6  s7 s5 s3
#> 7  s1 s8 s3
#> 8  s4 s8 s3
#> 9  s7 s8 s3
#> 10 s1 s2 s6
#> 11 s4 s2 s6
#> 12 s7 s2 s6
#> 13 s1 s5 s6
#> 14 s4 s5 s6
#> 15 s7 s5 s6
#> 16 s1 s8 s6
#> 17 s4 s8 s6
#> 18 s7 s8 s6
#> 19 s1 s2 s9
#> 20 s4 s2 s9
#> 21 s7 s2 s9
#> 22 s1 s5 s9
#> 23 s4 s5 s9
#> 24 s7 s5 s9
#> 25 s1 s8 s9
#> 26 s4 s8 s9
#> 27 s7 s8 s9

Answer 2

您可以尝试 interaction 而不是 split，如下所示

> levels(interaction(with(mydata, split(specimens,species))))
 [1] "s1.s2.s3" "s4.s2.s3" "s7.s2.s3" "s1.s5.s3" "s4.s5.s3" "s7.s5.s3"
 [7] "s1.s8.s3" "s4.s8.s3" "s7.s8.s3" "s1.s2.s6" "s4.s2.s6" "s7.s2.s6"
[13] "s1.s5.s6" "s4.s5.s6" "s7.s5.s6" "s1.s8.s6" "s4.s8.s6" "s7.s8.s6"
[19] "s1.s2.s9" "s4.s2.s9" "s7.s2.s9" "s1.s5.s9" "s4.s5.s9" "s7.s5.s9"
[25] "s1.s8.s9" "s4.s8.s9" "s7.s8.s9"

显示来自不同 species

的组件 specimens 的所有组合

R 中有限制的组合数

Number of combinations with restrictions in R

combinations

r

sample

unique