R中系统发育重建中的混合数据分区

Question

让我们有两个矩阵，一个 DNA 序列比对，一个由二进制字符组成。

dna <- matrix(c("a", "a", "a", "t", "a", "a", 
                "t", "t", "a", "g", "c", "c"), 
              ncol = 4, dimnames = list(LETTERS[1:3], NULL))

bi <- matrix(c(0,0,1,0,1,1,1,0,0,1,0,0), 
             ncol = 4, dimnames = list(LETTERS[1:3], NULL))

我们可以用 phangorn 包重建系统发育关系：

library(phangorn)
dnatr <- optim.pml(pml(tree = rtree(3, tip.label = LETTERS[1:3]), 
                       data = phyDat(dna)), 
                   optNni = TRUE)
bitr <- optim.pml(pml(tree = rtree(3, tip.label = LETTERS[1:3]), 
                      data = phyDat(bi, type= "USER", levels = c(0,1))),
                  optNni = TRUE)

函数 phangorn::pmlPart 应该运行分区分析，但它不会结合分区中的系统发育信息来重建单个系统发育。

tr = pmlPart(~ edge + nni, object = list(dnatr, bitr))

如何设置使用混合数据类型（DNA 序列和二进制字符）的分区分析？

Answer 1

你快完成了，下面的代码应该可以工作：

tr = pmlPart(edge + nni ~ . , object = list(dnatr, bitr))

不幸的是，关于 CRAN 的文档有点过时了。请确保您安装了来自 github (remotes::install_github("KlausVigo/phangorn")) 的 phangorn 的最新开发版本。

PS：对于树的重排，您至少需要 4 个提示，因此您的示例将忽略 nni 项。

R中系统发育重建中的混合数据分区

Mixed data partitions in phylogeny reconstruction in R

r

phylogeny