两个矩阵 R 中每对元素的样条回归系数

Spline regression coefficients for every pair elements in two matrices R

我正在研究一种方法来寻找受甲基化调控的基因。该方法包括,在第一步中,计算样本中每个基因的甲基化和表达数据之间的相关系数。我应用了第一个过滤器,并获得了 418 个基因的子集,其相关系数显着(小于 -0,3)。

下一步是找到每个基因中甲基化和表达的 b 样条三次回归系数。我的数据包含在一个包含两个矩阵的列表中,它看起来像这样:

> met.spl[1:5,1:5]
                 AAAS      ABCA7    ABCC12      ABCF1       ACN9
paciente6  0.15013343 0.01489557 0.7987748 0.02826255 0.02169665
paciente7  0.10827520 0.01215497 0.8515188 0.03378193 0.02452192
paciente8  0.12423923 0.01682172 0.4182180 0.03288906 0.02046130
paciente9  0.11779075 0.02198105 0.6101996 0.06389504 0.04574667
paciente10 0.09234602 0.01526621 0.8366319 0.02868425 0.02095470

> exp.spl[1:5,1:5]
              AAAS    ABCA7     ABCC12   ABCF1     ACN9
paciente1 -0.82350 -1.20725  0.6000000 -0.6783  0.64500
paciente2 -1.14075 -0.59575  0.2173333 -0.2644  0.54100
paciente3 -1.43000 -1.72750  1.0015000 -1.1413  0.98625
paciente4 -1.16650 -0.76250  0.4378333 -0.6804 -0.58650
paciente5 -0.51125 -1.10325 -0.1231667 -0.1521  0.02750

为了计算第一个基因的模型系数,我做了以下步骤:

> lm(exp.spl[,1] ~ bs(met.spl[,1]), data = Lshape.spline)$coef
      (Intercept) bs(met.spl[, 1])1 bs(met.spl[, 1])2 bs(met.spl[, 1])3 
      -1.00616163       -0.44292576        0.08767607       -0.61237162 

我的 objective 是生成一个新对象,其中包含 418 个选定基因(在行中)的系数(4 列)。

似乎简单的 sapply 可以在这里工作

library(splines)
sapply(1:ncol(exp.spl), function(i) {
    lm(exp.spl[,i] ~ bs(met.spl[,i]))$coef
})

测试

met.spl<-read.table(text="AAAS      ABCA7    ABCC12      ABCF1       ACN9
paciente6  0.15013343 0.01489557 0.7987748 0.02826255 0.02169665
paciente7  0.10827520 0.01215497 0.8515188 0.03378193 0.02452192
paciente8  0.12423923 0.01682172 0.4182180 0.03288906 0.02046130
paciente9  0.11779075 0.02198105 0.6101996 0.06389504 0.04574667
paciente10 0.09234602 0.01526621 0.8366319 0.02868425 0.02095470", header=T)

exp.spl<-read.table(text="AAAS    ABCA7     ABCC12   ABCF1     ACN9
paciente1 -0.82350 -1.20725  0.6000000 -0.6783  0.64500
paciente2 -1.14075 -0.59575  0.2173333 -0.2644  0.54100
paciente3 -1.43000 -1.72750  1.0015000 -1.1413  0.98625
paciente4 -1.16650 -0.76250  0.4378333 -0.6804 -0.58650
paciente5 -0.51125 -1.10325 -0.1231667 -0.1521  0.02750", header=T)