如何在 R 的生存分析（KM 曲线）中仅包含表达式集（Eset）的特定情况？

Question

我有一个关于 KM 分析的问题。我有这样的表达式集 第一个 10 cases:

eset()

ExpressionSet (storageMode: lockedEnvironment)
assayData: 6 features, 6 samples 
  element names: exprs 
protocolData: none
phenoData
  sampleNames: 1 2 ... 6 (6 total)
  varLabels: age_at_diagnosis last_follow_up_status ... lymph_nodes_removed (9 total)
  varMetadata: labelDescription
featureData: none
experimentData: use 'experimentData(object)'
Annotation:

这是我对eset的表达：

        1        2        3        4        5        6
a 8.676978 9.653589 9.033589 8.814855 8.736406 9.274265
b 5.298711 5.378801 5.606122 5.316155 5.303613 5.449802
c 5.430877 5.199253 5.449121 5.309371 5.438538 5.347851
d 6.075331 6.687887 5.910885 5.628740 6.392422 5.908698
e 5.595625 6.010127 5.683969 5.479983 6.013500 5.939949
f 5.453928 5.454185 5.501577 5.471941 5.525027 5.531743

这里是 pData：

    age Status  MEN group grade size stage LNP LNR     time  mn doc
1 52.79      d post     4     2   18     2   1  12 3.865753 pos   0
2 32.61      d  pre     3     3   16     2   5  23 1.679452 neg   1
3 66.83      a post     4     3   15     3   8  17 5.616438 pos   0
4 71.21      a post     4     3   21     2   1  12 1.169863 pos   1
5 76.84 d-d.s. post     4     3   50     2   3  24 3.602740 pos   1
6 60.77      a post     4     2   23     2   0   2 1.367123 pos   0

我知道如何为整个数据集生成 KM 曲线，这是我的代码；我只给你前 10 个案例的数据，因为它是堆栈网站中 space 的限制：

library(survival)

c <- Surv(as.numeric(ab$time), ab$doc)

plot(survfit( c ~ as.factor(ab$mn)))

所以，我的问题是如何修改此代码以仅适用于 ab$mn == 'neg'

的情况

提前致谢，

Answer 1

我会听从 Terry Therneau 关于如何使用 Surv 函数的建议，而不是在 coxph 函数之外构建 Surv-objects。这也将允许您使用 subset 参数，这是 coxph:

的一个方便的特性

plot(survfit( Surv(as.numeric(time), doc) ~ as.factor(mn), data=ab, subset = mn == 'neg' ))

如何在 R 的生存分析（KM 曲线）中仅包含表达式集（Eset）的特定情况？

How to only include specific cases of the expressionset (Eset) in our survival analysis (KM curves) in R?

expression

r

bioconductor

survival-analysis