在 R 中寻找疾病状况的趋势

Finding the trend in disease conditions in R

我有一个数据集,其中有几个患者,他们的疾病 activity 状态和特定细菌的丰度如下:

**Patient** **DiseaseActivity** **Bacteria**
15  Severe  0.6704
15  Quiescent   0.0350
24  Quiescent   0.0137
24  Quiescent   0.0088
26  Quiescent   0.0023
26  Severe  0.0410
33  Quiescent   0.2031
33  Quiescent   0.0893
37  Quiescent   0.0345
37  Quiescent   0.0031
52  Quiescent   0.0601
52  Severe  0.0200
53  Severe  0.0050
53  Severe  0.2724
69  Severe  0.9369
69  Quiescent   0.0008
2   Severe  0.0421
2   Quiescent   0.0120
12  Severe  0.3109
12  Severe  0.0646
40  Quiescent   0.8048
40  Severe  0.9113
51  Severe  0.1918
51  Severe  0.9538

每位患者在2个不同的时间点获得了两个样本。当我一一绘制时,我可以看到当疾病严重程度从静止状态变为严重状态时,细菌的丰度增加或疾病严重程度从严重状态变为静止状态时,细菌的丰度减少,即使只有 6 名患者符合这种类型类别。

我的问题是,我如何才能检查至少这 6 名患者是否确实如此,或者我需要对此类数据集进行何种类型的测试?如果我想绘制这些数据,绘制数据的最准确方法是什么?

非常感谢您。

我不知道 'most accurate',我无法帮助您使用什么测试,这取决于您的受众和您的数据。但这是一种可能的情节?

change.df <- data.df%>%group_by(Patient)%>%summarize(status.change=paste(DiseaseActivity,collapse=""),bacteria.change=Bacteria[2]-Bacteria[1])
ggplot(change.df,aes(x=bacteria.change,y=status.change,color=status.change))+geom_point(size=5)+theme_bw()

这是假设每个患者都有两个时间点,并且它们始终处于 time1:time2 的顺序,这是非常危险的!时间点真的应该记录在自己的专栏中。