在 R 中寻找疾病状况的趋势
Finding the trend in disease conditions in R
我有一个数据集,其中有几个患者,他们的疾病 activity 状态和特定细菌的丰度如下:
**Patient** **DiseaseActivity** **Bacteria**
15 Severe 0.6704
15 Quiescent 0.0350
24 Quiescent 0.0137
24 Quiescent 0.0088
26 Quiescent 0.0023
26 Severe 0.0410
33 Quiescent 0.2031
33 Quiescent 0.0893
37 Quiescent 0.0345
37 Quiescent 0.0031
52 Quiescent 0.0601
52 Severe 0.0200
53 Severe 0.0050
53 Severe 0.2724
69 Severe 0.9369
69 Quiescent 0.0008
2 Severe 0.0421
2 Quiescent 0.0120
12 Severe 0.3109
12 Severe 0.0646
40 Quiescent 0.8048
40 Severe 0.9113
51 Severe 0.1918
51 Severe 0.9538
每位患者在2个不同的时间点获得了两个样本。当我一一绘制时,我可以看到当疾病严重程度从静止状态变为严重状态时,细菌的丰度增加或疾病严重程度从严重状态变为静止状态时,细菌的丰度减少,即使只有 6 名患者符合这种类型类别。
我的问题是,我如何才能检查至少这 6 名患者是否确实如此,或者我需要对此类数据集进行何种类型的测试?如果我想绘制这些数据,绘制数据的最准确方法是什么?
非常感谢您。
我不知道 'most accurate',我无法帮助您使用什么测试,这取决于您的受众和您的数据。但这是一种可能的情节?
change.df <- data.df%>%group_by(Patient)%>%summarize(status.change=paste(DiseaseActivity,collapse=""),bacteria.change=Bacteria[2]-Bacteria[1])
ggplot(change.df,aes(x=bacteria.change,y=status.change,color=status.change))+geom_point(size=5)+theme_bw()
这是假设每个患者都有两个时间点,并且它们始终处于 time1:time2 的顺序,这是非常危险的!时间点真的应该记录在自己的专栏中。
我有一个数据集,其中有几个患者,他们的疾病 activity 状态和特定细菌的丰度如下:
**Patient** **DiseaseActivity** **Bacteria**
15 Severe 0.6704
15 Quiescent 0.0350
24 Quiescent 0.0137
24 Quiescent 0.0088
26 Quiescent 0.0023
26 Severe 0.0410
33 Quiescent 0.2031
33 Quiescent 0.0893
37 Quiescent 0.0345
37 Quiescent 0.0031
52 Quiescent 0.0601
52 Severe 0.0200
53 Severe 0.0050
53 Severe 0.2724
69 Severe 0.9369
69 Quiescent 0.0008
2 Severe 0.0421
2 Quiescent 0.0120
12 Severe 0.3109
12 Severe 0.0646
40 Quiescent 0.8048
40 Severe 0.9113
51 Severe 0.1918
51 Severe 0.9538
每位患者在2个不同的时间点获得了两个样本。当我一一绘制时,我可以看到当疾病严重程度从静止状态变为严重状态时,细菌的丰度增加或疾病严重程度从严重状态变为静止状态时,细菌的丰度减少,即使只有 6 名患者符合这种类型类别。
我的问题是,我如何才能检查至少这 6 名患者是否确实如此,或者我需要对此类数据集进行何种类型的测试?如果我想绘制这些数据,绘制数据的最准确方法是什么?
非常感谢您。
我不知道 'most accurate',我无法帮助您使用什么测试,这取决于您的受众和您的数据。但这是一种可能的情节?
change.df <- data.df%>%group_by(Patient)%>%summarize(status.change=paste(DiseaseActivity,collapse=""),bacteria.change=Bacteria[2]-Bacteria[1])
ggplot(change.df,aes(x=bacteria.change,y=status.change,color=status.change))+geom_point(size=5)+theme_bw()
这是假设每个患者都有两个时间点,并且它们始终处于 time1:time2 的顺序,这是非常危险的!时间点真的应该记录在自己的专栏中。