Scipy - 两组间的统计检验
Scipy - statistical tests between two groups
我有两个来自大脑神经元群体的样本,每个样本由一千个神经元实例组成,类别:
- 小脑
- 皮质
现在我正在使用复杂的网络分析为每个样本提取多个指标,例如,神经元连接度 k
,一个离散数 n = 0、1、....、n 或聚类系数 C
,一个介于 0.00000 和 1.00000 之间的连续值。
df.sample(3)
(其中 web 是类别)在我的 pandas 数据框中:
皮质:
web k clustering_coeff
3080 cortex 6.0 0.733333
2951 cortex 11.0 0.428571
1435 cortex 5.0 0.563571
...
小脑
815 cerebellum 10.0 0.533333
850 cerebellum 9.0 0.416667
1213 cerebellum 7.0 0.454545
...
我如何使用 scipy
stats
方法来比较两个指标,以便了解两个组之间是否存在统计显着差异?
假设分布接近高斯分布,但偏向右侧,我不确定什么是最佳方法。参数化、非参数化、T检验等。
有什么想法吗?
对于“k”指标:
stats.mannwhitneyu(df.loc[df.web=="cortex", "k"], df.loc[df.web=="cerebellum", "k"])
对于“clustering_coeff”指标:
stats.mannwhitneyu(df.loc[df.web=="cortex", "clustering_coeff"], df.loc[df.web=="cerebellum", "clustering_coeff"])
如果您对考试中的分布一无所知,通常使用 non-parametric 测试。
我有两个来自大脑神经元群体的样本,每个样本由一千个神经元实例组成,类别:
- 小脑
- 皮质
现在我正在使用复杂的网络分析为每个样本提取多个指标,例如,神经元连接度 k
,一个离散数 n = 0、1、....、n 或聚类系数 C
,一个介于 0.00000 和 1.00000 之间的连续值。
df.sample(3)
(其中 web 是类别)在我的 pandas 数据框中:
皮质:
web k clustering_coeff
3080 cortex 6.0 0.733333
2951 cortex 11.0 0.428571
1435 cortex 5.0 0.563571
...
小脑
815 cerebellum 10.0 0.533333
850 cerebellum 9.0 0.416667
1213 cerebellum 7.0 0.454545
...
我如何使用 scipy
stats
方法来比较两个指标,以便了解两个组之间是否存在统计显着差异?
假设分布接近高斯分布,但偏向右侧,我不确定什么是最佳方法。参数化、非参数化、T检验等。
有什么想法吗?
对于“k”指标:
stats.mannwhitneyu(df.loc[df.web=="cortex", "k"], df.loc[df.web=="cerebellum", "k"])
对于“clustering_coeff”指标:
stats.mannwhitneyu(df.loc[df.web=="cortex", "clustering_coeff"], df.loc[df.web=="cerebellum", "clustering_coeff"])
如果您对考试中的分布一无所知,通常使用 non-parametric 测试。