Scipy - 两组间的统计检验

Scipy - statistical tests between two groups

我有两个来自大脑神经元群体的样本,每个样本由一千个神经元实例组成,类别:

  1. 小脑
  2. 皮质

现在我正在使用复杂的网络分析为每个样本提取多个指标,例如,神经元连接度 k,一个离散数 n = 0、1、....、n 或聚类系数 C,一个介于 0.00000 和 1.00000 之间的连续值。

df.sample(3)(其中 web 是类别)在我的 pandas 数据框中:

皮质:

         web    k   clustering_coeff
3080    cortex  6.0         0.733333        
2951    cortex  11.0        0.428571    
1435    cortex  5.0         0.563571    

...

小脑

815 cerebellum  10.0        0.533333    
850 cerebellum  9.0         0.416667    
1213 cerebellum 7.0         0.454545
...

我如何使用 scipy stats 方法来比较两个指标,以便了解两个组之间是否存在统计显着差异?

假设分布接近高斯分布,但偏向右侧,我不确定什么是最佳方法。参数化、非参数化、T检验等。

有什么想法吗?

对于“k”指标:

stats.mannwhitneyu(df.loc[df.web=="cortex", "k"], df.loc[df.web=="cerebellum", "k"])

对于“clustering_coeff”指标:

stats.mannwhitneyu(df.loc[df.web=="cortex", "clustering_coeff"], df.loc[df.web=="cerebellum", "clustering_coeff"])

如果您对考试中的分布一无所知,通常使用 non-parametric 测试。