Python & Stats:适合混合分布?

Python & Stats: fitting to mixed distribution?

有时,数据不是来自单个分布,而是来自多个分布。

例如,y = 0.4*X + 0.6*Yy 有 40% 的机会来自分布 X,而 60% 的机会来自分布 Y。可以在这里找到介绍:http://www.r-bloggers.com/a-brief-introduction-to-mixture-distributions/.

问题是,给定数据集,有没有什么好的方法可以让它们适应 python

我找到了关于 R 的教程:http://www.r-bloggers.com/fitting-mixture-distributions-with-the-r-package-mixtools/,但没有找到关于 python 的任何内容。

如果您的分布是高斯分布,那么 scikit-learn 有一些适合混合分布的好方法,即所谓的高斯混合模型。 有很好的解释here。 他们也使用期望最大化,就像你link.

中提到的R包一样