Python & Stats：适合混合分布？

Python & Stats: fitting to mixed distribution?

有时，数据不是来自单个分布，而是来自多个分布。

例如，y = 0.4*X + 0.6*Y、y 有 40% 的机会来自分布 X，而 60% 的机会来自分布 Y。可以在这里找到介绍：http://www.r-bloggers.com/a-brief-introduction-to-mixture-distributions/.

问题是，给定数据集，有没有什么好的方法可以让它们适应 python？

我找到了关于 R 的教程：http://www.r-bloggers.com/fitting-mixture-distributions-with-the-r-package-mixtools/，但没有找到关于 python 的任何内容。

如果您的分布是高斯分布，那么 scikit-learn 有一些适合混合分布的好方法，即所谓的高斯混合模型。有很好的解释here。他们也使用期望最大化，就像你link.

中提到的R包一样