Python & Stats:适合混合分布?
Python & Stats: fitting to mixed distribution?
有时,数据不是来自单个分布,而是来自多个分布。
例如,y = 0.4*X + 0.6*Y
、y
有 40% 的机会来自分布 X
,而 60% 的机会来自分布 Y
。可以在这里找到介绍:http://www.r-bloggers.com/a-brief-introduction-to-mixture-distributions/.
问题是,给定数据集,有没有什么好的方法可以让它们适应 python
?
我找到了关于 R
的教程:http://www.r-bloggers.com/fitting-mixture-distributions-with-the-r-package-mixtools/,但没有找到关于 python
的任何内容。
如果您的分布是高斯分布,那么 scikit-learn 有一些适合混合分布的好方法,即所谓的高斯混合模型。
有很好的解释here。
他们也使用期望最大化,就像你link.
中提到的R包一样
有时,数据不是来自单个分布,而是来自多个分布。
例如,y = 0.4*X + 0.6*Y
、y
有 40% 的机会来自分布 X
,而 60% 的机会来自分布 Y
。可以在这里找到介绍:http://www.r-bloggers.com/a-brief-introduction-to-mixture-distributions/.
问题是,给定数据集,有没有什么好的方法可以让它们适应 python
?
我找到了关于 R
的教程:http://www.r-bloggers.com/fitting-mixture-distributions-with-the-r-package-mixtools/,但没有找到关于 python
的任何内容。
如果您的分布是高斯分布,那么 scikit-learn 有一些适合混合分布的好方法,即所谓的高斯混合模型。 有很好的解释here。 他们也使用期望最大化,就像你link.
中提到的R包一样