pymc3:为什么一切都在日志方面?

pymc3: Why is everything in terms of log?

我正在努力研究 pymc3,它似乎是一个漂亮的包。我不明白的一件事是为什么所有的概率都是对数的? Beta 分布的描述说它是 "Beta log-likelihood"。评估分布的函数是 "logp" 和 "logcdf"。我也在其他地方看到过对 logp 的引用,但没有看到任何迹象表明我们为什么要获取日志。恐怕我可能会遗漏一些基本的东西。感谢您提供任何信息。

我想我指出了概率和对数之间的另一个很好的联系,而不是重复和不公正地对待 Mathematics and Cross Validated 上的优秀帖子中所说的内容。

principle of maximum entropy 可以追溯到 1957 年物理学家(和统计学家)E. T. Jaynes 发表的一篇文章;它可用于构建最一般的(即信息最少的)概率分布,给定一组约束,最大化(信息)熵。

例如,假设我们对概率分布的唯一了解是它具有特定的均值 μ 和方差 σ²。遵循最大熵原则we can show that the least informative probability distribution corresponds to that of a general normal probability density,均值为μ,方差为σ²。

那么对数如何在这一切中发挥作用呢?在最大化熵的过程中,我们(很早就)得到了一个涉及概率分布对数的方程

其中 λ 是常数(它们是拉格朗日乘数),可以根据上述约束集确定。