短语 "a machine learning algorithm learn a probability distribution" 是什么意思？这里到底发生了什么

What does it mean by the phrase "a machine learning algorithm learn a probability distribution"? What exactly is happening here

生成模型和判别模型似乎学习条件 P(x|y) 和联合 P(x,y) 概率分布。但在基础层面上，我无法说服自己学习概率分布意味着什么。

这意味着您的模型要么用作从中提取训练样本的分布的估计器，要么正在利用该估计器执行其他预测。

举一个简单的例子，考虑一组观察结果 {x[1], ..., x[N]}。假设您想在其上训练高斯估计器。从这些样本中，这个高斯估计量的最大似然参数将是数据的均值和方差

Mean = 1/N * (x[1] + ... + x[N])

Variance = 1/(N-1) * ((x[1] - Mean)^2 + ... + (x[N] - Mean)^2)

现在您有了一个模型，该模型能够根据训练样本的分布（估计）生成新样本。

更复杂一点，您可以考虑类似高斯混合模型的东西。这同样会根据您的数据推断出模型的最佳拟合参数。除了这一次，该模型由多个高斯组成。因此，如果给你一些测试数据，你可以根据每个高斯分量对观察点概率密度的相对贡献，将类概率分配给每个样本。这当然是机器学习的基本假设：你的训练和测试数据都来自同一个分布（你应该检查一下）。

短语 "a machine learning algorithm learn a probability distribution" 是什么意思？这里到底发生了什么

What does it mean by the phrase "a machine learning algorithm learn a probability distribution"? What exactly is happening here

statistics

machine-learning

probability-theory

probability-distribution