估计的高斯分布参数是错误的
Estimated Gaussian distribution parameters are wrong
我正在试验高斯分布及其可能性。
为了找出最大似然,我根据 mu(期望)和 sigma(均值)区分似然,相应地等于 data.mean() 和 data.std()
import matplotlib.pyplot as plt
import numpy as np
import matplotlib.mlab as mlab
import math
from scipy.stats import norm
def calculate_likelihood(x, mu, sigma):
n = len(x)
likelihood = n/2.0 * np.log(2 * np.pi) + n/2.0 * math.log(sigma **2 ) + 1/(2*sigma**2) * sum([(x_i - mu)**2 for x_i in x ])
return likelihood
def estimate_gaussian_parameters_from_data(data):
return data.mean(), data.std()
def main():
mu = 0
sigma = 2
x_values = np.linspace(mu - 3*sigma, mu + 3*sigma, 1000)
y_values_1 = mlab.normpdf(x_values, mu, sigma)
estimated_mu, estimated_sigma = estimate_gaussian_parameters_from_data(y_values_1)
if (__name__ == "__main__"):
main()
我预计 estimated_mu 和 estimated_sigma 应该大约等于 mu 和 sigma,但事实并非如此。我得到的不是 0 和 2,而是 0.083 和 0.069。我理解错了吗?
mlab.normpdf是一个pdf它returnsx的概率。由于平均值为 0,您将看到 0 附近的点的概率很高。 y_values_1 是概率密度。
s = np.random.normal(0, 2, 1000)
以上代码采样了 1000 个正态分布的点,均值为 0,标准差为 2
np.mean(s) == 0.018308805079364696 and np.std(s) == 1.9467605916031896
我正在试验高斯分布及其可能性。 为了找出最大似然,我根据 mu(期望)和 sigma(均值)区分似然,相应地等于 data.mean() 和 data.std()
import matplotlib.pyplot as plt
import numpy as np
import matplotlib.mlab as mlab
import math
from scipy.stats import norm
def calculate_likelihood(x, mu, sigma):
n = len(x)
likelihood = n/2.0 * np.log(2 * np.pi) + n/2.0 * math.log(sigma **2 ) + 1/(2*sigma**2) * sum([(x_i - mu)**2 for x_i in x ])
return likelihood
def estimate_gaussian_parameters_from_data(data):
return data.mean(), data.std()
def main():
mu = 0
sigma = 2
x_values = np.linspace(mu - 3*sigma, mu + 3*sigma, 1000)
y_values_1 = mlab.normpdf(x_values, mu, sigma)
estimated_mu, estimated_sigma = estimate_gaussian_parameters_from_data(y_values_1)
if (__name__ == "__main__"):
main()
我预计 estimated_mu 和 estimated_sigma 应该大约等于 mu 和 sigma,但事实并非如此。我得到的不是 0 和 2,而是 0.083 和 0.069。我理解错了吗?
mlab.normpdf是一个pdf它returnsx的概率。由于平均值为 0,您将看到 0 附近的点的概率很高。 y_values_1 是概率密度。
s = np.random.normal(0, 2, 1000)
以上代码采样了 1000 个正态分布的点,均值为 0,标准差为 2
np.mean(s) == 0.018308805079364696 and np.std(s) == 1.9467605916031896