如何使用泊松分布计算列的预期值,然后与实际值进行比较?
How to calculate expected values for a column using Poisson distribution & then compare with actual values?
我有一个包含不同游戏结果的数据框。我需要用泊松分布计算预期结果(多少场比赛得分相同),然后将实际结果与预期结果进行比较 results.So,假设我有 2 场比赛结果为 2,4 场比赛结果为 result = 9 等等。我需要根据导致特定结果的游戏数量与实际值相对应的预期结果。
我计算了我阅读的结果列的平均值,也称为期望值。绘制了实际结果的直方图。
import pandas as pd
import numpy as np
# Game Results DataFrame
game_results = pd.DataFrame({"game_id":[56,57,58,59,60],"result":[0,9,4,6,8]})
print(game_results)
# Histogram for result column
result = game_results["result"]
plt.hist(result)
plt.xlabel("Result")
plt.ylabel("Number of Games")
plt.title("Result Histogram")
lamb = result.mean()
您可以使用 np.random.poisson
与您的 mean
和观察数量绘制随机泊松分布,即 len(game_results)
:
import numpy as np
game_results = pd.DataFrame({"game_id":[56,57,58,59,60],"result":[0,9,4,6,8]})
# Get the lambda
lamb = result.mean()
# Draw a random poisson distribution using the lambda
game_results["expected"] = np.random.poisson(lamb, len(game_results))
我有一个包含不同游戏结果的数据框。我需要用泊松分布计算预期结果(多少场比赛得分相同),然后将实际结果与预期结果进行比较 results.So,假设我有 2 场比赛结果为 2,4 场比赛结果为 result = 9 等等。我需要根据导致特定结果的游戏数量与实际值相对应的预期结果。
我计算了我阅读的结果列的平均值,也称为期望值。绘制了实际结果的直方图。
import pandas as pd
import numpy as np
# Game Results DataFrame
game_results = pd.DataFrame({"game_id":[56,57,58,59,60],"result":[0,9,4,6,8]})
print(game_results)
# Histogram for result column
result = game_results["result"]
plt.hist(result)
plt.xlabel("Result")
plt.ylabel("Number of Games")
plt.title("Result Histogram")
lamb = result.mean()
您可以使用 np.random.poisson
与您的 mean
和观察数量绘制随机泊松分布,即 len(game_results)
:
import numpy as np
game_results = pd.DataFrame({"game_id":[56,57,58,59,60],"result":[0,9,4,6,8]})
# Get the lambda
lamb = result.mean()
# Draw a random poisson distribution using the lambda
game_results["expected"] = np.random.poisson(lamb, len(game_results))