如何使用泊松分布计算列的预期值,然后与实际值进行比较?

How to calculate expected values for a column using Poisson distribution & then compare with actual values?

我有一个包含不同游戏结果的数据框。我需要用泊松分布计算预期结果(多少场比赛得分相同),然后将实际结果与预期结果进行比较 results.So,假设我有 2 场比赛结果为 2,4 场比赛结果为 result = 9 等等。我需要根据导致特定结果的游戏数量与实际值相对应的预期结果。

我计算了我阅读的结果列的平均值,也称为期望值。绘制了实际结果的直方图。

import pandas as pd
import numpy as np

# Game Results DataFrame
game_results = pd.DataFrame({"game_id":[56,57,58,59,60],"result":[0,9,4,6,8]})
print(game_results)

# Histogram for result column

result = game_results["result"]

plt.hist(result)
plt.xlabel("Result")
plt.ylabel("Number of Games")
plt.title("Result Histogram")

lamb = result.mean()

您可以使用 np.random.poisson 与您的 mean 和观察数量绘制随机泊松分布,即 len(game_results):

import numpy as np

game_results = pd.DataFrame({"game_id":[56,57,58,59,60],"result":[0,9,4,6,8]})
# Get the lambda
lamb = result.mean()
# Draw a random poisson distribution using the lambda
game_results["expected"] = np.random.poisson(lamb, len(game_results))