如何使用 R 中的泊松分布计算每小时到达率?

How to calculate arrival rate per hour using poisson distribution in R?

我有一个包含 66K 行和 4 列的数据框,即客户 ID、客户登记时间、客户登记时间和客户结帐时间。

First 6 rows of the data:
cust_ID  cust_checkin_time      cust_checkout_time        checkin hour
12345    2019-01-01 07:02:50    2019-01-01 07:23:22        07AM_08AM
65789    2019-01-01 07:22:15    2019-01-01 07:26:02        07AM_08AM
90876    2019-01-01 07:25:21    2019-01-01 07:35:27        07AM_08AM
34567    2019-01-01 07:27:22    2019-01-01 07:38:56        07AM_08AM
36754    2019-01-01 07:44:41    2019-01-01 07:55:20        07AM_08AM
59876    2019-01-01 07:45:10    2019-01-01 07:58:42        07AM_08AM

我想知道每小时到达率以使用泊松分布预测等待时间。

我无法计算 lambda,即每个 hour.How 的到达率,无法使用泊松分布或任何其他方法计算。

请帮助我 this.I 我花了将近一个星期的时间搜索 google 但我没有得到任何满意的答案。

首先:这不完全是 Stack Overflow 问题。

  • 假设您的客户在早上 7 点到晚上 7 点之间到达,即 12 小时。
  • 每小时统计客户数:
check-in hour   num_customer
 7 am -  8 am      10
 8 am -  9 am       7
10 am - 11 am      11
     ...
 6 pm -  7 pm       6

lambda 的估算值是通过总结您的客户 (10+7+11+...+6) 并将其除以观察次数(入住小时数,即12).


使用dplyr:

data %>%
  count(checkin_hour) %>%
  summarise(lamba=sum(n)/n())

给出你想要的输出。