如何使用 R 中的泊松分布计算每小时到达率?
How to calculate arrival rate per hour using poisson distribution in R?
我有一个包含 66K 行和 4 列的数据框,即客户 ID、客户登记时间、客户登记时间和客户结帐时间。
First 6 rows of the data:
cust_ID cust_checkin_time cust_checkout_time checkin hour
12345 2019-01-01 07:02:50 2019-01-01 07:23:22 07AM_08AM
65789 2019-01-01 07:22:15 2019-01-01 07:26:02 07AM_08AM
90876 2019-01-01 07:25:21 2019-01-01 07:35:27 07AM_08AM
34567 2019-01-01 07:27:22 2019-01-01 07:38:56 07AM_08AM
36754 2019-01-01 07:44:41 2019-01-01 07:55:20 07AM_08AM
59876 2019-01-01 07:45:10 2019-01-01 07:58:42 07AM_08AM
我想知道每小时到达率以使用泊松分布预测等待时间。
我无法计算 lambda,即每个 hour.How 的到达率,无法使用泊松分布或任何其他方法计算。
请帮助我 this.I 我花了将近一个星期的时间搜索 google 但我没有得到任何满意的答案。
首先:这不完全是 Stack Overflow 问题。
- 假设您的客户在早上 7 点到晚上 7 点之间到达,即 12 小时。
- 每小时统计客户数:
check-in hour num_customer
7 am - 8 am 10
8 am - 9 am 7
10 am - 11 am 11
...
6 pm - 7 pm 6
lambda
的估算值是通过总结您的客户 (10+7+11+...+6) 并将其除以观察次数(入住小时数,即12).
使用dplyr
:
data %>%
count(checkin_hour) %>%
summarise(lamba=sum(n)/n())
给出你想要的输出。
我有一个包含 66K 行和 4 列的数据框,即客户 ID、客户登记时间、客户登记时间和客户结帐时间。
First 6 rows of the data:
cust_ID cust_checkin_time cust_checkout_time checkin hour
12345 2019-01-01 07:02:50 2019-01-01 07:23:22 07AM_08AM
65789 2019-01-01 07:22:15 2019-01-01 07:26:02 07AM_08AM
90876 2019-01-01 07:25:21 2019-01-01 07:35:27 07AM_08AM
34567 2019-01-01 07:27:22 2019-01-01 07:38:56 07AM_08AM
36754 2019-01-01 07:44:41 2019-01-01 07:55:20 07AM_08AM
59876 2019-01-01 07:45:10 2019-01-01 07:58:42 07AM_08AM
我想知道每小时到达率以使用泊松分布预测等待时间。
我无法计算 lambda,即每个 hour.How 的到达率,无法使用泊松分布或任何其他方法计算。
请帮助我 this.I 我花了将近一个星期的时间搜索 google 但我没有得到任何满意的答案。
首先:这不完全是 Stack Overflow 问题。
- 假设您的客户在早上 7 点到晚上 7 点之间到达,即 12 小时。
- 每小时统计客户数:
check-in hour num_customer
7 am - 8 am 10
8 am - 9 am 7
10 am - 11 am 11
...
6 pm - 7 pm 6
lambda
的估算值是通过总结您的客户 (10+7+11+...+6) 并将其除以观察次数(入住小时数,即12).
使用dplyr
:
data %>%
count(checkin_hour) %>%
summarise(lamba=sum(n)/n())
给出你想要的输出。