MySQL5:如何找到上班时间的客流高峰
MySQL 5: How to find the peak of customers during working time
我在 MySQL 中有 table 客户花费的时间,我需要找到最忙的 30 分钟。
CREATE TABLE Customer
(id int NOT NULL AUTO_INCREMENT PRIMARY KEY,
customerId int NOT NULL,
arrival datetime,
leaving datetime);
INSERT INTO Customer
(customerId, arrival, leaving)
VALUES
(1, '2018-01-01 10:00:00', '2018-01-01 12:00:00'),
(2, '2018-01-01 11:00:00', '2018-01-01 12:00:00'),
(3, '2018-01-01 11:30:00', '2018-01-01 12:30:00'),
(4, '2018-01-01 13:30:00', '2018-01-01 14:30:00')
;
预期结果类似于包含时间和客户数量的多行:
10:00 10:30 1
10:30 11:00 1
11:00 11:30 2
11:30 12:00 3
12:00 12:30 1
我可以轻松地进行 5 个 sql 查询并获得结果(我在类似问题 中做了一些看法),但我不知道如何通过 1 个查询获得结果。
请问如何在MySQL中创建子区间?谢谢
这是一个基于 union all
和 window 函数(在 SQL 8.0 中可用)的解决方案,可以让您非常接近:
select
dt start_dt,
lead(dt) over(order by dt) end_dt,
sum(sum(cnt)) over(order by dt) cnt
from (
select arrival dt, 1 cnt from Customer
union all
select leaving, -1 from Customer
) t
group by dt
order by dt
逻辑是在每次到达时递增全局计数器并在每次离开时递减。然后,您可以聚合并进行 window 求和。
与您的预期结果唯一不同的是,此查询不会生成固定的间隔列表,而是生成客户数量恒定的间隔列表,如您在 中所见this demo:
start_dt | end_dt | cnt
:------------------ | :------------------ | --:
2018-01-01 10:00:00 | 2018-01-01 11:00:00 | 1
2018-01-01 11:00:00 | 2018-01-01 11:30:00 | 2
2018-01-01 11:30:00 | 2018-01-01 12:00:00 | 3
2018-01-01 12:00:00 | 2018-01-02 12:30:00 | 1
2018-01-02 12:30:00 | | 0
感谢 GMB 的 post,我也找到了 SQL 5 的解决方案
部分观点:
CREATE OR REPLACE VIEW changeTimeView AS
select arrival AS changeTime, 1 cnt from Customer
union all
select leaving, -1 from Customer
ORDER BY changeTime
创建视图后:
SELECT DISTINCT chT2.changeTime, (SELECT SUM(chT1.cnt) FROM changeTimeView chT1 WHERE TIMEDIFF(chT1.changeTime,chT2.changeTime)<=0) FROM changeTimeView chT2
结果:
2018-01-01 10:00:00 1
2018-01-01 11:00:00 2
2018-01-01 11:30:00 3
2018-01-01 12:00:00 1
2018-01-01 12:30:00 0
2018-01-01 13:30:00 1
2018-01-01 14:30:00 0
我在 MySQL 中有 table 客户花费的时间,我需要找到最忙的 30 分钟。
CREATE TABLE Customer
(id int NOT NULL AUTO_INCREMENT PRIMARY KEY,
customerId int NOT NULL,
arrival datetime,
leaving datetime);
INSERT INTO Customer
(customerId, arrival, leaving)
VALUES
(1, '2018-01-01 10:00:00', '2018-01-01 12:00:00'),
(2, '2018-01-01 11:00:00', '2018-01-01 12:00:00'),
(3, '2018-01-01 11:30:00', '2018-01-01 12:30:00'),
(4, '2018-01-01 13:30:00', '2018-01-01 14:30:00')
;
预期结果类似于包含时间和客户数量的多行:
10:00 10:30 1
10:30 11:00 1
11:00 11:30 2
11:30 12:00 3
12:00 12:30 1
我可以轻松地进行 5 个 sql 查询并获得结果(我在类似问题
请问如何在MySQL中创建子区间?谢谢
这是一个基于 union all
和 window 函数(在 SQL 8.0 中可用)的解决方案,可以让您非常接近:
select
dt start_dt,
lead(dt) over(order by dt) end_dt,
sum(sum(cnt)) over(order by dt) cnt
from (
select arrival dt, 1 cnt from Customer
union all
select leaving, -1 from Customer
) t
group by dt
order by dt
逻辑是在每次到达时递增全局计数器并在每次离开时递减。然后,您可以聚合并进行 window 求和。
与您的预期结果唯一不同的是,此查询不会生成固定的间隔列表,而是生成客户数量恒定的间隔列表,如您在 中所见this demo:
start_dt | end_dt | cnt
:------------------ | :------------------ | --:
2018-01-01 10:00:00 | 2018-01-01 11:00:00 | 1
2018-01-01 11:00:00 | 2018-01-01 11:30:00 | 2
2018-01-01 11:30:00 | 2018-01-01 12:00:00 | 3
2018-01-01 12:00:00 | 2018-01-02 12:30:00 | 1
2018-01-02 12:30:00 | | 0
感谢 GMB 的 post,我也找到了 SQL 5 的解决方案 部分观点:
CREATE OR REPLACE VIEW changeTimeView AS
select arrival AS changeTime, 1 cnt from Customer
union all
select leaving, -1 from Customer
ORDER BY changeTime
创建视图后:
SELECT DISTINCT chT2.changeTime, (SELECT SUM(chT1.cnt) FROM changeTimeView chT1 WHERE TIMEDIFF(chT1.changeTime,chT2.changeTime)<=0) FROM changeTimeView chT2
结果:
2018-01-01 10:00:00 1
2018-01-01 11:00:00 2
2018-01-01 11:30:00 3
2018-01-01 12:00:00 1
2018-01-01 12:30:00 0
2018-01-01 13:30:00 1
2018-01-01 14:30:00 0