在MariaDB中,如何select每天最后一个事件并为其创建索引?
In MariaDB, how to select the last event in every day and create indexes for it?
我有一个 table 的会议,每个会议都有一个开始和结束时间,用整数 Unix 时间戳表示,还有一群人正在参加这个会议。我需要在当天的所有会议结束后向每组人员发送通知。为此,我需要为(日、组)的每个组合找到最后一次会议。我已经根据我的情况调整了 this answer,并且有效:
SELECT MAX(`starts_at`), `id`, `group_id`, DATE(FROM_UNIXTIME(`starts_at`)) `day`
FROM `meeting`
GROUP BY `day`, `group_id`;
然而,尽管尝试了不同的索引组合,但我似乎找不到可以使该查询不执行 full-table 扫描的组合。 EXPLAIN
结果总是如下:
+------+-------------+---------+------+---------------+------+---------+------+------+---------------------------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+------+-------------+---------+------+---------------+------+---------+------+------+---------------------------------+
| 1 | SIMPLE | meeting | ALL | NULL | NULL | NULL | NULL | 16 | Using temporary; Using filesort |
+------+-------------+---------+------+---------------+------+---------+------+------+---------------------------------+
我的table是这样定义的:
CREATE TABLE `meeting` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`group_id` int(11) NOT NULL,
`starts_at` int(11) NOT NULL,
`ends_at` int(11) NOT NULL,
... other fields ...,
PRIMARY KEY (`id`),
CONSTRAINT `meeting_ibfk_1` FOREIGN KEY (`group_id`) REFERENCES `group` (`id`),
)
我在这里需要什么索引组合和什么查询?我看到的解决方案之一是创建一个索引列来存储事件的日期,也许作为某种序数,虽然这是一个选项,但我希望尽可能避免它,以便在单个中没有冗余值行。
如果您是 运行ning MySQL 8.0.13 或更高版本,您可以尝试对表达式建立索引:
create index idx_meeting on meeting(
group_id,
(date(from_unixtime(starts_at))),
starts_at desc
);
这首先放置出现在 group by
子句中的列/表达式,然后是聚合的列;因为我们要查找 max()
,所以我们希望在索引中按降序对该列进行排序。
在this DB Fiddle中,索引似乎是由数据库获取的(但请注意,我没有数据可玩-结果可能会有所不同在您的环境中:
id
select_type
table
partitions
type
possible_keys
key
key_len
ref
rows
filtered
Extra
1
SIMPLE
meeting
null
index
idx_meeting
idx_meeting
12
null
1
100.00
Using index; Using temporary
另一种选择是稍微简化查询。我们可以算术而不是时间戳转换。如果您的版本不支持表达式的索引,我们可以很容易地在上面放置一个索引 - 或者使用计算列:
alter table meeting
add starts_date date as (floor(starts_at / 60 / 60 / 24))
stored;
create index idx_meeting2 on meeting(group_id, starts_date, starts_at desc);
那我们运行查询如下:
SELECT MAX(starts_at), group_id, DATE(MAX(starts_at)) day
FROM meeting
GROUP BY group_id, starts_day;
id
select_type
table
type
possible_keys
key
key_len
ref
rows
Extra
1
SIMPLE
meeting
index
null
idx_meeting2
12 null
1
Using index
编辑:您想要每组和每天的最新事件。聚合是不合适的。相反,我们需要过滤。
考虑以下设置:
alter table meeting
add starts_day int(11) as (floor(starts_at / 60 / 60 / 24) * 60 * 60 * 24)
stored;
create index idx_meeting on meeting(group_id, starts_day, starts_at desc);
现在我们可以使用以下查询:
select starts_at, group_id, date(from_unixtime(starts_day)) day
from meeting m
where starts_at = (
select max(m1.starts_at)
from meeting m1
where m1.group_id = m.group_id and m1.starts_day = m.starts_day
)
子查询利用索引,该索引也可能部分用于外部查询。
我有一个 table 的会议,每个会议都有一个开始和结束时间,用整数 Unix 时间戳表示,还有一群人正在参加这个会议。我需要在当天的所有会议结束后向每组人员发送通知。为此,我需要为(日、组)的每个组合找到最后一次会议。我已经根据我的情况调整了 this answer,并且有效:
SELECT MAX(`starts_at`), `id`, `group_id`, DATE(FROM_UNIXTIME(`starts_at`)) `day`
FROM `meeting`
GROUP BY `day`, `group_id`;
然而,尽管尝试了不同的索引组合,但我似乎找不到可以使该查询不执行 full-table 扫描的组合。 EXPLAIN
结果总是如下:
+------+-------------+---------+------+---------------+------+---------+------+------+---------------------------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+------+-------------+---------+------+---------------+------+---------+------+------+---------------------------------+
| 1 | SIMPLE | meeting | ALL | NULL | NULL | NULL | NULL | 16 | Using temporary; Using filesort |
+------+-------------+---------+------+---------------+------+---------+------+------+---------------------------------+
我的table是这样定义的:
CREATE TABLE `meeting` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`group_id` int(11) NOT NULL,
`starts_at` int(11) NOT NULL,
`ends_at` int(11) NOT NULL,
... other fields ...,
PRIMARY KEY (`id`),
CONSTRAINT `meeting_ibfk_1` FOREIGN KEY (`group_id`) REFERENCES `group` (`id`),
)
我在这里需要什么索引组合和什么查询?我看到的解决方案之一是创建一个索引列来存储事件的日期,也许作为某种序数,虽然这是一个选项,但我希望尽可能避免它,以便在单个中没有冗余值行。
如果您是 运行ning MySQL 8.0.13 或更高版本,您可以尝试对表达式建立索引:
create index idx_meeting on meeting(
group_id,
(date(from_unixtime(starts_at))),
starts_at desc
);
这首先放置出现在 group by
子句中的列/表达式,然后是聚合的列;因为我们要查找 max()
,所以我们希望在索引中按降序对该列进行排序。
在this DB Fiddle中,索引似乎是由数据库获取的(但请注意,我没有数据可玩-结果可能会有所不同在您的环境中:
id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
---|---|---|---|---|---|---|---|---|---|---|---|
1 | SIMPLE | meeting | null | index | idx_meeting | idx_meeting | 12 | null | 1 | 100.00 | Using index; Using temporary |
另一种选择是稍微简化查询。我们可以算术而不是时间戳转换。如果您的版本不支持表达式的索引,我们可以很容易地在上面放置一个索引 - 或者使用计算列:
alter table meeting
add starts_date date as (floor(starts_at / 60 / 60 / 24))
stored;
create index idx_meeting2 on meeting(group_id, starts_date, starts_at desc);
那我们运行查询如下:
SELECT MAX(starts_at), group_id, DATE(MAX(starts_at)) day
FROM meeting
GROUP BY group_id, starts_day;
id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
---|---|---|---|---|---|---|---|---|---|
1 | SIMPLE | meeting | index | null | idx_meeting2 | 12 null | 1 | Using index |
编辑:您想要每组和每天的最新事件。聚合是不合适的。相反,我们需要过滤。
考虑以下设置:
alter table meeting
add starts_day int(11) as (floor(starts_at / 60 / 60 / 24) * 60 * 60 * 24)
stored;
create index idx_meeting on meeting(group_id, starts_day, starts_at desc);
现在我们可以使用以下查询:
select starts_at, group_id, date(from_unixtime(starts_day)) day
from meeting m
where starts_at = (
select max(m1.starts_at)
from meeting m1
where m1.group_id = m.group_id and m1.starts_day = m.starts_day
)
子查询利用索引,该索引也可能部分用于外部查询。