在MariaDB中,如何select每天最后一个事件并为其创建索引?

In MariaDB, how to select the last event in every day and create indexes for it?

我有一个 table 的会议,每个会议都有一个开始和结束时间,用整数 Unix 时间戳表示,还有一群人正在参加这个会议。我需要在当天的所有会议结束后向每组人员发送通知。为此,我需要为(日、组)的每个组合找到最后一次会议。我已经根据我的情况调整了 this answer,并且有效:

SELECT MAX(`starts_at`), `id`, `group_id`, DATE(FROM_UNIXTIME(`starts_at`)) `day`
FROM `meeting`
GROUP BY `day`, `group_id`;

然而,尽管尝试了不同的索引组合,但我似乎找不到可以使该查询不执行 full-table 扫描的组合。 EXPLAIN 结果总是如下:

+------+-------------+---------+------+---------------+------+---------+------+------+---------------------------------+
| id   | select_type | table   | type | possible_keys | key  | key_len | ref  | rows | Extra                           |
+------+-------------+---------+------+---------------+------+---------+------+------+---------------------------------+
|    1 | SIMPLE      | meeting | ALL  | NULL          | NULL | NULL    | NULL |   16 | Using temporary; Using filesort |
+------+-------------+---------+------+---------------+------+---------+------+------+---------------------------------+

我的table是这样定义的:

CREATE TABLE `meeting` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `group_id` int(11) NOT NULL,
  `starts_at` int(11) NOT NULL,
  `ends_at` int(11) NOT NULL,
  ... other fields ..., 
  PRIMARY KEY (`id`),
  CONSTRAINT `meeting_ibfk_1` FOREIGN KEY (`group_id`) REFERENCES `group` (`id`),
)

我在这里需要什么索引组合和什么查询?我看到的解决方案之一是创建一个索引列来存储事件的日期,也许作为某种序数,虽然这是一个选项,但我希望尽可能避免它,以便在单个中没有冗余值行。

如果您是 运行ning MySQL 8.0.13 或更高版本,您可以尝试对表达式建立索引:

create index idx_meeting on meeting(
    group_id, 
    (date(from_unixtime(starts_at))), 
    starts_at desc
);

这首先放置出现在 group by 子句中的列/表达式,然后是聚合的列;因为我们要查找 max(),所以我们希望在索引中按降序对该列进行排序。

this DB Fiddle中,索引似乎是由数据库获取的(但请注意,我没有数据可玩-结果可能会有所不同在您的环境中:

id select_type table partitions type possible_keys key key_len ref rows filtered Extra
1 SIMPLE meeting null index idx_meeting idx_meeting 12 null 1 100.00 Using index; Using temporary

另一种选择是稍微简化查询。我们可以算术而不是时间戳转换。如果您的版本不支持表达式的索引,我们可以很容易地在上面放置一个索引 - 或者使用计算列:

alter table meeting 
    add starts_date date as (floor(starts_at / 60 / 60 / 24))
    stored;

create index idx_meeting2 on meeting(group_id, starts_date, starts_at desc);

那我们运行查询如下:

SELECT MAX(starts_at), group_id, DATE(MAX(starts_at)) day
FROM meeting
GROUP BY group_id, starts_day;

Explain in Maria DB 10.3:

id select_type table type possible_keys key key_len ref rows Extra
1 SIMPLE meeting index null idx_meeting2 12 null 1 Using index

编辑:您想要每组和每天的最新事件。聚合是不合适的。相反,我们需要过滤。

考虑以下设置:

alter table meeting 
    add starts_day int(11) as (floor(starts_at / 60 / 60 / 24) * 60 * 60 * 24)
    stored;
create index idx_meeting on meeting(group_id, starts_day, starts_at desc);

现在我们可以使用以下查询:

select starts_at, group_id, date(from_unixtime(starts_day)) day
from meeting m
where starts_at = (
    select max(m1.starts_at)
    from meeting m1
    where m1.group_id = m.group_id and m1.starts_day = m.starts_day
)

子查询利用索引,该索引也可能部分用于外部查询。

Demo on DB Fiddle