我如何 select 来自关系 mysql table 的 max(timestamp) 快速
How do I select the max(timestamp) from a relational mysql table fast
我们正在开发票证系统,我们希望在仪表板中显示票证的最新状态。我们有两个 table。第一个用于工单本身,第二个 table 用于个人编辑。
系统已经 运行,但仪表板的性能非常糟糕(约 1300 张票需要 6 秒)。起初我们使用了一个 statemant,它为每张票 selected 'where timestamp = (select max(Timestamp))'。在第二步中,我们创建了一个视图,其中仅包含每张工单的最新时间戳,但我们无法将正确的状态也包含到该视图中。
所以主要的问题可能是,我们无法构建一个 table,其中每张票都是最新的 ins_date 和 最新的状态为 selected.
简化后的数据库如下所示:
CREATE TABLE `ticket` (
`id` int(10) NOT NULL,
`betreff` varchar(100) NOT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
CREATE TABLE `ticket_relation` (
`id` int(11) NOT NULL,
`ticket` int(10) NOT NULL,
`info` varchar(10000) DEFAULT NULL,
`status` int(1) NOT NULL DEFAULT '0',
`ins_date` timestamp NULL DEFAULT CURRENT_TIMESTAMP,
`ins_user` int(11) DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
INSERT INTO `ticket` (`id`, `betreff`) VALUES
(1, 'Technische Frage'),
(2, 'Ticket 2'),
(3, 'Weitere Fragen');
INSERT INTO `ticket_relation` (`id`, `ticket`, `info`, `status`, `ins_date`, `ins_user`) VALUES
(1, 1, 'Betreff 1', 0, '2019-05-28 11:02:18', 123),
(2, 1, 'Betreff 2', 3, '2019-05-28 12:07:36', 123),
(3, 2, 'Betreff 3', 0, '2019-05-29 06:49:32', 123),
(4, 3, 'Betreff 4', 1, '2019-05-29 07:44:07', 123),
(5, 2, 'Betreff 5', 1, '2019-05-29 07:49:32', 123),
(6, 2, 'Betreff 6', 3, '2019-05-29 08:49:32', 123),
(7, 3, 'Betreff 7', 2, '2019-05-29 09:49:32', 123),
(8, 2, 'Betreff 8', 1, '2019-05-29 10:49:32', 123),
(9, 3, 'Betreff 9', 2, '2019-05-29 11:49:32', 123),
(10, 3, 'Betreff 10', 3, '2019-05-29 12:49:32', 123);
我创建了一个 SQL Fiddle: http://sqlfiddle.com/#!9/a873b6/3
前三个语句是无法正常工作或运行速度太慢的尝试。最后一个是我认为的关键,但我不明白,为什么这个状态错误。
尝试创建具有最新 ins_date 和每个工单状态的 table:
SELECT
ticket, status, MAX(ins_date) as max_date
FROM
ticket_relation
GROUP BY
ticket
ORDER BY
ins_date DESC;
此查询获取每张票的正确(最新)ins_date,但不是最新状态:
+--------+--------+----------------------+
| ticket | status | max_date |
+--------+--------+----------------------+
| 3 | 1 | 2019-05-29T12:49:32Z |
+--------+--------+----------------------+
| 2 | 0 | 2019-05-29T10:49:32Z |
+--------+--------+----------------------+
| 1 | 0 | 2019-05-28T12:07:36Z |
+--------+--------+----------------------+
预期输出是这样的:
+--------+--------+----------------------+
| ticket | status | max_date |
+--------+--------+----------------------+
| 3 | 3 | 2019-05-29T12:49:32Z |
+--------+--------+----------------------+
| 2 | 1 | 2019-05-29T10:49:32Z |
+--------+--------+----------------------+
| 1 | 3 | 2019-05-28T12:07:36Z |
+--------+--------+----------------------+
有没有有效的方法来select tiket-table中每张票的最新时间戳和状态?
您可以尝试以下查询 -
SELECT
ticket, status, ins_date as max_date
FROM ticket_relation a
where ins_date in (select max(ins_date) from ticket_relation b where a.ticket=b.ticket)
一个解决方案是使用子查询来计算每张票的最新插入日期,然后将结果与原始 table 连接起来,例如:
SELECT t.ticket, t.status, t.ins_date
FROM ticket_relation t
INNER JOIN (
SELECT ticket, max(ins_date) max_ins_date
FROM ticket_relation
GROUP BY ticket
) x ON t.ticket = x.ticket AND t.ins_date = x.max_ins_date
为了提高此查询的性能,您需要在 (ticket, ins_date)
上建立索引。
另一个选项是使用 NOT EXISTS
条件来确保只选择最新的记录,例如:
SELECT t.ticket, t.status, t.ins_date
FROM ticket_relation t
WHERE NOT EXISTS (
SELECT 1
FROM ticket_relation t1
WHERE t1.ticket = t.ticket AND t1.ins_date > t.ins_date)
)
注意:在处理 GROUP BY
时,所有非聚合列都必须出现在 GROUP BY
子句中。否则,您将得到错误或 unprectictable 结果(取决于服务器选项 ONLY_FULL_GROUP_BY
是分别启用还是禁用)。
如果您能够升级到 mysql (8.0) 的最新版本,则可以使用 window 函数来简化查询并可能提高其性能,例如:
SELECT ticket, status, ins_date
FROM (
SELECT
ticket,
status,
ins_date,
row_number() over(partition by ticket order by ins_date desc) rn
FROM ticket_relation
) x WHERE rn = 1
其他方法是认为过滤而不是 GROUPing..
查询
SELECT
ticket_relation_1.ticket
, ticket_relation_1.status
, ticket_relation_1.ins_date
FROM
ticket_relation AS ticket_relation_1
LEFT JOIN
ticket_relation AS ticket_relation_2
ON
ticket_relation_1.ticket = ticket_relation_2.ticket
AND
ticket_relation_1.ins_date < ticket_relation_2.ins_date
WHERE
ticket_relation_2.id IS NULL
ORDER BY
ticket_relation_1.id DESC
结果
| ticket | status | ins_date |
| ------ | ------ | ------------------- |
| 3 | 3 | 2019-05-29 12:49:32 |
| 2 | 1 | 2019-05-29 10:49:32 |
| 1 | 3 | 2019-05-28 12:07:36 |
见demo
此查询需要索引 KEY(ticket, ins_date, id)
才能获得最佳性能。
我们正在开发票证系统,我们希望在仪表板中显示票证的最新状态。我们有两个 table。第一个用于工单本身,第二个 table 用于个人编辑。
系统已经 运行,但仪表板的性能非常糟糕(约 1300 张票需要 6 秒)。起初我们使用了一个 statemant,它为每张票 selected 'where timestamp = (select max(Timestamp))'。在第二步中,我们创建了一个视图,其中仅包含每张工单的最新时间戳,但我们无法将正确的状态也包含到该视图中。
所以主要的问题可能是,我们无法构建一个 table,其中每张票都是最新的 ins_date 和 最新的状态为 selected.
简化后的数据库如下所示:
CREATE TABLE `ticket` (
`id` int(10) NOT NULL,
`betreff` varchar(100) NOT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
CREATE TABLE `ticket_relation` (
`id` int(11) NOT NULL,
`ticket` int(10) NOT NULL,
`info` varchar(10000) DEFAULT NULL,
`status` int(1) NOT NULL DEFAULT '0',
`ins_date` timestamp NULL DEFAULT CURRENT_TIMESTAMP,
`ins_user` int(11) DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
INSERT INTO `ticket` (`id`, `betreff`) VALUES
(1, 'Technische Frage'),
(2, 'Ticket 2'),
(3, 'Weitere Fragen');
INSERT INTO `ticket_relation` (`id`, `ticket`, `info`, `status`, `ins_date`, `ins_user`) VALUES
(1, 1, 'Betreff 1', 0, '2019-05-28 11:02:18', 123),
(2, 1, 'Betreff 2', 3, '2019-05-28 12:07:36', 123),
(3, 2, 'Betreff 3', 0, '2019-05-29 06:49:32', 123),
(4, 3, 'Betreff 4', 1, '2019-05-29 07:44:07', 123),
(5, 2, 'Betreff 5', 1, '2019-05-29 07:49:32', 123),
(6, 2, 'Betreff 6', 3, '2019-05-29 08:49:32', 123),
(7, 3, 'Betreff 7', 2, '2019-05-29 09:49:32', 123),
(8, 2, 'Betreff 8', 1, '2019-05-29 10:49:32', 123),
(9, 3, 'Betreff 9', 2, '2019-05-29 11:49:32', 123),
(10, 3, 'Betreff 10', 3, '2019-05-29 12:49:32', 123);
我创建了一个 SQL Fiddle: http://sqlfiddle.com/#!9/a873b6/3 前三个语句是无法正常工作或运行速度太慢的尝试。最后一个是我认为的关键,但我不明白,为什么这个状态错误。
尝试创建具有最新 ins_date 和每个工单状态的 table:
SELECT
ticket, status, MAX(ins_date) as max_date
FROM
ticket_relation
GROUP BY
ticket
ORDER BY
ins_date DESC;
此查询获取每张票的正确(最新)ins_date,但不是最新状态:
+--------+--------+----------------------+
| ticket | status | max_date |
+--------+--------+----------------------+
| 3 | 1 | 2019-05-29T12:49:32Z |
+--------+--------+----------------------+
| 2 | 0 | 2019-05-29T10:49:32Z |
+--------+--------+----------------------+
| 1 | 0 | 2019-05-28T12:07:36Z |
+--------+--------+----------------------+
预期输出是这样的:
+--------+--------+----------------------+
| ticket | status | max_date |
+--------+--------+----------------------+
| 3 | 3 | 2019-05-29T12:49:32Z |
+--------+--------+----------------------+
| 2 | 1 | 2019-05-29T10:49:32Z |
+--------+--------+----------------------+
| 1 | 3 | 2019-05-28T12:07:36Z |
+--------+--------+----------------------+
有没有有效的方法来select tiket-table中每张票的最新时间戳和状态?
您可以尝试以下查询 -
SELECT
ticket, status, ins_date as max_date
FROM ticket_relation a
where ins_date in (select max(ins_date) from ticket_relation b where a.ticket=b.ticket)
一个解决方案是使用子查询来计算每张票的最新插入日期,然后将结果与原始 table 连接起来,例如:
SELECT t.ticket, t.status, t.ins_date
FROM ticket_relation t
INNER JOIN (
SELECT ticket, max(ins_date) max_ins_date
FROM ticket_relation
GROUP BY ticket
) x ON t.ticket = x.ticket AND t.ins_date = x.max_ins_date
为了提高此查询的性能,您需要在 (ticket, ins_date)
上建立索引。
另一个选项是使用 NOT EXISTS
条件来确保只选择最新的记录,例如:
SELECT t.ticket, t.status, t.ins_date
FROM ticket_relation t
WHERE NOT EXISTS (
SELECT 1
FROM ticket_relation t1
WHERE t1.ticket = t.ticket AND t1.ins_date > t.ins_date)
)
注意:在处理 GROUP BY
时,所有非聚合列都必须出现在 GROUP BY
子句中。否则,您将得到错误或 unprectictable 结果(取决于服务器选项 ONLY_FULL_GROUP_BY
是分别启用还是禁用)。
如果您能够升级到 mysql (8.0) 的最新版本,则可以使用 window 函数来简化查询并可能提高其性能,例如:
SELECT ticket, status, ins_date
FROM (
SELECT
ticket,
status,
ins_date,
row_number() over(partition by ticket order by ins_date desc) rn
FROM ticket_relation
) x WHERE rn = 1
其他方法是认为过滤而不是 GROUPing..
查询
SELECT
ticket_relation_1.ticket
, ticket_relation_1.status
, ticket_relation_1.ins_date
FROM
ticket_relation AS ticket_relation_1
LEFT JOIN
ticket_relation AS ticket_relation_2
ON
ticket_relation_1.ticket = ticket_relation_2.ticket
AND
ticket_relation_1.ins_date < ticket_relation_2.ins_date
WHERE
ticket_relation_2.id IS NULL
ORDER BY
ticket_relation_1.id DESC
结果
| ticket | status | ins_date |
| ------ | ------ | ------------------- |
| 3 | 3 | 2019-05-29 12:49:32 |
| 2 | 1 | 2019-05-29 10:49:32 |
| 1 | 3 | 2019-05-28 12:07:36 |
见demo
此查询需要索引 KEY(ticket, ins_date, id)
才能获得最佳性能。