我如何 select 来自关系 mysql table 的 max(timestamp) 快速

How do I select the max(timestamp) from a relational mysql table fast

我们正在开发票证系统,我们希望在仪表板中显示票证的最新状态。我们有两个 table。第一个用于工单本身,第二个 table 用于个人编辑。

系统已经 运行,但仪表板的性能非常糟糕(约 1300 张票需要 6 秒)。起初我们使用了一个 statemant,它为每张票 selected 'where timestamp = (select max(Timestamp))'。在第二步中,我们创建了一个视图,其中仅包含每张工单的最新时间戳,但我们无法将正确的状态也包含到该视图中。

所以主要的问题可能是,我们无法构建一个 table,其中每张票都是最新的 ins_date 最新的状态为 selected.

简化后的数据库如下所示:

CREATE TABLE `ticket` (
  `id` int(10) NOT NULL,
  `betreff` varchar(100) NOT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

CREATE TABLE `ticket_relation` (
  `id` int(11) NOT NULL,
  `ticket` int(10) NOT NULL,
  `info` varchar(10000) DEFAULT NULL,
  `status` int(1) NOT NULL DEFAULT '0',
  `ins_date` timestamp NULL DEFAULT CURRENT_TIMESTAMP,
  `ins_user` int(11) DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8;


INSERT INTO `ticket` (`id`, `betreff`) VALUES
(1, 'Technische Frage'),
(2, 'Ticket 2'),
(3, 'Weitere Fragen');

INSERT INTO `ticket_relation` (`id`, `ticket`, `info`, `status`, `ins_date`, `ins_user`) VALUES
(1, 1, 'Betreff 1', 0, '2019-05-28 11:02:18', 123),
(2, 1, 'Betreff 2', 3, '2019-05-28 12:07:36', 123),
(3, 2, 'Betreff 3', 0, '2019-05-29 06:49:32', 123),
(4, 3, 'Betreff 4', 1, '2019-05-29 07:44:07', 123),
(5, 2, 'Betreff 5', 1, '2019-05-29 07:49:32', 123),
(6, 2, 'Betreff 6', 3, '2019-05-29 08:49:32', 123),
(7, 3, 'Betreff 7', 2, '2019-05-29 09:49:32', 123),
(8, 2, 'Betreff 8', 1, '2019-05-29 10:49:32', 123),
(9, 3, 'Betreff 9', 2, '2019-05-29 11:49:32', 123),
(10, 3, 'Betreff 10', 3, '2019-05-29 12:49:32', 123);

我创建了一个 SQL Fiddle: http://sqlfiddle.com/#!9/a873b6/3 前三个语句是无法正常工作或运行速度太慢的尝试。最后一个是我认为的关键,但我不明白,为什么这个状态错误。

尝试创建具有最新 ins_date 和每个工单状态的 table:

SELECT
  ticket, status, MAX(ins_date) as max_date 
FROM 
  ticket_relation 
GROUP BY 
  ticket
ORDER BY 
  ins_date DESC;

此查询获取每张票的正确(最新)ins_date,但不是最新状态:

+--------+--------+----------------------+
| ticket | status | max_date             |
+--------+--------+----------------------+
| 3      | 1      | 2019-05-29T12:49:32Z |
+--------+--------+----------------------+
| 2      | 0      | 2019-05-29T10:49:32Z |
+--------+--------+----------------------+
| 1      | 0      | 2019-05-28T12:07:36Z |
+--------+--------+----------------------+

预期输出是这样的:

+--------+--------+----------------------+
| ticket | status | max_date             |
+--------+--------+----------------------+
| 3      | 3      | 2019-05-29T12:49:32Z |
+--------+--------+----------------------+
| 2      | 1      | 2019-05-29T10:49:32Z |
+--------+--------+----------------------+
| 1      | 3      | 2019-05-28T12:07:36Z |
+--------+--------+----------------------+

有没有有效的方法来select tiket-table中每张票的最新时间戳状态?

您可以尝试以下查询 -

SELECT
  ticket, status, ins_date as max_date 
FROM ticket_relation a
where ins_date in (select max(ins_date) from ticket_relation b where a.ticket=b.ticket)

一个解决方案是使用子查询来计算每张票的最新插入日期,然后将结果与原始 table 连接起来,例如:

SELECT t.ticket, t.status, t.ins_date
FROM ticket_relation  t
INNER JOIN (
    SELECT ticket, max(ins_date) max_ins_date
    FROM ticket_relation 
    GROUP BY ticket
) x ON t.ticket = x.ticket AND t.ins_date = x.max_ins_date

为了提高此查询的性能,您需要在 (ticket, ins_date) 上建立索引。

另一个选项是使用 NOT EXISTS 条件来确保只选择最新的记录,例如:

SELECT t.ticket, t.status, t.ins_date
FROM ticket_relation  t
WHERE NOT EXISTS (
    SELECT 1 
    FROM ticket_relation t1 
    WHERE t1.ticket = t.ticket AND t1.ins_date > t.ins_date)
)

注意:在处理 GROUP BY 时,所有非聚合列都必须出现在 GROUP BY 子句中。否则,您将得到错误或 unprectictable 结果(取决于服务器选项 ONLY_FULL_GROUP_BY 是分别启用还是禁用)。


如果您能够升级到 mysql (8.0) 的最新版本,则可以使用 window 函数来简化查询并可能提高其性能,例如:

SELECT ticket, status, ins_date
FROM (
    SELECT 
        ticket, 
        status, 
        ins_date, 
        row_number() over(partition by ticket order by ins_date desc) rn
    FROM ticket_relation  
) x WHERE rn = 1

其他方法是认为过滤而不是 GROUPing..

查询

SELECT 
   ticket_relation_1.ticket
 , ticket_relation_1.status 
 , ticket_relation_1.ins_date
FROM 
 ticket_relation AS ticket_relation_1
LEFT JOIN
 ticket_relation AS ticket_relation_2
ON
   ticket_relation_1.ticket = ticket_relation_2.ticket
 AND
   ticket_relation_1.ins_date < ticket_relation_2.ins_date
 WHERE 
  ticket_relation_2.id IS NULL
ORDER BY 
 ticket_relation_1.id DESC

结果

| ticket | status | ins_date            |
| ------ | ------ | ------------------- |
| 3      | 3      | 2019-05-29 12:49:32 |
| 2      | 1      | 2019-05-29 10:49:32 |
| 1      | 3      | 2019-05-28 12:07:36 |

demo

此查询需要索引 KEY(ticket, ins_date, id) 才能获得最佳性能。