需要对索引进行一些说明(WHERE、JOIN)

Need some clarification on indexes (WHERE, JOIN)

我们在一些处理数百万行的报告中遇到了一些性能问题。我尝试优化 sql 查询,但它只将执行时间减少了一半。

接下来要分析修改或者增加一些索引,所以有一些疑问:

1- sql 查询包含大量连接:我是否必须为每个外键创建索引?

2- 假设请求 SELECT * FROM A LEFT JOIN B on a.b_id = b.id where a.attribute2 = 'someValue',我们在 table A 上有一个基于 b_id 和属性 2 的索引:我的请求是否将此索引用于 where 部分 (我知道这两个条件是否在将使用索引的 where 子句上。

3- 如果一个索引基于 C1、C2 和 C3 列,而我决定添加一个基于 C2 的索引,我是否需要从第一个索引中删除 C2?

感谢您的宝贵时间

你可以用EXPLAIN query看看MySQL执行的时候会做什么。这在试图弄清楚为什么它慢时有很大帮助。

JOIN-ing 一次发生一个 table,顺序由 MySQL 分析查询并尝试找到最快的顺序来确定。您将在 EXPLAIN 结果中看到它。

  1. 每个 JOIN 只能使用一个索引,并且它必须在要连接的 table 上。在您的示例中,使用的索引将是 table B 上的 id (主键)。在每个 FK 上创建索引将为查询计划提供 MySQL 更多选项,这可能有助于一些情况。

  2. WHERE 和 JOIN 条件之间只有当连接 table 为 NULL(缺失行)时的区别(INNER JOIN 完全没有区别)。对于您的示例, b_id 上的索引不执行任何操作。如果您将其更改为 INNER JOIN(例如,通过在 where 子句中添加 b.something = 42),那么如果 MySQL 确定它应该执行反向查询(首先是 b,然后是 a),则可能会使用它.

  3. No.. 在多个索引中有一个列是 100% 可以的。如果你在 (A,B,C) 上有一个索引,然后在 (A) 上添加另一个索引,那么 将是多余的和毫无意义的(因为它是另一个索引的前缀)。 B 上的索引非常好。