Mysql 路口查询性能
Mysql intersection query performance
我对 mysql 很陌生。我有 2 个相同的 mysql 表,每个表有 50K 行(70 列)。这些表格每天都会通过数据源更新。我需要执行一些嵌套查询,例如交集/减法等。
我尝试使用的查询之一如下。
但它不能正常工作。要么需要5分钟。到 10 分钟。 (通过终端)或者它不响应。
SELECT *
FROM table1
WHERE table1.sku IN (SELECT t1.sku
FROM ((SELECT DISTINCT sku
FROM table2)
UNION ALL
(SELECT DISTINCT sku
FROM table1)) AS t1
GROUP BY sku
HAVING Count(*) >= 2)
我怎样才能使它工作faster/properly?我应该如何配置 tables/columns(索引、主键等)或者我是否需要在 mysql 服务器上进行任何调整?
我尝试了几件事。我在 'sku' 上创建了索引,它们是 varchar(75)
列。我的数据库服务器在 1 CoreProcessor (Digital Ocean) 服务器上运行
512MB内存。
--- 查询 'EXPLAIN'
+----+--------------------+-----------------------+-------+---------------+---------+---------+------+-------+---------------------------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+--------------------+-----------------------+-------+---------------+---------+---------+------+-------+---------------------------------+
| 1 | PRIMARY | table1 | ALL | NULL | NULL | NULL | NULL | 30260 | Using where |
| 2 | DEPENDENT SUBQUERY | <derived3> | ALL | NULL | NULL | NULL | NULL | 65677 | Using temporary; Using filesort |
| 3 | DERIVED | table2 | range | NULL | sku_idx | 227 | NULL | 31016 | Using index for group-by |
| 4 | UNION | table1 | range | NULL | sku | 227 | NULL | 30261 | Using index for group-by |
| NULL | UNION RESULT | <union3,4> | ALL | NULL | NULL | NULL | NULL | NULL | |
+----+--------------------+-----------------------+-------+---------------+---------+---------+------+-------+---------------------------------+
如果我对这个特定查询的理解正确,那么您正在尝试显示表 1 中在表 2 中具有相应 sku
的所有记录。
这可以通过更简单的查询来实现:
SELECT *
FROM table1
WHERE table1.sku IN (SELECT DISTINCT table2.sku FROM table2 )
GROUP BY table1.sku
或者,使用联接:
SELECT table1.*
FROM table1
INNER JOIN table2 ON table1.sku = table2.sku
GROUP BY table1.sku
如果您在 table1.sku
和 table2.sku
上有索引,这应该会立即起作用
我对 mysql 很陌生。我有 2 个相同的 mysql 表,每个表有 50K 行(70 列)。这些表格每天都会通过数据源更新。我需要执行一些嵌套查询,例如交集/减法等。
我尝试使用的查询之一如下。 但它不能正常工作。要么需要5分钟。到 10 分钟。 (通过终端)或者它不响应。
SELECT *
FROM table1
WHERE table1.sku IN (SELECT t1.sku
FROM ((SELECT DISTINCT sku
FROM table2)
UNION ALL
(SELECT DISTINCT sku
FROM table1)) AS t1
GROUP BY sku
HAVING Count(*) >= 2)
我怎样才能使它工作faster/properly?我应该如何配置 tables/columns(索引、主键等)或者我是否需要在 mysql 服务器上进行任何调整?
我尝试了几件事。我在 'sku' 上创建了索引,它们是 varchar(75) 列。我的数据库服务器在 1 CoreProcessor (Digital Ocean) 服务器上运行 512MB内存。
--- 查询 'EXPLAIN'
+----+--------------------+-----------------------+-------+---------------+---------+---------+------+-------+---------------------------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+--------------------+-----------------------+-------+---------------+---------+---------+------+-------+---------------------------------+
| 1 | PRIMARY | table1 | ALL | NULL | NULL | NULL | NULL | 30260 | Using where |
| 2 | DEPENDENT SUBQUERY | <derived3> | ALL | NULL | NULL | NULL | NULL | 65677 | Using temporary; Using filesort |
| 3 | DERIVED | table2 | range | NULL | sku_idx | 227 | NULL | 31016 | Using index for group-by |
| 4 | UNION | table1 | range | NULL | sku | 227 | NULL | 30261 | Using index for group-by |
| NULL | UNION RESULT | <union3,4> | ALL | NULL | NULL | NULL | NULL | NULL | |
+----+--------------------+-----------------------+-------+---------------+---------+---------+------+-------+---------------------------------+
如果我对这个特定查询的理解正确,那么您正在尝试显示表 1 中在表 2 中具有相应 sku
的所有记录。
这可以通过更简单的查询来实现:
SELECT *
FROM table1
WHERE table1.sku IN (SELECT DISTINCT table2.sku FROM table2 )
GROUP BY table1.sku
或者,使用联接:
SELECT table1.*
FROM table1
INNER JOIN table2 ON table1.sku = table2.sku
GROUP BY table1.sku
如果您在 table1.sku
和 table2.sku