SQL - 将来自多个表的汇总数据连接在一起
SQL - Joining together summed data from multiple tables
我这几天一直遇到以下问题。我已经设法解决了它,但性能是困扰我的问题。
基本上我有一个 table 人,还有两个 table 人(debt
和 wealth
)参考 person
。 debt
/wealth
tables 可以有多行引用相同的 personID
.
我需要一个结果,我只需将所有人的总债务和财富列为自己的列。
首先让我代表我拥有的table:
Table 'person':
| ID | name |
|----|---------|
| 1 | Adam |
| 2 | Berg |
| 3 | Carl |
| 4 | David |
Table 'wealth':
| ID | personID | value |
|----|----------|----------|
| 1 | 1 | 100 |
| 2 | 1 | 2000 |
| 3 | 2 | 30000 |
| 4 | 3 | 400000 |
| 5 | 3 | 5000000 |
Table 'debt':
| ID | personID | value |
|----|----------|----------|
| 1 | 1 | 100 |
| 2 | 1 | 2000 |
| 3 | 2 | 30000 |
| 4 | 2 | 400000 |
| 5 | 3 | 5000000 |
预期结果:
| personID | debtSum | wealthSum |
|----------|---------|-----------|
| 1 | 2100 | 2100 |
| 2 | 30000 | 430000 |
| 3 | 5400000 | 5000000 |
| 4 | (null) | (null) |
我的解决方案:
SELECT SQL_NO_CACHE p.ID, debtSum, wealthSum
FROM person AS p
LEFT JOIN (SELECT personID, SUM(value) AS debtSum FROM debt GROUP BY personID) AS d ON d.personID = p.ID
LEFT JOIN (SELECT personID, SUM(value) AS wealthSum FROM wealth GROUP BY personID) AS w ON w.personID = p.ID
此查询 returns 正确的数据,但正如我所说,性能让我担心。例如,如果我在 debt table 中为一个不存在的人(例如 personID = 5)添加了数千行,则执行查询需要更长的时间。我想它确实也总结了那个人的所有数据,尽管结果不需要它?
我使用的是 SQL Server 2008,尽管 SQL Fiddle 使用的是 MySQL(如果有区别的话)。
我很感激有关如何提高查询性能的提示。我运行没主意了。
好吧,我会这样做,尽管我敢打赌适当的索引对性能的影响比查询结构更大:
编辑POST评论:
SELECT ID, SUM(debtSum) AS debtSum, SUM(wealthSum) AS wealthSum
FROM (
SELECT p.ID, d.value AS debtSum, NULL AS wealthSum
FROM person AS p
LEFT JOIN debt d ON d.personID = p.ID
UNION ALL
SELECT p.ID, NULL AS debtSum, w.Value AS wealthSum
FROM person AS p
LEFT JOIN wealth w ON w.personID = p.ID
) t
GROUP BY t.ID
您应该在 Person.Id、Debt.PersonID 和 Wealth.PersonID
上有索引
我这几天一直遇到以下问题。我已经设法解决了它,但性能是困扰我的问题。
基本上我有一个 table 人,还有两个 table 人(debt
和 wealth
)参考 person
。 debt
/wealth
tables 可以有多行引用相同的 personID
.
我需要一个结果,我只需将所有人的总债务和财富列为自己的列。
首先让我代表我拥有的table:
Table 'person':
| ID | name |
|----|---------|
| 1 | Adam |
| 2 | Berg |
| 3 | Carl |
| 4 | David |
Table 'wealth':
| ID | personID | value |
|----|----------|----------|
| 1 | 1 | 100 |
| 2 | 1 | 2000 |
| 3 | 2 | 30000 |
| 4 | 3 | 400000 |
| 5 | 3 | 5000000 |
Table 'debt':
| ID | personID | value |
|----|----------|----------|
| 1 | 1 | 100 |
| 2 | 1 | 2000 |
| 3 | 2 | 30000 |
| 4 | 2 | 400000 |
| 5 | 3 | 5000000 |
预期结果:
| personID | debtSum | wealthSum |
|----------|---------|-----------|
| 1 | 2100 | 2100 |
| 2 | 30000 | 430000 |
| 3 | 5400000 | 5000000 |
| 4 | (null) | (null) |
我的解决方案:
SELECT SQL_NO_CACHE p.ID, debtSum, wealthSum
FROM person AS p
LEFT JOIN (SELECT personID, SUM(value) AS debtSum FROM debt GROUP BY personID) AS d ON d.personID = p.ID
LEFT JOIN (SELECT personID, SUM(value) AS wealthSum FROM wealth GROUP BY personID) AS w ON w.personID = p.ID
此查询 returns 正确的数据,但正如我所说,性能让我担心。例如,如果我在 debt table 中为一个不存在的人(例如 personID = 5)添加了数千行,则执行查询需要更长的时间。我想它确实也总结了那个人的所有数据,尽管结果不需要它?
我使用的是 SQL Server 2008,尽管 SQL Fiddle 使用的是 MySQL(如果有区别的话)。
我很感激有关如何提高查询性能的提示。我运行没主意了。
好吧,我会这样做,尽管我敢打赌适当的索引对性能的影响比查询结构更大:
编辑POST评论:
SELECT ID, SUM(debtSum) AS debtSum, SUM(wealthSum) AS wealthSum
FROM (
SELECT p.ID, d.value AS debtSum, NULL AS wealthSum
FROM person AS p
LEFT JOIN debt d ON d.personID = p.ID
UNION ALL
SELECT p.ID, NULL AS debtSum, w.Value AS wealthSum
FROM person AS p
LEFT JOIN wealth w ON w.personID = p.ID
) t
GROUP BY t.ID
您应该在 Person.Id、Debt.PersonID 和 Wealth.PersonID
上有索引