未提供 ORDER BY 时 postgres 如何排序结果
How does postgres order the results when ORDER BY is not provided
假设我有两个 tables:
user (user_name varchar(50), project_name varchar(50))
project (project_name varchar(50), project_cost(integer))
我有一个查询 returns 我的结果是 "de-facto desired" :
select u.user_name, p.project_name
from user u, project p
where u.project_name = p.project_name
Postgres 说当没有给出 ORDER BY 时,行的顺序不是 predictable。但是在我的本地测试中,postgres returns 行以相同的顺序进行重复测试。
你能帮我理解当查询中没有提供 order by
时 Postgres 真正做了什么吗?
我无法访问所有可能存在真实 table 和模式的地方,所以我真的需要知道到底发生了什么才能保持现有顺序不变。
如果没有给出 order by
子句,postgres(以及任何其他合理的数据库,为此),应该 return 行能够产生它们的顺序(无论是来自内部缓存、索引或直接来自 table)。
由于对相同的数据使用了相同的算法,因此以相同的顺序获得相同的行也就不足为奇了。但是,这并不意味着您应该依赖此顺序。如果你做了一些事情来改变磁盘上的数据布局(例如,备份和恢复它,或者甚至重建 tables 的索引),你可能会得到不同的顺序。
如果 table 有一个,则可能按聚集索引的顺序排列。然而,正如文档所说,这不是应该信任的东西。
要了解 DBMS 的真正作用,应该查看 PLAN。输出顺序也将取决于它。但是有两件事要记住:第一,如果计划包括 'full (heap) table scan' 那么顺序是未定义的(因为 DBMS 可以自由地重新排序堆数据);其次,如果您更改 SQL 语句或更新数据库统计信息,计划可能会发生重大变化。这就是为什么你不应该依赖长 运行.
中输出顺序的稳定性
假设我有两个 tables:
user (user_name varchar(50), project_name varchar(50))
project (project_name varchar(50), project_cost(integer))
我有一个查询 returns 我的结果是 "de-facto desired" :
select u.user_name, p.project_name
from user u, project p
where u.project_name = p.project_name
Postgres 说当没有给出 ORDER BY 时,行的顺序不是 predictable。但是在我的本地测试中,postgres returns 行以相同的顺序进行重复测试。
你能帮我理解当查询中没有提供 order by
时 Postgres 真正做了什么吗?
我无法访问所有可能存在真实 table 和模式的地方,所以我真的需要知道到底发生了什么才能保持现有顺序不变。
如果没有给出 order by
子句,postgres(以及任何其他合理的数据库,为此),应该 return 行能够产生它们的顺序(无论是来自内部缓存、索引或直接来自 table)。
由于对相同的数据使用了相同的算法,因此以相同的顺序获得相同的行也就不足为奇了。但是,这并不意味着您应该依赖此顺序。如果你做了一些事情来改变磁盘上的数据布局(例如,备份和恢复它,或者甚至重建 tables 的索引),你可能会得到不同的顺序。
如果 table 有一个,则可能按聚集索引的顺序排列。然而,正如文档所说,这不是应该信任的东西。
要了解 DBMS 的真正作用,应该查看 PLAN。输出顺序也将取决于它。但是有两件事要记住:第一,如果计划包括 'full (heap) table scan' 那么顺序是未定义的(因为 DBMS 可以自由地重新排序堆数据);其次,如果您更改 SQL 语句或更新数据库统计信息,计划可能会发生重大变化。这就是为什么你不应该依赖长 运行.
中输出顺序的稳定性