具有较少属性的 SQL 查询成本是否更低?

Does a SQL query with fewer attributes cost less?

我的问题很简单 - SQL 属性越少的查询成本越低吗?

示例: 假设我们的 users table 有 10 列,例如 userIdnamephoneemail、...

SELECT name, phone FROM users WHERE userId='id'

比这个便宜

SELECT * FROM users WHERE userId='id'

从资源利用的角度来说是这样吗?

在宏伟的计划中,两者都可以忽略不计。 如果数据按行存储,则没有太大区别,因为检索一行数据的成本并不高。也许如果其中一列特别大,那么避免对其进行检索将是有益的。

但如果数据按列存储,则第一个更便宜,因为每个条目都存储在不同的位置。

视情况而定。

限制投影中的列数当然有可能提高性能,但这取决于可用的索引。如果我们假设 userId 是主键或至少是一个索引列,您会期望数据库的优化器通过使用具有 userId 的索引进行查找来确定要获取的行作为前导列。

如果 (user_id, phone) 上有索引,或者如果 phone 是索引中包含的列(如果您的数据库支持该概念),则数据库可以从索引中获取 phone它用于查找 return 的行。这样,数据库永远不必访问实际的 table 来获取 phone。包含数据库无需访问 table 即可处理查询所需的所有信息的索引称为“覆盖索引”。粗略地说,在索引中搜索到 return 的行的成本可能与访问 table 以获取投影的其他列的成本大致相同。如果您可以限制投影中的列数以便使用覆盖索引,则可能会显着降低查询成本。更重要的是,如果访问 table 以获取每一列涉及多次读取,因为 Oracle 中的链式行或离线 LOB 列、PostgreSQL 中的 TOAST 数据类型等

减少投影中的列数也会减少需要通过网络发送的数据量以及客户端处理该数据所需的内存量。当你有更大的字段时,这往往是最重要的。例如,如果 users table 中的其中一列恰好是用户记录的 LDAP 路径,那么它的长度很容易达到数百个字符,占网络带宽消耗的一半和一半中间层使用的内存。如果您正在构建需要为数百名用户提供服务的相对低流量的内部业务线应用程序,那么这些事情可能并不重要。如果您要构建需要为数百万用户提供服务的大容量 SaaS 应用程序,这可能非常关键。