多列上的 Firebird SQL 索引

Firebird SQL index on multiple columns

这是针对 Firebird 2.5 的。

我有一个 table T,其索引由 2 列组成,例如 ColA 和 ColB。如果我在做: SELECT * FROM T WHERE ColA=...,所以 WHERE 子句只在 A 列上,Firebird 会为 ColB 列设置一个默认值,以及索引的好处,还是根本不能使用这个索引?

一些背景信息: 我正在进行数据库升级。这是我拥有的:

CREATE TABLE user(
     newid BIGINT NOT NULL,
     oldid BIGINT NOT NULL,
     anotherCol INT);

CREATE INDEX idx ON  user(oldid, anotherCol);
     
CREATE TABLE order(
     RefUser BIGINT);
  

order.RefUser 是 oldid,我需要将它们更改为 newid。我使用这个查询来做到这一点:

UPDATE order o SET o.refuser = (SELECT u.newid FROM user u WHERE u.oldId = o.refuser);

此时oldid仍然是唯一的,但以后只有(oldid, anotherCol)才能保证唯一性,因此索引,newid的创建。

用户table是几百万条记录,订单table是几千万:这个查询需要一个多小时。我想看看如何改进它(不热衷于在那么长的时间内关闭关键服务)。

假设索引统计信息是最新的,或者至少对优化器来说足够好,那么当并非所有列都是 where 子句的一部分时,Firebird 可以(并且经常会)使用多列索引.唯一的限制是它只能用于第一列(或索引的 'prefix')。

所以

CREATE INDEX idx ON  user(oldid, anotherCol);

Firebird 可以将索引 idx 用于 where oldid = 'something',但不适用于 where anotherCol = 'something'

不,Firebird 不会“为列 [anotherCol]”设置默认值。它对索引和 returns 具有匹配 oldid 前缀的所有行进行范围扫描。

从技术上讲,Firebird 通过组合列来创建索引键,如 Firebird for the Database Expert: Episode 1 - Indexes 中所述,这意味着索引中的值类似于:

0<oldid> 1<anotherCol> : row_id

例如(简化了,因为在现实生活中 Firebird 也做了前缀压缩)

0val1 1other1 : rowid1
0val1 1other2 : rowid4
0val1 1other3 : rowid6
0val2 1other1 : rowid2
...

当使用 where oldid = 'val1' 时,Firebird 将在索引中搜索以 0val1 1 开头的所有条目(就像它在单个列上搜索 0val1 1% 的字符串一样)。在这种情况下,它将匹配 rowid1、rowid4 和 rowid6。

虽然这可行,但如果您只在 oldid 上查询很多,最好也只在 oldid 上创建一个单列索引,因为这个索引会更小,因此速度更快查找记录时要遍历。缺点当然是更多的索引对插入、更新和删除有性能影响。

另见 Concatenated Indexes on Use The Index, Luke