GIN索引怎么了,绕不开SEQ扫描?
What's wrong with GIN index, can't avoid SEQ scan?
我创建了一个这样的 table,
create table mytable(hash char(40), title varchar(500));
create index name_fts on mytable using gin(to_tsvector('english', 'title'));
CREATE UNIQUE INDEX md5_uniq_idx ON mytable(hash);
当我查询标题时,
test=# explain analyze select * from mytable where to_tsvector('english', title) @@ 'abc | def'::tsquery limit 10;
QUERY PLAN
--------------------------------------------------------------------------------------------------------------------
Limit (cost=0.00..277.35 rows=10 width=83) (actual time=0.111..75.549 rows=10 loops=1)
-> Seq Scan on mytable (cost=0.00..381187.45 rows=13744 width=83) (actual time=0.110..75.546 rows=10 loops=1)
Filter: (to_tsvector('english'::regconfig, (title)::text) @@ '''abc'' | ''def'''::tsquery)
Rows Removed by Filter: 10221
Planning time: 0.176 ms
Execution time: 75.564 ms
(6 rows)
未使用索引。有任何想法吗?我有 1000 万行。
你的索引定义有误,应该是
ON mytable USING gin (to_tsvector('english', title))
而不是
ON mytable USING gin (to_tsvector('english', 'title'))
按照你的写法,它是一个常量,而不是一个被索引的字段,这样的索引对于像你这样的搜索确实是没有用的。
查看一个索引是否可以使用,可以执行
SET enable_seqscan=off;
然后 运行 再次查询。
如果仍然没有使用索引,则可能无法使用索引。
除上述之外,您的执行计划还有一些让我感到奇怪的地方。 PostgreSQL 估计 mytable
的顺序扫描将 return 13744 行,而不是你所说的 1000 万行。您是否禁用了 autovacuum 或是否有其他原因可能导致您的 table 统计数据不准确?
我创建了一个这样的 table,
create table mytable(hash char(40), title varchar(500));
create index name_fts on mytable using gin(to_tsvector('english', 'title'));
CREATE UNIQUE INDEX md5_uniq_idx ON mytable(hash);
当我查询标题时,
test=# explain analyze select * from mytable where to_tsvector('english', title) @@ 'abc | def'::tsquery limit 10;
QUERY PLAN
--------------------------------------------------------------------------------------------------------------------
Limit (cost=0.00..277.35 rows=10 width=83) (actual time=0.111..75.549 rows=10 loops=1)
-> Seq Scan on mytable (cost=0.00..381187.45 rows=13744 width=83) (actual time=0.110..75.546 rows=10 loops=1)
Filter: (to_tsvector('english'::regconfig, (title)::text) @@ '''abc'' | ''def'''::tsquery)
Rows Removed by Filter: 10221
Planning time: 0.176 ms
Execution time: 75.564 ms
(6 rows)
未使用索引。有任何想法吗?我有 1000 万行。
你的索引定义有误,应该是
ON mytable USING gin (to_tsvector('english', title))
而不是
ON mytable USING gin (to_tsvector('english', 'title'))
按照你的写法,它是一个常量,而不是一个被索引的字段,这样的索引对于像你这样的搜索确实是没有用的。
查看一个索引是否可以使用,可以执行
SET enable_seqscan=off;
然后 运行 再次查询。
如果仍然没有使用索引,则可能无法使用索引。
除上述之外,您的执行计划还有一些让我感到奇怪的地方。 PostgreSQL 估计 mytable
的顺序扫描将 return 13744 行,而不是你所说的 1000 万行。您是否禁用了 autovacuum 或是否有其他原因可能导致您的 table 统计数据不准确?