使用 GIN 和 pg_trgm 索引 jsonb 列键,用于 Rails 中的 ILIKE 查询
Index jsonb column keys using GIN and pg_trgm, for ILIKE queries in Rails
我有一个 table“线索”,其结构如下:
# == Schema Information
#
# Table name: leads
#
# id :integer not null, primary key
# data :jsonb not null
# state :string
# priority :string
# lead_no :string
# user_id :integer
# location_place_id :string
# uuid :string
# agent_id :integer
# location_coordinates :geography point, 4326
# location :jsonb not null
# user_details :jsonb not null
# inventory_id :integer
# source_details :jsonb not null
# connect_details :jsonb not null
# referral_details :jsonb not null
# process_details :jsonb not null
# tags :jsonb not null
# created_at :datetime
# updated_at :datetime
# name :string
user_details jsonb 列以以下形式存储数据 - {name : "John Doe", country : "IN", phone_no : " 123456789"}。我想使用 ILIKE 查询我的数据库列的名称键为:
Lead.where("user_details->>name ILIKE ?","john%")
为此,我创建了一个迁移,如下所示:
class AddIndexUserNameOnLeads < ActiveRecord::Migration[5.2]
def up
execute("CREATE INDEX leads_user_details_name_idx ON leads USING gin((user_details->>'name') gin_trgm_ops)")
end
def down
execute("DROP INDEX leads_user_details_name_idx")
end
end
这将创建必要的索引。我已经在之前的迁移中启用了 pg_trgm 扩展。我的 structure.sql 看起来像:
此外,相应的schema.rb为线索添加以下行table -
t.index "((user_details ->> 'name'::text)) gin_trgm_ops", name: "leads_user_details_name_idx", using: :gin
但是,当我尝试查询我的数据库时,它会进行顺序扫描。
另一方面,如果我为整个 user_details 列创建一个 gin 索引,然后使用 "@> {name: "john"} 进行查询。to_json " 它使用索引进行扫描
我的Rails版本是5.2.0,PostgreSQL版本是12.5。我如何使用 ILIKE 查询来处理这个用例?我哪里错了?如有必要,我很乐意提供更多详细信息。
另一种方法是告诉您的索引已经使用大写或小写对值进行排序,这样您就可以在查询中简单地使用 LIKE
。
CREATE INDEX leads_user_details_name_idx ON leads
USING gin(lower(user_details->>'name') gin_trgm_ops);
查询这个 jsonb 键时,你必须使用相同的函数。这样做查询规划器将找到您的部分索引:
SELECT * FROM leads
WHERE lower(user_details->>'name') ~~ '%doe%';
演示:db<>fiddle
您 table 可能太小了,索引扫描似乎不值得。看起来它只有 269 行。你可以 set enable_seqscan=off
看看它是否使用索引。或者您可以只向 table 添加实际数量的行(然后对其进行 VACUUM ANALYZE)
我有一个 table“线索”,其结构如下:
# == Schema Information
#
# Table name: leads
#
# id :integer not null, primary key
# data :jsonb not null
# state :string
# priority :string
# lead_no :string
# user_id :integer
# location_place_id :string
# uuid :string
# agent_id :integer
# location_coordinates :geography point, 4326
# location :jsonb not null
# user_details :jsonb not null
# inventory_id :integer
# source_details :jsonb not null
# connect_details :jsonb not null
# referral_details :jsonb not null
# process_details :jsonb not null
# tags :jsonb not null
# created_at :datetime
# updated_at :datetime
# name :string
user_details jsonb 列以以下形式存储数据 - {name : "John Doe", country : "IN", phone_no : " 123456789"}。我想使用 ILIKE 查询我的数据库列的名称键为:
Lead.where("user_details->>name ILIKE ?","john%")
为此,我创建了一个迁移,如下所示:
class AddIndexUserNameOnLeads < ActiveRecord::Migration[5.2]
def up
execute("CREATE INDEX leads_user_details_name_idx ON leads USING gin((user_details->>'name') gin_trgm_ops)")
end
def down
execute("DROP INDEX leads_user_details_name_idx")
end
end
这将创建必要的索引。我已经在之前的迁移中启用了 pg_trgm 扩展。我的 structure.sql 看起来像:
此外,相应的schema.rb为线索添加以下行table -
t.index "((user_details ->> 'name'::text)) gin_trgm_ops", name: "leads_user_details_name_idx", using: :gin
但是,当我尝试查询我的数据库时,它会进行顺序扫描。
另一方面,如果我为整个 user_details 列创建一个 gin 索引,然后使用 "@> {name: "john"} 进行查询。to_json " 它使用索引进行扫描
我的Rails版本是5.2.0,PostgreSQL版本是12.5。我如何使用 ILIKE 查询来处理这个用例?我哪里错了?如有必要,我很乐意提供更多详细信息。
另一种方法是告诉您的索引已经使用大写或小写对值进行排序,这样您就可以在查询中简单地使用 LIKE
。
CREATE INDEX leads_user_details_name_idx ON leads
USING gin(lower(user_details->>'name') gin_trgm_ops);
查询这个 jsonb 键时,你必须使用相同的函数。这样做查询规划器将找到您的部分索引:
SELECT * FROM leads
WHERE lower(user_details->>'name') ~~ '%doe%';
演示:db<>fiddle
您 table 可能太小了,索引扫描似乎不值得。看起来它只有 269 行。你可以 set enable_seqscan=off
看看它是否使用索引。或者您可以只向 table 添加实际数量的行(然后对其进行 VACUUM ANALYZE)