使用 Django Treebeard 获取祖先时如何防止 N+1 查询?
How to prevent N+1 queries when fetching ancestors with Django Treebeard?
我们正在使用 Django Treebeard 的具体化路径对组织层次结构进行建模,如下所示:
现在组织树中的每个节点都可以有多个任务:
class Organization(MP_Node):
node_order_by = ['name']
name = models.CharField(max_length=100)
class Task(models.Model):
organization = models.ForeignKey(Organization, on_delete=models.CASCADE)
description= models.TextField()
给定任务列表,我们希望在结果中包含每个任务的完整组织路径。我们如何在不需要 N+1 查询的情况下实现这一点?
组织工厂 1 的预期结果可能是例如:
Task name
Organization Path
Task 1
MyCompany/Factory 1/Maintenance
Task 2
MyCompany/Factory 1/Operations
Task 3
MyCompany/Factory 1
Task 4
MyCompany/Factory 1/Operations
django-treebeard 将物化路径存储在 path
列中,作为字符串,如下所示:000100020005002I
。在此示例中,以下行是其祖先(给定默认步长 4):
0001
00010002
000100020005
000100020005002I
django-treebeard 所做的是将页面的路径拆分为上述 Python 中的位,然后执行数据库查询,如下所示:
Organization.objects.filter(path__in=['0001', '00010002', '000100020005'])`
为了避免 n+1 查询问题,我们需要避免在 Python 中拆分路径,并通过子查询在数据库中执行祖先查找。
模式匹配可用于查看祖先的路径是否包含在子路径中:00010002
匹配000100020005002I
当候选人的路径用作组织路径的模式时问题:
000100020005002I LIKE 00010002% --- equals true
SELECT
organization.path,
ARRAY(
SELECT
name
FROM
organization o_
WHERE
organization.path LIKE o_.path || '%'
)
FROM
organization
organization.path
array
0001
{root}
00010001
{root, org_a}
00010002
{root, org_b}
000100020001
{root, org_b, org_b1}
Django 不提供 out-of-the-box 解决方案来在 .filter(path__startswith='pattern')
查找中切换参数(正如我们这里的例子所要求的)。这就是我使用 RawSQL 表达式的原因。
>>> from django.db.models.expressions import RawSQL
>>> orgs = Organization.objects.annotate(
ancestors=RawSQL(
"""
ARRAY(
SELECT name FROM organization o_
WHERE organization.path LIKE o_.path || '%%'
)
FROM organization
""",
params=[],
)
)
>>> orgs[0].ancestors
['Root', "Org 1", "Org 2", "Org 3"]
我们正在使用 Django Treebeard 的具体化路径对组织层次结构进行建模,如下所示:
现在组织树中的每个节点都可以有多个任务:
class Organization(MP_Node):
node_order_by = ['name']
name = models.CharField(max_length=100)
class Task(models.Model):
organization = models.ForeignKey(Organization, on_delete=models.CASCADE)
description= models.TextField()
给定任务列表,我们希望在结果中包含每个任务的完整组织路径。我们如何在不需要 N+1 查询的情况下实现这一点?
组织工厂 1 的预期结果可能是例如:
Task name | Organization Path |
---|---|
Task 1 | MyCompany/Factory 1/Maintenance |
Task 2 | MyCompany/Factory 1/Operations |
Task 3 | MyCompany/Factory 1 |
Task 4 | MyCompany/Factory 1/Operations |
django-treebeard 将物化路径存储在 path
列中,作为字符串,如下所示:000100020005002I
。在此示例中,以下行是其祖先(给定默认步长 4):
0001
00010002
000100020005
000100020005002I
django-treebeard 所做的是将页面的路径拆分为上述 Python 中的位,然后执行数据库查询,如下所示:
Organization.objects.filter(path__in=['0001', '00010002', '000100020005'])`
为了避免 n+1 查询问题,我们需要避免在 Python 中拆分路径,并通过子查询在数据库中执行祖先查找。
模式匹配可用于查看祖先的路径是否包含在子路径中:00010002
匹配000100020005002I
当候选人的路径用作组织路径的模式时问题:
000100020005002I LIKE 00010002% --- equals true
SELECT
organization.path,
ARRAY(
SELECT
name
FROM
organization o_
WHERE
organization.path LIKE o_.path || '%'
)
FROM
organization
organization.path | array |
---|---|
0001 | {root} |
00010001 | {root, org_a} |
00010002 | {root, org_b} |
000100020001 | {root, org_b, org_b1} |
Django 不提供 out-of-the-box 解决方案来在 .filter(path__startswith='pattern')
查找中切换参数(正如我们这里的例子所要求的)。这就是我使用 RawSQL 表达式的原因。
>>> from django.db.models.expressions import RawSQL
>>> orgs = Organization.objects.annotate(
ancestors=RawSQL(
"""
ARRAY(
SELECT name FROM organization o_
WHERE organization.path LIKE o_.path || '%%'
)
FROM organization
""",
params=[],
)
)
>>> orgs[0].ancestors
['Root', "Org 1", "Org 2", "Org 3"]