使用 Django Treebeard 获取祖先时如何防止 N+1 查询?

How to prevent N+1 queries when fetching ancestors with Django Treebeard?

我们正在使用 Django Treebeard 的具体化路径对组织层次结构进行建模,如下所示:

现在组织树中的每个节点都可以有多个任务:

class Organization(MP_Node):
    node_order_by = ['name']
    name = models.CharField(max_length=100)

class Task(models.Model):
    organization = models.ForeignKey(Organization, on_delete=models.CASCADE)
    description= models.TextField()

给定任务列表,我们希望在结果中包含每个任务的完整组织路径。我们如何在不需要 N+1 查询的情况下实现这一点?

组织工厂 1 的预期结果可能是例如:

Task name Organization Path
Task 1 MyCompany/Factory 1/Maintenance
Task 2 MyCompany/Factory 1/Operations
Task 3 MyCompany/Factory 1
Task 4 MyCompany/Factory 1/Operations

django-treebeard 将物化路径存储在 path 列中,作为字符串,如下所示:000100020005002I。在此示例中,以下行是其祖先(给定默认步长 4):

0001
00010002 
000100020005  
000100020005002I

django-treebeard 所做的是将页面的路径拆分为上述 Python 中的位,然后执行数据库查询,如下所示:

Organization.objects.filter(path__in=['0001', '00010002', '000100020005'])`

为了避免 n+1 查询问题,我们需要避免在 Python 中拆分路径,并通过子查询在数据库中执行祖先查找。

模式匹配可用于查看祖先的路径是否包含在子路径中:00010002匹配000100020005002I当候选人的路径用作组织路径的模式时问题:

000100020005002I LIKE 00010002%  --- equals true
SELECT  
  organization.path, 
  ARRAY(
   SELECT 
     name 
   FROM
     organization o_ 
   WHERE 
     organization.path LIKE o_.path || '%' 
  )
FROM 
  organization 
organization.path array
0001 {root}
00010001 {root, org_a}
00010002 {root, org_b}
000100020001 {root, org_b, org_b1}

Django 不提供 out-of-the-box 解决方案来在 .filter(path__startswith='pattern') 查找中切换参数(正如我们这里的例子所要求的)。这就是我使用 RawSQL 表达式的原因。

>>> from django.db.models.expressions import RawSQL

>>> orgs = Organization.objects.annotate(
    ancestors=RawSQL(
        """
        ARRAY(
          SELECT name FROM organization o_ 
          WHERE organization.path LIKE o_.path || '%%'
        ) 
        FROM organization
        """,
        params=[],
    )
)

>>> orgs[0].ancestors
['Root', "Org 1", "Org 2", "Org 3"]