SQL - 将非空邻接表转换为路径

SQL - Convert non-null adjacency list to path

我正在处理一些代表文件系统的 table,我需要 select 每个文件夹的完整路径作为扁平字符串。

第一个table列出了每个文件夹的详细信息:

CREATE TABLE Folders(
    FolderID int IDENTITY(1,1) NOT NULL,
    [Name] nvarchar(255) NOT NULL)

第二个 table 列出了文件夹关系的传递闭包:

CREATE TABLE FolderClosures(
    FolderClosuresID int IDENTITY(1,1) NOT NULL,
    AncestorFolderID int NOT NULL, --Foreign key to Folders.FolderID
    DescendantFolderID int NOT NULL --Foreign key to Folders.FolderID
    IsDirect bit NOT NULL)

对于示例数据,我们假设存在以下文件夹:

Documents/
Documents/Finance/
Documents/HumanResources/
Documents/HumanResources/Training/

这些将在 table 中持久化如下:

| FolderID | Name           |
+----------+----------------+
|        1 | Documents      |
|        2 | Finance        |
|        3 | HumanResources |
|        4 | Training       |

| FolderClosureID | AncestorFolderID | DescendantFolderID | IsDirect |
+-----------------+------------------+--------------------+----------+
|               1 |                1 |                  1 |        0 |
|               2 |                2 |                  2 |        0 |
|               3 |                1 |                  2 |        1 |
|               4 |                3 |                  3 |        0 |
|               5 |                1 |                  3 |        1 |
|               6 |                4 |                  4 |        0 |
|               7 |                1 |                  4 |        0 |
|               8 |                3 |                  4 |        1 |

需要注意的一些细节:

  1. 每个文件夹在 FolderClosures 中都有一个 "identity row",其中 AncestorFolderID = DescendantFolderID AND IsDirect = 0

  2. 每个非顶级文件夹的文件夹在 FolderClosures 中只有一行,其中 IsDirect = 1

  3. FolderClosures 每个文件夹可以包含许多行,其中 AncestorFolderID <> DescendantFolderID AND IsDirect = 0。其中每一个都代表一个 "grandparent" 或更远的关系。

  4. 由于没有列可以为空,因此没有行明确声明给定文件夹是顶级文件夹。这只能通过检查 FolderClosures 中没有行来辨别,其中 IsDirect = 1 AND DescendantFolderID = SomeID 其中 SomeID 是相关文件夹的 ID。

我希望能够 运行 查询 returns 此数据:

| FolderID | Path                               |
+----------+------------------------------------+
|        1 | Documents/                         |
|        2 | Documents/Finance/                 |
|        3 | Documents/HumanResources/          |
|        4 | Documents/HumanResources/Training/ |

文件夹可以无限嵌套,但实际上最多只能嵌套 10 层。查询可能需要返回几千个文件夹的路径。

我发现了很多关于在数据作为邻接列表持久化时创建此类查询的建议,但我无法找到像这样的传递闭包设置的答案。我发现的邻接列表解决方案依赖于使用可为空的父文件夹 ID 保留的行,但这在这里不起作用。

如何获得所需的输出?

如果有帮助,我正在使用 SQL Server 2016。

获得所需输出的一种方法是执行递归查询。为此,我认为最好的办法是仅使用具有 IsDirect = 1 的行,并将锚点用作 FolderClosures 中没有直接父级的所有文件夹,这应该是您的所有根文件夹。

WITH FoldersCTE AS (
    SELECT  F.FolderID, CAST(F.Name as NVARCHAR(max)) Path
    FROM    Folders F
    WHERE   NOT EXISTS (
        SELECT 1 FROM FolderClosures FC WHERE FC.IsDirect = 1 AND FC.DescendantFolderID = F.FolderID
    )
    UNION ALL
    SELECT  F.FolderID, CONCAT(PF.Path, '\', F.Name)
    FROM    FoldersCTE PF
            INNER JOIN FolderClosures FC
                ON  FC.AncestorFolderID = PF.FolderId
                AND FC.IsDirect = 1
            INNER JOIN Folders F
                ON F.FolderID = FC.DescendantFolderID
)
SELECT * 
FROM    FoldersCTE  
OPTION (MAXRECURSION 1000) --> how many nested levels you think you will have

这会产生:

FolderID    Path
1           Documents
2           Documents\Finance
3           Documents\HumanResources
4           Documents\HumanResources\Training

希望对您有所帮助。