ROWS UNBOUNDED PRECEDING 在 Teradata 中的用途是什么？

Question

我刚刚开始使用 Teradata，我在 Teradata 中遇到了一个名为 "Rows unbounded preceding" 的有序分析函数。我尝试了几个站点来了解该功能，但它们都使用了一个复杂的示例来解释相同的功能。你能给我一个简单的例子，这样我就可以清楚地了解基础知识吗？

Answer 1

它是 window 函数的 "frame" 或 "range" 子句，它们是 SQL 标准的一部分，并在包括 Teradata 在内的许多数据库中实现。

一个简单的例子是计算三天内的平均金额。我在示例中使用 PostgreSQL 语法，但对于 Teradata 来说是相同的：

WITH data (t, a) AS (
  VALUES(1, 1),
        (2, 5),
        (3, 3),
        (4, 5),
        (5, 4),
        (6, 11)
)
SELECT t, a, avg(a) OVER (ORDER BY t ROWS BETWEEN 1 PRECEDING AND 1 FOLLOWING)
FROM data
ORDER BY t

... 产生：

t  a  avg
----------
1  1  3.00
2  5  3.00
3  3  4.33
4  5  4.00
5  4  6.67
6 11  7.50

如您所见，每个平均值都是计算 "over" 一个有序帧，由上一行 (1 preceding) 和后续行之间的范围组成行 (1 following).

当你写ROWS UNBOUNDED PRECEDING时，框架的下界就是无限的。这在计算总和时很有用（即 "running totals"），例如：

WITH data (t, a) AS (
  VALUES(1, 1),
        (2, 5),
        (3, 3),
        (4, 5),
        (5, 4),
        (6, 11)
)
SELECT t, a, sum(a) OVER (ORDER BY t ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW)
FROM data
ORDER BY t

屈服...

Here's another very good explanations of SQL window functions.

Answer 2

ROWS UNBOUNDED PRECEDING 不是特定于 Teradata 的语法，它是标准 SQL。它与 ORDER BY 一起定义计算结果的 window。

从逻辑上讲，基于起始行和第一个行之间的所有行，为分区中的每一行新计算一个窗口聚合函数结束行。

开始行和结束行可能是固定的或相对于当前行基于以下关键字：

CURRENT ROW，当前行
UNBOUNDED PRECEDING，当前行之前的所有行 -> 固定
UNBOUNDED FOLLOWING，当前行之后的所有行 -> 固定
x PRECEDING，当前行之前的 x 行 -> relative
y FOLLOWING，当前行之后的 y 行 -> 相对

可能的计算类型包括：

起始行和结束行都是固定的，window由分区的所有行组成，例如组总和，即聚合加详细信息行
一端固定，另一端相对于当前行，行数增加或减少，例如a 运行总计，剩余总和
起始行和结束行是相对于当前行的，window内的行数是固定的，例如n 行

所以 SUM(x) OVER (ORDER BY col ROWS UNBOUNDED PRECEDING) 结果是 累积总和 或 运行总计

11 -> 11
 2 -> 11 +  2                = 13
 3 -> 13 +  3 (or 11+2+3)    = 16
44 -> 16 + 44 (or 11+2+3+44) = 60

ROWS UNBOUNDED PRECEDING 在 Teradata 中的用途是什么？

What is ROWS UNBOUNDED PRECEDING used for in Teradata?

sql

analytic-functions

teradata

window-functions