ROWS UNBOUNDED PRECEDING 在 Teradata 中的用途是什么?
What is ROWS UNBOUNDED PRECEDING used for in Teradata?
我刚刚开始使用 Teradata,我在 Teradata 中遇到了一个名为 "Rows unbounded preceding" 的有序分析函数。我尝试了几个站点来了解该功能,但它们都使用了一个复杂的示例来解释相同的功能。
你能给我一个简单的例子,这样我就可以清楚地了解基础知识吗?
它是 window 函数的 "frame" 或 "range" 子句,它们是 SQL 标准的一部分,并在包括 Teradata 在内的许多数据库中实现。
一个简单的例子是计算三天内的平均金额。我在示例中使用 PostgreSQL 语法,但对于 Teradata 来说是相同的:
WITH data (t, a) AS (
VALUES(1, 1),
(2, 5),
(3, 3),
(4, 5),
(5, 4),
(6, 11)
)
SELECT t, a, avg(a) OVER (ORDER BY t ROWS BETWEEN 1 PRECEDING AND 1 FOLLOWING)
FROM data
ORDER BY t
... 产生:
t a avg
----------
1 1 3.00
2 5 3.00
3 3 4.33
4 5 4.00
5 4 6.67
6 11 7.50
如您所见,每个平均值都是计算 "over" 一个有序帧,由上一行 (1 preceding
) 和后续行之间的范围组成行 (1 following
).
当你写ROWS UNBOUNDED PRECEDING
时,框架的下界就是无限的。这在计算总和时很有用(即 "running totals"),例如:
WITH data (t, a) AS (
VALUES(1, 1),
(2, 5),
(3, 3),
(4, 5),
(5, 4),
(6, 11)
)
SELECT t, a, sum(a) OVER (ORDER BY t ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW)
FROM data
ORDER BY t
屈服...
t a sum
---------
1 1 1
2 5 6
3 3 9
4 5 14
5 4 18
6 11 29
Here's another very good explanations of SQL window functions.
ROWS UNBOUNDED PRECEDING
不是特定于 Teradata 的语法,它是标准 SQL。它与 ORDER BY
一起定义计算结果的 window。
从逻辑上讲,基于起始行和第一个行之间的所有行,为分区中的每一行新计算一个窗口聚合函数
结束行。
开始行和结束行可能是固定的或相对于
当前行基于以下关键字:
- CURRENT ROW,当前行
- UNBOUNDED PRECEDING,当前行之前的所有行 -> 固定
- UNBOUNDED FOLLOWING,当前行之后的所有行 -> 固定
- x PRECEDING,当前行之前的 x 行 -> relative
- y FOLLOWING,当前行之后的 y 行 -> 相对
可能的计算类型包括:
- 起始行和结束行都是固定的,window由分区的所有行组成,例如组总和,即聚合加详细信息行
- 一端固定,另一端相对于当前行,行数增加或减少,例如a 运行 总计,剩余总和
- 起始行和结束行是相对于当前行的,window内的行数是固定的,例如n 行
的移动平均线
所以 SUM(x) OVER (ORDER BY col ROWS UNBOUNDED PRECEDING)
结果是 累积总和 或 运行 总计
11 -> 11
2 -> 11 + 2 = 13
3 -> 13 + 3 (or 11+2+3) = 16
44 -> 16 + 44 (or 11+2+3+44) = 60
我刚刚开始使用 Teradata,我在 Teradata 中遇到了一个名为 "Rows unbounded preceding" 的有序分析函数。我尝试了几个站点来了解该功能,但它们都使用了一个复杂的示例来解释相同的功能。 你能给我一个简单的例子,这样我就可以清楚地了解基础知识吗?
它是 window 函数的 "frame" 或 "range" 子句,它们是 SQL 标准的一部分,并在包括 Teradata 在内的许多数据库中实现。
一个简单的例子是计算三天内的平均金额。我在示例中使用 PostgreSQL 语法,但对于 Teradata 来说是相同的:
WITH data (t, a) AS (
VALUES(1, 1),
(2, 5),
(3, 3),
(4, 5),
(5, 4),
(6, 11)
)
SELECT t, a, avg(a) OVER (ORDER BY t ROWS BETWEEN 1 PRECEDING AND 1 FOLLOWING)
FROM data
ORDER BY t
... 产生:
t a avg
----------
1 1 3.00
2 5 3.00
3 3 4.33
4 5 4.00
5 4 6.67
6 11 7.50
如您所见,每个平均值都是计算 "over" 一个有序帧,由上一行 (1 preceding
) 和后续行之间的范围组成行 (1 following
).
当你写ROWS UNBOUNDED PRECEDING
时,框架的下界就是无限的。这在计算总和时很有用(即 "running totals"),例如:
WITH data (t, a) AS (
VALUES(1, 1),
(2, 5),
(3, 3),
(4, 5),
(5, 4),
(6, 11)
)
SELECT t, a, sum(a) OVER (ORDER BY t ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW)
FROM data
ORDER BY t
屈服...
t a sum
---------
1 1 1
2 5 6
3 3 9
4 5 14
5 4 18
6 11 29
Here's another very good explanations of SQL window functions.
ROWS UNBOUNDED PRECEDING
不是特定于 Teradata 的语法,它是标准 SQL。它与 ORDER BY
一起定义计算结果的 window。
从逻辑上讲,基于起始行和第一个行之间的所有行,为分区中的每一行新计算一个窗口聚合函数 结束行。
开始行和结束行可能是固定的或相对于 当前行基于以下关键字:
- CURRENT ROW,当前行
- UNBOUNDED PRECEDING,当前行之前的所有行 -> 固定
- UNBOUNDED FOLLOWING,当前行之后的所有行 -> 固定
- x PRECEDING,当前行之前的 x 行 -> relative
- y FOLLOWING,当前行之后的 y 行 -> 相对
可能的计算类型包括:
- 起始行和结束行都是固定的,window由分区的所有行组成,例如组总和,即聚合加详细信息行
- 一端固定,另一端相对于当前行,行数增加或减少,例如a 运行 总计,剩余总和
- 起始行和结束行是相对于当前行的,window内的行数是固定的,例如n 行 的移动平均线
所以 SUM(x) OVER (ORDER BY col ROWS UNBOUNDED PRECEDING)
结果是 累积总和 或 运行 总计
11 -> 11
2 -> 11 + 2 = 13
3 -> 13 + 3 (or 11+2+3) = 16
44 -> 16 + 44 (or 11+2+3+44) = 60