SQL - 具有多个 WHERE 和 GROUP BY 的 RANK()
SQL - RANK() with multiple WHERE and GROUP BY
我有一个 table 用户 ID 和 date_accessed。 (每个用户 ID 有多个日期,但每个日期的数量不同。)
数据如下所示:
userid | date_accessed
A. | 2019-01-01
B. | 2019-01-02
A. | 2019-01-03
A. | 2019-01-04
B. | 2019-01-04
数据库中还有许多其他列,但我没有使用它们,但基本上每一行都有一行代表每个用户每天执行的操作。
我想订购 table 以便它按用户 ID 分区,每个用户 ID 的 date_accessed 按时间顺序排列。
userid | date_accessed | rank
A. | 2019-01-01 | 1
A. | 2019-01-03 | 2
A. | 2019-01-04 | 3
B. | 2019-01-02 | 1
B. | 2019-01-04 | 2
我的查询是:
WITH a AS (
SELECT
userid
FROM table_1
WHERE
date_accessed <= '2019-01-01'
AND date_accessed >= '2019-01-10'
HAVING
COUNT(DISTINCT date_accessed) > 1
)
SELECT
userid,
date_accessed,
RANK() OVER (
PARTITION BY userid
ORDER BY date_accessed ASC)
FROM table_1
WHERE
userid IN (SELECT * FROM a)
AND date_accessed <= '2019-01-01'
AND date_accessed >= '2019-01-10'
GROUP BY userid, date_accessed
日期范围(date_1 和 date_2)涵盖 10 天。相反,我的查询只是 listing/ranking 每个用户 ID 的所有 10 天,即使并非所有用户 ID 都应该为每个日期都有相应的条目。即它看起来像这样:
userid | date_accessed | rank
A. | 2019-01-01 | 1
A. | 2019-01-02 | 2
A. | 2019-01-03 | 3
A. | 2019-01-04 | 4
A. | 2019-01-05 | 5
...
A. | 2019-01-10 | 10
B. | 2019-01-01 | 1
B. | 2019-01-02 | 2
等等。
我认为问题可能出在我的 GROUP BY 上,但如果没有 GROUP BY,查询就不会 运行 — 我需要以某种方式嵌套我的 RANK() 吗?
我做错了什么?
您是否尝试过 ROW_NUMBER 而不是 RANK?
GROUP BY 的目的是什么?
试试这个:
;WITH a as
(SELECT
userid,
date_accessed,
ROW_NUMBER() OVER ( PARTITION BY userid ORDER BY date_accessed ASC) AS rnk
FROM table
WHERE
userid IN ( SELECT * FROM other_table )
AND date_accessed <= 'date_1'
AND date_accessed >= 'date_2'
)
SELECT userid, date_accessed, rnk
from a
GROUP BY userid, date_accessed
使用 CTE 将 return 每个 user_id
和 date_accessed
的不同行过滤为您想要的日期,然后使用 ROW_NUMBER()
获得排名:
WITH cte AS (
SELECT DISTINCT userid, date_accessed
FROM table_1
WHERE date_accessed >= '2019-01-01' AND date_accessed <= '2019-01-10'
)
SELECT userid, date_accessed,
ROW_NUMBER() OVER (PARTITION BY userid ORDER BY date_accessed ASC) `rank`
FROM cte
查看简化版 demo。
我有一个 table 用户 ID 和 date_accessed。 (每个用户 ID 有多个日期,但每个日期的数量不同。)
数据如下所示:
userid | date_accessed
A. | 2019-01-01
B. | 2019-01-02
A. | 2019-01-03
A. | 2019-01-04
B. | 2019-01-04
数据库中还有许多其他列,但我没有使用它们,但基本上每一行都有一行代表每个用户每天执行的操作。
我想订购 table 以便它按用户 ID 分区,每个用户 ID 的 date_accessed 按时间顺序排列。
userid | date_accessed | rank
A. | 2019-01-01 | 1
A. | 2019-01-03 | 2
A. | 2019-01-04 | 3
B. | 2019-01-02 | 1
B. | 2019-01-04 | 2
我的查询是:
WITH a AS (
SELECT
userid
FROM table_1
WHERE
date_accessed <= '2019-01-01'
AND date_accessed >= '2019-01-10'
HAVING
COUNT(DISTINCT date_accessed) > 1
)
SELECT
userid,
date_accessed,
RANK() OVER (
PARTITION BY userid
ORDER BY date_accessed ASC)
FROM table_1
WHERE
userid IN (SELECT * FROM a)
AND date_accessed <= '2019-01-01'
AND date_accessed >= '2019-01-10'
GROUP BY userid, date_accessed
日期范围(date_1 和 date_2)涵盖 10 天。相反,我的查询只是 listing/ranking 每个用户 ID 的所有 10 天,即使并非所有用户 ID 都应该为每个日期都有相应的条目。即它看起来像这样:
userid | date_accessed | rank
A. | 2019-01-01 | 1
A. | 2019-01-02 | 2
A. | 2019-01-03 | 3
A. | 2019-01-04 | 4
A. | 2019-01-05 | 5
...
A. | 2019-01-10 | 10
B. | 2019-01-01 | 1
B. | 2019-01-02 | 2
等等。
我认为问题可能出在我的 GROUP BY 上,但如果没有 GROUP BY,查询就不会 运行 — 我需要以某种方式嵌套我的 RANK() 吗?
我做错了什么?
您是否尝试过 ROW_NUMBER 而不是 RANK? GROUP BY 的目的是什么?
试试这个:
;WITH a as
(SELECT
userid,
date_accessed,
ROW_NUMBER() OVER ( PARTITION BY userid ORDER BY date_accessed ASC) AS rnk
FROM table
WHERE
userid IN ( SELECT * FROM other_table )
AND date_accessed <= 'date_1'
AND date_accessed >= 'date_2'
)
SELECT userid, date_accessed, rnk
from a
GROUP BY userid, date_accessed
使用 CTE 将 return 每个 user_id
和 date_accessed
的不同行过滤为您想要的日期,然后使用 ROW_NUMBER()
获得排名:
WITH cte AS (
SELECT DISTINCT userid, date_accessed
FROM table_1
WHERE date_accessed >= '2019-01-01' AND date_accessed <= '2019-01-10'
)
SELECT userid, date_accessed,
ROW_NUMBER() OVER (PARTITION BY userid ORDER BY date_accessed ASC) `rank`
FROM cte
查看简化版 demo。