SQL

Question

我有一个 table 用户 ID 和 date_accessed。（每个用户 ID 有多个日期，但每个日期的数量不同。）

数据如下所示：

userid | date_accessed
A.     | 2019-01-01
B.     | 2019-01-02
A.     | 2019-01-03
A.     | 2019-01-04
B.     | 2019-01-04

数据库中还有许多其他列，但我没有使用它们，但基本上每一行都有一行代表每个用户每天执行的操作。

我想订购 table 以便它按用户 ID 分区，每个用户 ID 的 date_accessed 按时间顺序排列。

userid | date_accessed | rank
A.     | 2019-01-01   | 1
A.     | 2019-01-03    | 2
A.     | 2019-01-04   | 3
B.     | 2019-01-02   | 1
B.     | 2019-01-04   | 2

我的查询是：

WITH a AS (
  SELECT
    userid
  FROM table_1
  WHERE 
    date_accessed <= '2019-01-01'
    AND date_accessed >= '2019-01-10'
  HAVING
    COUNT(DISTINCT date_accessed) > 1
)

SELECT
    userid,
    date_accessed,
    RANK() OVER (
      PARTITION BY userid
      ORDER BY date_accessed ASC)
FROM table_1
WHERE
    userid IN (SELECT * FROM a)
    AND date_accessed <= '2019-01-01'
    AND date_accessed >= '2019-01-10'
GROUP BY userid, date_accessed

日期范围（date_1 和 date_2）涵盖 10 天。相反，我的查询只是 listing/ranking 每个用户 ID 的所有 10 天，即使并非所有用户 ID 都应该为每个日期都有相应的条目。即它看起来像这样：

userid | date_accessed | rank
A.     | 2019-01-01   | 1
A.     | 2019-01-02   | 2
A.     | 2019-01-03   | 3
A.     | 2019-01-04   | 4
A.     | 2019-01-05   | 5
...
A.     | 2019-01-10   | 10
B.     | 2019-01-01   | 1
B.     | 2019-01-02   | 2

等等。

我认为问题可能出在我的 GROUP BY 上，但如果没有 GROUP BY，查询就不会运行 — 我需要以某种方式嵌套我的 RANK() 吗？

我做错了什么？

Answer 1

您是否尝试过 ROW_NUMBER 而不是 RANK？ GROUP BY 的目的是什么？

试试这个：

;WITH a as
(SELECT 
   userid,
   date_accessed,
   ROW_NUMBER() OVER ( PARTITION BY userid ORDER BY date_accessed ASC) AS rnk
FROM table
WHERE 
   userid IN ( SELECT * FROM other_table )
   AND date_accessed <= 'date_1'
   AND date_accessed >= 'date_2'
)
SELECT userid, date_accessed, rnk
from a
GROUP BY userid, date_accessed

Answer 2

使用 CTE 将 return 每个 user_id 和 date_accessed 的不同行过滤为您想要的日期，然后使用 ROW_NUMBER() 获得排名:

WITH cte AS (
  SELECT DISTINCT userid, date_accessed
  FROM table_1
  WHERE date_accessed >= '2019-01-01' AND date_accessed <= '2019-01-10'
)
SELECT userid, date_accessed,
    ROW_NUMBER() OVER (PARTITION BY userid ORDER BY date_accessed ASC) `rank`
FROM cte

查看简化版 demo。

SQL - 具有多个 WHERE 和 GROUP BY 的 RANK()

SQL - RANK() with multiple WHERE and GROUP BY

mysql

rank

presto

partition