根据另一列中的更改创建带有时间戳的最后修改列

Create last modified column with timestamp based on change in another column

我想添加一个新列来指示另一列的最后修改日期。就我而言,我有在特定时间(例如 5/1/19)启动并具有特定状态的项目。在某些情况下,项目可能会更改其状态(已取消或已停止)。每天早上拍摄快照,在这种情况下可用于跟踪最后修改日期。

有不同的项目(ID、名称)和不同类型的状态。

目前:

project_ID    Name    Status     Date    
1             ABC     Cancelled  1/4/20
1             ABC     Cancelled  1/3/20
1             ABC     Continued  1/2/20
1             ABC     Continued  1/1/20
..            ...     .........  ......
1             ABC     Continued  5/1/19

我想实现以下目标table:

project_ID    Name    Status     Date    LastModified
1             ABC     Cancelled  1/4/20  1/3/20
1             ABC     Cancelled  1/3/20  1/3/20
1             ABC     Continued  1/2/20  5/1/19
1             ABC     Continued  1/1/20  5/1/19
..            ...     .........  ......  ......
1             ABC     Continued  5/1/19  5/1/19

这是一种 gaps-and-island 问题,您要在其中确定每个岛的起点。您每天有一个记录这一事实稍微简化了解决方案:我会使用 row_number() 和日期算法来定义相邻记录组,然后 window 分钟来获取每组的第一个日期.

select t.*, 
    min(date) over(partition by project_id, status, date - rn * interval '1 day') last_modified
from (
    select t.*, row_number() over(partition by project_id, status order by date) rn
    from mytable t
) t
order by project_id, date

Demo on DB Fiddle

您也可以使用 lag() 和累积最大值来解决此问题:

select t.*,
       max(date) filter (where prev_status is distinct from status) over (partition by project_id, name order by date) as last_change_date 
from (select t.*,
             lag(status) over (partition by project_id, name order by date) as prev_status
      from t
     ) t;

子查询计算以前的状态,以识别任何变化。然后,外部查询采用检测到状态更改的日期中的最大值。

这种方法的一个优点(或者可能是缺点?)是,如果任何快照日期丢失,它是可靠的。任何此类差距都会被忽略。

我能够使用@Philipp Johannis 建议的查询解决问题。

这里我用了 MIN 而不是 MAX:

SELECT project_id,
       status,
       date,
       MIN(date)OVER(PARTITION BY project_id, status) AS LastModified
FROM TableABC
ORDER BY date DESC

我无法正确得到 运行 的其他两个答案,而且这个解决方案似乎更容易阅读和理解,这就是为什么我将突出显示这个解决方案。