如何在 Postgres 9.4 中忽略没有唯一约束的重复项?

How to ignore duplicates without unique constraint in Postgres 9.4?

我目前在我们的旧数据库 (postgres 9.4) table 中遇到一个问题,其中包含一些重复的行。我想确保不再生成重复行。

但我还想保留已经生成的重复行。因此,我无法对这些列(多列)应用唯一约束。

我创建了一个触发器,它会检查该行是否已存在并相应地引发异常。但是在处理并发事务时它也会失败。

示例:

TAB1

col1   |  col2  |  col3  |
------------------------------------
1      |  A     |  B     |   -- 
2      |  A     |  B     |   -- already present duplicates for column col2 and col3(allowed)
3      |  C     |  D     |

INSERT INTO TAB1 VALUES(4 , 'A' , 'B') ; -- This insert statement will not be allowed.

注意:由于数据库版本较旧,我无法使用冲突

您可以尝试创建一个 partial index 以仅对 table 行的子集具有唯一约束:

例如:

create unique index on t(x) where (d > '2020-01-01');

据推测,您不希望新行重复历史行。如果是这样,您可以这样做,但它需要修改 table 并添加一个新列。

alter table t add duplicate_seq int default 1;

然后更新此列以识别现有的重复项:

update t
    set duplicate_seq = seqnum
    from (select t.*, row_number() over (partition by col order by col) as seqnum
          from t
         ) tt
    where t.<primary key> = tt.<primary key>;

现在,创建唯一索引或约束:

alter table t add constraint unq_t_col_seq on t(col, duplicate_seq);

当您插入行时,不要为 duplicate_seq 提供值。默认值为 1。这将与任何现有值或最近输入的重复项发生冲突。历史重复将被允许。