WM_CONCAT 删除重复项

WM_CONCAT duplicates removal

我有一个 table 如下所示。

   colA       colB
   12345      NHS,CDE,BCD
   12345      NHS,ABC,DEF

需要按以下格式显示数据

   colA       colB
   12345      NHS,ABC,BCD,CDE,DEF

我需要通用的解决方案来删除重复的 NHS,它排在前面,然后将剩余的单词按字母顺序排列。

首先,永远不要使用 WM_CONCAT,因为它没有文档并且在最新版本 12c 中不再可用。参见 Why not use WM_CONCAT function in Oracle? and Why does the wm_concat not work here?

由于您使用的是 11g,因此您可以使用 LISTAGG

以下查询执行以下操作:

  1. Split the comma delimited string into rows.
  2. 使用 LISTAGG.
  3. 应用字符串聚合
  4. CASE 表达式来处理自定义排序。

例如,

SQL> WITH DATA AS(
  2      SELECT 12345 colA, 'NHS,CDE,BCD' colB FROM dual UNION ALL
  3      SELECT 12345 colA, 'NHS,ABC,DEF' colB FROM dual
  4      )
  5  SELECT cola,
  6    listagg(colb, ',') WITHIN GROUP(
  7  ORDER BY
  8    CASE colb
  9      WHEN 'NHS'
 10      THEN 1
 11      ELSE 2
 12    END, colb) colb
 13  FROM
 14    (SELECT DISTINCT cola,
 15      trim(regexp_substr(colb, '[^,]+', 1, LEVEL)) colb
 16    FROM DATA
 17      CONNECT BY LEVEL <= regexp_count(colb, ',')+1
 18    ORDER BY colb
 19    )
 20  GROUP BY cola
 21  /

      COLA COLB
---------- ------------------------------
     12345 NHS,ABC,BCD,CDE,DEF

Edit 正如@AlexPoole 指出的那样,缺少显式排序,之前的查询(查看编辑历史记录)依赖于值的不同排序。

WITH t AS
  (SELECT col1,wm_concat(col2) AS col2 FROM test1 GROUP BY col1
  ) , t1 AS
  ( SELECT DISTINCT col1, regexp_substr(col2, '[^,]+', 1, rownum) names
  FROM t
    CONNECT BY rownum <= LENGTH(regexp_replace(col2, '[^,]'))+1
  ORDER BY names
  )
SELECT col1,wm_concat(names) AS names FROM t1 GROUP BY col1