关于 Regexp_replace - Oracle SQL
Regarding Regexp_replace - Oracle SQL
我正在使用以下查询将值 2 替换为 5。我的输入字符串的格式如下所示。每个值将用胡萝卜 (^) 符号分隔。当没有重复值时它工作正常。但是对于重复值,它不起作用。请指教
select regexp_replace('1^2^2222^2','(^|\^)2(\^|$)','') OUTPUT from dual;
输出:
1^5^2222^5 ( Working Fine as there is no consecutive duplicates at the starting or at the end)
.
select regexp_replace('2^2^2222^2^2','(^|\^)2(\^|$)','') OUTPUT from dual;
输出:
5^2^^5^2222^5^2(Not working as there is consecutive duplicate at the starting/end)
请告诉我如何更正此问题?
问题
问题是搜索字符串的第二个相邻出现不匹配。这是因为正则表达式的第一部分:
(^|\^)2(\^|$)
^
-- this is not matched when the text preceding "2" is a replaced string
解决方案
解决问题的一种方法是连续 运行 正则表达式两次:
SELECT REGEXP_REPLACE (tmpRes, '(^|\^)2(\^|$)', '') OUTPUT
FROM (
-- first pass of replacement
SELECT REGEXP_REPLACE ('2^2^2222^2^2', '(^|\^)2(\^|$)', '') tmpRes
FROM DUAL
)
-- OUTPUT: 5^5^2222^5^5
为什么不起作用:
当正则表达式解析字符串 2^2^2222^2^2
时,它将匹配字符串的开头,然后匹配 2^
并将其替换为 5^
。然后它将尝试从该匹配之后继续以生成更多匹配 - 字符串的下一部分是 2^
但是它不会匹配,因为它不在字符串的开头并且没有前导 ^
.
相反,您可以将字符串(使用 ^
作为分隔符)拆分为一个集合,然后对集合中的每个项目进行替换,然后将集合重新连接成一个集合细绳。这可以通过 来完成,但实现一个简单的函数会使生成的查询更易于阅读。
Oracle 设置:
CREATE TYPE VARCHAR2_TABLE AS TABLE OF VARCHAR2(4000);
/
CREATE OR REPLACE FUNCTION split_String(
i_str IN VARCHAR2,
i_delim IN VARCHAR2 DEFAULT ','
) RETURN VARCHAR2_TABLE DETERMINISTIC
AS
p_result VARCHAR2_TABLE := VARCHAR2_TABLE();
p_start NUMBER(5) := 1;
p_end NUMBER(5);
c_len CONSTANT NUMBER(5) := LENGTH( i_str );
c_ld CONSTANT NUMBER(5) := LENGTH( i_delim );
BEGIN
IF c_len > 0 THEN
p_end := INSTR( i_str, i_delim, p_start );
WHILE p_end > 0 LOOP
p_result.EXTEND;
p_result( p_result.COUNT ) := SUBSTR( i_str, p_start, p_end - p_start );
p_start := p_end + c_ld;
p_end := INSTR( i_str, i_delim, p_start );
END LOOP;
IF p_start <= c_len + 1 THEN
p_result.EXTEND;
p_result( p_result.COUNT ) := SUBSTR( i_str, p_start, c_len - p_start + 1 );
END IF;
END IF;
RETURN p_result;
END;
/
查询:
SELECT LISTAGG( CASE COLUMN_VALUE WHEN '2' THEN '5' ELSE COLUMN_VALUE END, '^' )
WITHIN GROUP ( ORDER BY ROWNUM )
FROM TABLE( split_String( '2^2^2222^2^2', '^' ) );
输出:
5^5^2222^5^5
正如其他人所说,问题是终止分隔符插入符与第一次出现匹配,因此它不会被视为下一个实例的开始分隔符。
如果您不想使用嵌套的正则表达式调用,您可以使用简单的替换来加倍分隔符,然后再去掉它们:
replace(
regexp_replace(
replace(<value>, '^', '^^'), '(^|\^)2(\^|$)',''), '^^', '^')
内部替换将你的值变成 2^^2^^2222^^2^^2
,所以在第一次出现匹配后,仍然有一个插入符号作为第二个实例的开始定界符,等等。外部替换只是去掉那些加倍的-up 分隔符变回单个分隔符。
带有一些示例字符串:
with t (input) as (
select '1^2^2222^2' from dual
union all select '2^2^2222^2^2' from dual
union all select '2^2^2222^2^^2^2' from dual
)
select input,
replace(
regexp_replace(
replace(input, '^', '^^'), '(^|\^)2(\^|$)',''), '^^', '^') as output
from t;
INPUT OUTPUT
--------------- --------------------
1^2^2222^2 1^5^2222^5
2^2^2222^2^2 5^5^2222^5^5
2^2^2222^2^^2^2 5^5^2222^5^^5^5
我正在使用以下查询将值 2 替换为 5。我的输入字符串的格式如下所示。每个值将用胡萝卜 (^) 符号分隔。当没有重复值时它工作正常。但是对于重复值,它不起作用。请指教
select regexp_replace('1^2^2222^2','(^|\^)2(\^|$)','') OUTPUT from dual;
输出:
1^5^2222^5 ( Working Fine as there is no consecutive duplicates at the starting or at the end)
.
select regexp_replace('2^2^2222^2^2','(^|\^)2(\^|$)','') OUTPUT from dual;
输出:
5^2^^5^2222^5^2(Not working as there is consecutive duplicate at the starting/end)
请告诉我如何更正此问题?
问题
问题是搜索字符串的第二个相邻出现不匹配。这是因为正则表达式的第一部分:
(^|\^)2(\^|$)
^
-- this is not matched when the text preceding "2" is a replaced string
解决方案
解决问题的一种方法是连续 运行 正则表达式两次:
SELECT REGEXP_REPLACE (tmpRes, '(^|\^)2(\^|$)', '') OUTPUT
FROM (
-- first pass of replacement
SELECT REGEXP_REPLACE ('2^2^2222^2^2', '(^|\^)2(\^|$)', '') tmpRes
FROM DUAL
)
-- OUTPUT: 5^5^2222^5^5
为什么不起作用:
当正则表达式解析字符串 2^2^2222^2^2
时,它将匹配字符串的开头,然后匹配 2^
并将其替换为 5^
。然后它将尝试从该匹配之后继续以生成更多匹配 - 字符串的下一部分是 2^
但是它不会匹配,因为它不在字符串的开头并且没有前导 ^
.
相反,您可以将字符串(使用 ^
作为分隔符)拆分为一个集合,然后对集合中的每个项目进行替换,然后将集合重新连接成一个集合细绳。这可以通过
Oracle 设置:
CREATE TYPE VARCHAR2_TABLE AS TABLE OF VARCHAR2(4000);
/
CREATE OR REPLACE FUNCTION split_String(
i_str IN VARCHAR2,
i_delim IN VARCHAR2 DEFAULT ','
) RETURN VARCHAR2_TABLE DETERMINISTIC
AS
p_result VARCHAR2_TABLE := VARCHAR2_TABLE();
p_start NUMBER(5) := 1;
p_end NUMBER(5);
c_len CONSTANT NUMBER(5) := LENGTH( i_str );
c_ld CONSTANT NUMBER(5) := LENGTH( i_delim );
BEGIN
IF c_len > 0 THEN
p_end := INSTR( i_str, i_delim, p_start );
WHILE p_end > 0 LOOP
p_result.EXTEND;
p_result( p_result.COUNT ) := SUBSTR( i_str, p_start, p_end - p_start );
p_start := p_end + c_ld;
p_end := INSTR( i_str, i_delim, p_start );
END LOOP;
IF p_start <= c_len + 1 THEN
p_result.EXTEND;
p_result( p_result.COUNT ) := SUBSTR( i_str, p_start, c_len - p_start + 1 );
END IF;
END IF;
RETURN p_result;
END;
/
查询:
SELECT LISTAGG( CASE COLUMN_VALUE WHEN '2' THEN '5' ELSE COLUMN_VALUE END, '^' )
WITHIN GROUP ( ORDER BY ROWNUM )
FROM TABLE( split_String( '2^2^2222^2^2', '^' ) );
输出:
5^5^2222^5^5
正如其他人所说,问题是终止分隔符插入符与第一次出现匹配,因此它不会被视为下一个实例的开始分隔符。
如果您不想使用嵌套的正则表达式调用,您可以使用简单的替换来加倍分隔符,然后再去掉它们:
replace(
regexp_replace(
replace(<value>, '^', '^^'), '(^|\^)2(\^|$)',''), '^^', '^')
内部替换将你的值变成 2^^2^^2222^^2^^2
,所以在第一次出现匹配后,仍然有一个插入符号作为第二个实例的开始定界符,等等。外部替换只是去掉那些加倍的-up 分隔符变回单个分隔符。
带有一些示例字符串:
with t (input) as (
select '1^2^2222^2' from dual
union all select '2^2^2222^2^2' from dual
union all select '2^2^2222^2^^2^2' from dual
)
select input,
replace(
regexp_replace(
replace(input, '^', '^^'), '(^|\^)2(\^|$)',''), '^^', '^') as output
from t;
INPUT OUTPUT
--------------- --------------------
1^2^2222^2 1^5^2222^5
2^2^2222^2^2 5^5^2222^5^5
2^2^2222^2^^2^2 5^5^2222^5^^5^5