如何替换 SQL 服务器中 2 个特定字符之间的任何内容
How to replace anything between 2 specific characters in SQL Server
我正在尝试替换包含这 2 个字符的倍数的字符串中 2 个特定字符之间的任何内容。取为csv格式。
这是我在该字段中获得的数据示例:
0001, ABCD1234;0002, EFGH432562;0003, IJKL1345hsth;...
我需要从中检索的是“,”之前的所有部分,而不是“,”和“;”之间的部分
我试过那些公式但没有成功
SELECT REPLACE(fieldname, ',[A-Z];', ' ') FROM ...
or
SELECT REPLACE(fieldname, ',*;', ' ') FROM ...
我需要
0001 0002 0003
有办法实现吗?
您可以 CROSS APPLY
到使用 STRING_AGG (自 Sql Server 2017 起) 来粘贴数字的 STRING_SPLIT
回到一起。
select id, codes
from your_table
cross apply (
select string_agg(left(value, patindex('%_,%', value)), ' ') as codes
from string_split(fieldname, ';') s
where value like '%_,%'
) ca;
GO
id
codes
1
0001 0002 0003
演示 db<>fiddle here
额外
这是一个也适用于 Sql Server 2014 的版本。
灵感来自@AaronBertrand
的研究
UDF 使用递归 CTE 来拆分字符串。
FOR XML
技巧用于将数字粘在一起。
CREATE FUNCTION dbo.fnString_Split
(
@str nvarchar(4000),
@delim nchar(1)
)
RETURNS TABLE
WITH SCHEMABINDING
AS
RETURN
(
WITH RCTE AS (
SELECT
1 AS ordinal
, ISNULL(NULLIF(CHARINDEX(@delim, @str),0), LEN(@str)) AS pos
, LEFT(@str, ISNULL(NULLIF(CHARINDEX(@delim, @str),0)-1, LEN(@str))) AS value
UNION ALL
SELECT
ordinal+1
, ISNULL(NULLIF(CHARINDEX(@delim, @str, pos+1), 0), LEN(@str))
, SUBSTRING(@str, pos+1, ISNULL(NULLIF(CHARINDEX(@delim, @str, pos+1),0)-pos-1, LEN(@str)-pos ))
FROM RCTE
WHERE pos < LEN(@str)
)
SELECT ordinal, value
FROM RCTE
);
SELECT id, codes
FROM your_table
CROSS APPLY (
SELECT RTRIM((
SELECT LEFT(value, PATINDEX('%_,%', value))+' '
FROM dbo.fnString_Split(fieldname, ';') AS spl
WHERE value LIKE '%_,%'
ORDER BY ordinal
FOR XML PATH(''), TYPE).value(N'./text()[1]', N'nvarchar(max)')
) AS codes
) ca
OPTION (MAXRECURSION 250);
id
codes
1
0001 0002 0003
演示 db<>fiddle here
UDF 的替代版本(无递归)
CREATE FUNCTION dbo.fnString_Split
(
@str NVARCHAR(4000),
@delim NCHAR(1)
)
RETURNS @tbl TABLE (ordinal INT, value NVARCHAR(4000))
WITH SCHEMABINDING
AS
BEGIN
DECLARE @value NVARCHAR(4000)
, @pos INT = 0
, @ordinal INT = 0;
WHILE (LEN(@str) > 0)
BEGIN
SET @ordinal += 1;
SET @pos = ISNULL(NULLIF(CHARINDEX(@delim, @str),0), LEN(@str)+1);
SET @value = LEFT(@str, @pos-1);
SET @str = SUBSTRING(@str, @pos+1, LEN(@str));
INSERT INTO @tbl (ordinal, value)
VALUES (@ordinal, @value);
END;
RETURN;
END;
如果您使用的是 SQL Server 2017 并且 不需要保证订单将得到维护,那么 就足够了.
但是,如果您:
- 关心订单保证;或者,
- 使用的是比 2017 更旧的版本(并且无法使用
STRING_AGG
);或者,
- 使用比 2016 更旧的版本,或者处于更旧的兼容级别(并且不能使用
STRING_SPLIT
):
这是一个可以提供帮助的有序拆分函数(它又长又丑,但您只需创建一次):
CREATE FUNCTION dbo.SplitOrdered
(
@list nvarchar(max),
@delim nvarchar(10)
)
RETURNS TABLE
WITH SCHEMABINDING
AS
RETURN
(
WITH w(n) AS (SELECT 0 FROM (VALUES (0),(0),(0),(0)) w(n)),
k(n) AS (SELECT 0 FROM w a, w b),
r(n) AS (SELECT 0 FROM k a, k b, k c, k d, k e, k f, k g, k h),
p(n) AS (SELECT TOP (COALESCE(LEN(@list), 0))
ROW_NUMBER() OVER (ORDER BY @@SPID) -1 FROM r),
spots(p) AS
(
SELECT n FROM p
WHERE (SUBSTRING(@list, n, LEN(@delim + 'x') - 1) LIKE @delim OR n = 0)
),
parts(p,val) AS
(
SELECT p, SUBSTRING(@list, p + LEN(@delim + 'x') - 1,
LEAD(p, 1, 2147483647) OVER (ORDER BY p) - p - LEN(@delim))
FROM spots AS s
)
SELECT listpos = ROW_NUMBER() OVER (ORDER BY p),
Item = LTRIM(RTRIM(val))
FROM parts
);
那么查询可以变成:
;WITH x AS
(
SELECT id, listpos,
codes = LEFT(Item, COALESCE(NULLIF(CHARINDEX(',', Item),0),1)-1)
FROM dbo.your_table
CROSS APPLY dbo.SplitOrdered(fieldname, ';') AS c
)
SELECT id, codes = (
(SELECT x2.codes + ' '
FROM x AS x2
WHERE x2.id = x.id
ORDER BY x2.listpos
FOR XML PATH(''), TYPE).value(N'./text()[1]', N'nvarchar(max)')
)
FROM x GROUP BY id;
请注意,除了保证顺序和向后兼容(好吧,只支持这么多版本)之外,它还忽略了垃圾数据,例如尝试:
0001, ABCD1234;0002 but no comma
我正在尝试替换包含这 2 个字符的倍数的字符串中 2 个特定字符之间的任何内容。取为csv格式。
这是我在该字段中获得的数据示例:
0001, ABCD1234;0002, EFGH432562;0003, IJKL1345hsth;...
我需要从中检索的是“,”之前的所有部分,而不是“,”和“;”之间的部分
我试过那些公式但没有成功
SELECT REPLACE(fieldname, ',[A-Z];', ' ') FROM ...
or
SELECT REPLACE(fieldname, ',*;', ' ') FROM ...
我需要
0001 0002 0003
有办法实现吗?
您可以 CROSS APPLY
到使用 STRING_AGG (自 Sql Server 2017 起) 来粘贴数字的 STRING_SPLIT
回到一起。
select id, codes from your_table cross apply ( select string_agg(left(value, patindex('%_,%', value)), ' ') as codes from string_split(fieldname, ';') s where value like '%_,%' ) ca; GO
id | codes |
---|---|
1 | 0001 0002 0003 |
演示 db<>fiddle here
额外
这是一个也适用于 Sql Server 2014 的版本。
灵感来自@AaronBertrand
的研究
UDF 使用递归 CTE 来拆分字符串。
FOR XML
技巧用于将数字粘在一起。
CREATE FUNCTION dbo.fnString_Split ( @str nvarchar(4000), @delim nchar(1) ) RETURNS TABLE WITH SCHEMABINDING AS RETURN ( WITH RCTE AS ( SELECT 1 AS ordinal , ISNULL(NULLIF(CHARINDEX(@delim, @str),0), LEN(@str)) AS pos , LEFT(@str, ISNULL(NULLIF(CHARINDEX(@delim, @str),0)-1, LEN(@str))) AS value UNION ALL SELECT ordinal+1 , ISNULL(NULLIF(CHARINDEX(@delim, @str, pos+1), 0), LEN(@str)) , SUBSTRING(@str, pos+1, ISNULL(NULLIF(CHARINDEX(@delim, @str, pos+1),0)-pos-1, LEN(@str)-pos )) FROM RCTE WHERE pos < LEN(@str) ) SELECT ordinal, value FROM RCTE );
SELECT id, codes FROM your_table CROSS APPLY ( SELECT RTRIM(( SELECT LEFT(value, PATINDEX('%_,%', value))+' ' FROM dbo.fnString_Split(fieldname, ';') AS spl WHERE value LIKE '%_,%' ORDER BY ordinal FOR XML PATH(''), TYPE).value(N'./text()[1]', N'nvarchar(max)') ) AS codes ) ca OPTION (MAXRECURSION 250);
id | codes |
---|---|
1 | 0001 0002 0003 |
演示 db<>fiddle here
UDF 的替代版本(无递归)
CREATE FUNCTION dbo.fnString_Split
(
@str NVARCHAR(4000),
@delim NCHAR(1)
)
RETURNS @tbl TABLE (ordinal INT, value NVARCHAR(4000))
WITH SCHEMABINDING
AS
BEGIN
DECLARE @value NVARCHAR(4000)
, @pos INT = 0
, @ordinal INT = 0;
WHILE (LEN(@str) > 0)
BEGIN
SET @ordinal += 1;
SET @pos = ISNULL(NULLIF(CHARINDEX(@delim, @str),0), LEN(@str)+1);
SET @value = LEFT(@str, @pos-1);
SET @str = SUBSTRING(@str, @pos+1, LEN(@str));
INSERT INTO @tbl (ordinal, value)
VALUES (@ordinal, @value);
END;
RETURN;
END;
如果您使用的是 SQL Server 2017 并且 不需要保证订单将得到维护,那么
但是,如果您:
- 关心订单保证;或者,
- 使用的是比 2017 更旧的版本(并且无法使用
STRING_AGG
);或者, - 使用比 2016 更旧的版本,或者处于更旧的兼容级别(并且不能使用
STRING_SPLIT
):
这是一个可以提供帮助的有序拆分函数(它又长又丑,但您只需创建一次):
CREATE FUNCTION dbo.SplitOrdered
(
@list nvarchar(max),
@delim nvarchar(10)
)
RETURNS TABLE
WITH SCHEMABINDING
AS
RETURN
(
WITH w(n) AS (SELECT 0 FROM (VALUES (0),(0),(0),(0)) w(n)),
k(n) AS (SELECT 0 FROM w a, w b),
r(n) AS (SELECT 0 FROM k a, k b, k c, k d, k e, k f, k g, k h),
p(n) AS (SELECT TOP (COALESCE(LEN(@list), 0))
ROW_NUMBER() OVER (ORDER BY @@SPID) -1 FROM r),
spots(p) AS
(
SELECT n FROM p
WHERE (SUBSTRING(@list, n, LEN(@delim + 'x') - 1) LIKE @delim OR n = 0)
),
parts(p,val) AS
(
SELECT p, SUBSTRING(@list, p + LEN(@delim + 'x') - 1,
LEAD(p, 1, 2147483647) OVER (ORDER BY p) - p - LEN(@delim))
FROM spots AS s
)
SELECT listpos = ROW_NUMBER() OVER (ORDER BY p),
Item = LTRIM(RTRIM(val))
FROM parts
);
那么查询可以变成:
;WITH x AS
(
SELECT id, listpos,
codes = LEFT(Item, COALESCE(NULLIF(CHARINDEX(',', Item),0),1)-1)
FROM dbo.your_table
CROSS APPLY dbo.SplitOrdered(fieldname, ';') AS c
)
SELECT id, codes = (
(SELECT x2.codes + ' '
FROM x AS x2
WHERE x2.id = x.id
ORDER BY x2.listpos
FOR XML PATH(''), TYPE).value(N'./text()[1]', N'nvarchar(max)')
)
FROM x GROUP BY id;
请注意,除了保证顺序和向后兼容(好吧,只支持这么多版本)之外,它还忽略了垃圾数据,例如尝试:
0001, ABCD1234;0002 but no comma