Teradata REGEX 或 SUBSTR 删除两个 * 和星号之间的文本？

Question

我在 teradata 中使用一个数据集，该数据集多次出现以下格式的数据：

*6A*H.ORTHO I
*4A*IMP
*16A*T.IMPLANTS
*2A*HIMPLANTS
*9A*IMP
*5A*F.IMPLANT
*6A*DIMP
*4A*TISSUE
*5A*KIMP
*7A*IMP
*10A*D.IMP
*3A*W.LSH
*10A*IMP
*16A*IMP
*22A*T.IMPLANTS

在上面的数据集中，我试图在第二次出现星号后提取所有内容。 IE。 D.IMP、IMP、T.IMPLANTS、F.IMPLANT 等..

我尝试使用 SUBSTR 并接近使用：

SUBSTR(TRIM(FSS.Surgical_Inventory_Code),1,
                    INDEX(TRIM(FSS.Surgical_Inventory_Code),'*')-1)

但是，那只有returns第一个*.

之后的数据

我认为解决问题的最佳方法是使用 REGEX 表达式或 SUBSTR。 teradata 中有一个名为 REGEXP_SUBSTR 的函数。我不确定如何创建 REGEX 语句来解决我的问题。

Answer 1

如果您的字符串中只有 2 个星号，您可以使用 STRTOK：

strtok(<source string>,'*',2)

Teradata REGEX 或 SUBSTR 删除两个 * 和星号之间的文本？

Teradata REGEX or SUBSTR to remove the text between two *'s and the asterisk?

regex

substr

teradata

teradata-sql-assistant