如何使用 regexExtract() 提取数据流中的指定值
how to use regexExtract() extract spcified values in dataflow
源数据如照片。我是数据流和表达语言的新手。我想知道如何使用 regexExtract()(或任何其他表达式函数)仅提取流派的名称。
预期的输出应该是:
动画
喜剧
家庭
冒险
幻想
...
谢谢!
您可以使用此表达式 split(split(genres,"'name':'")[2],"'")[1]
来实现此目的。
我创建了一个包含您的样本数据的 csv 文件。
在 DerivedColumn 转换中使用上面的表达式并获得您的期望值。
源数据如照片。我是数据流和表达语言的新手。我想知道如何使用 regexExtract()(或任何其他表达式函数)仅提取流派的名称。
预期的输出应该是:
动画
喜剧
家庭
冒险
幻想
...
谢谢!
您可以使用此表达式 split(split(genres,"'name':'")[2],"'")[1]
来实现此目的。
我创建了一个包含您的样本数据的 csv 文件。
在 DerivedColumn 转换中使用上面的表达式并获得您的期望值。