Pentaho 勺子搜索并替换行中的特殊字符
Pentaho spoon search and replace especial character in rows
我有一个 MIME 类型为 US-ASCII 的 csv 文件,数据集中的一列如下所示:
id
V_name
210001
cha?ne des Puys
210030
M?los
213004
G?ll?
213021
S?phan
221110
Afd?ra
以此类推
我想将这些字符更改为:
id
V_name
210001
chaine des Puys
210030
Milos
213004
Gollu
213021
Suphan
221110
Afdera
问题是有 95 行这样的行,我该如何搜索和替换这些行?
我使用套件 PDI 勺子。
提前致谢。
正如@Iłya Bursov 所说,您正在阅读的源文件没有提供正确的字符,它提供了 ?在源代码中,所以如果你想更正它,你必须手动进行。
我认为这不值得,除非您知道随着时间的推移您将始终获得同一组 V_name 和不同的文件。在这种情况下,您可以创建一个文件,将源代码中的 V_name 与 ?字符到 V_name_corrected 并正确显示字符。这似乎是一个练习,所以我会让名字保持原样。在现实生活中,我会联系错误字符集文件的提供者,告诉他们需要更正文件的生成以提供文件中的正确字符。
我有一个 MIME 类型为 US-ASCII 的 csv 文件,数据集中的一列如下所示:
id | V_name |
---|---|
210001 | cha?ne des Puys |
210030 | M?los |
213004 | G?ll? |
213021 | S?phan |
221110 | Afd?ra |
以此类推
我想将这些字符更改为:
id | V_name |
---|---|
210001 | chaine des Puys |
210030 | Milos |
213004 | Gollu |
213021 | Suphan |
221110 | Afdera |
问题是有 95 行这样的行,我该如何搜索和替换这些行? 我使用套件 PDI 勺子。 提前致谢。
正如@Iłya Bursov 所说,您正在阅读的源文件没有提供正确的字符,它提供了 ?在源代码中,所以如果你想更正它,你必须手动进行。
我认为这不值得,除非您知道随着时间的推移您将始终获得同一组 V_name 和不同的文件。在这种情况下,您可以创建一个文件,将源代码中的 V_name 与 ?字符到 V_name_corrected 并正确显示字符。这似乎是一个练习,所以我会让名字保持原样。在现实生活中,我会联系错误字符集文件的提供者,告诉他们需要更正文件的生成以提供文件中的正确字符。