需要去除 CSV 文件中的无效字符

Need to strip out invalid characters in CSV file

我正在从提供给我的 Microsoft SQL 数据库中生成一个 CSV 文件,但不知何故,整个文本中大约有两打地方存在无效字符(有数千行数据) .当我在我的文本编辑器中打开 CSV 文件时,它们显示为红色的倒置问号(在随附的屏幕截图中有两个)。

当我复制字符并在文本编辑器中查看 "find/replace" 对话框时,我看到了:

\x{0D}

...但我不知道那是什么意思。我需要修改生成 CSV 的脚本,以便将这些字符去掉,但我不知道如何识别它们。我的脚本是用 Classic ASP.

编写的

您可以简单地使用 Replace function 并指定 Chr(191)(或直接 "¿"):

Replace(yourCSV, Chr(191), "")

Replace(yourCSV, "¿", "")

这将删除角色。如果您需要用其他东西替换它,请将最后一个参数从 "" 更改为不同的值(例如 "-")。

一般来说,您可以使用运行菜单中的charmap.exe(字符映射),select Arial,找到一个符号并将其复制到剪贴板。然后,您可以使用 Asc("¿") 检查其值,这将 return 与 Chr() 一起使用的 ASCII 代码。

您还可以使用 RegEx 删除不需要的字符:

Set objRegEx = CreateObject(“VBScript.RegExp”)
objRegEx.Global = True
objRegEx.Pattern = “[^A-Za-z]”

strCSV = objRegEx.Replace(strCSV, “”)

此代码来自以下文章,该文章详细解释了它的作用: How Can I Remove All the Non-Alphabetic Characters in a String?

在您的情况下,您需要向 Pattern:

添加一些字符
^[a-zA-Z0-9!@#$&()\-`.+,/\"]*$