这个字符序列的可能含义是什么?一个&C
What is the likely meaning of this character sequence? A&#C
我正在开发一个从 CSV 文件导入数据的应用程序。我听说CSV文件里的数据来自SAP,我完全不熟悉。
我的客户表示存在问题。 CSV 文件中的一列数据包含邮政地址。有时,系统看不到有效地址。这是一个稍微虚构的例子:
1234 MAIN ST A&#C HOUSTON
如您所见,有一个街道号码、一个街道名称和一个城市,都是大写字母。没有指定州或邮政编码。在 CSV 文件中,假定所有地址都处于相同状态。
通常,街道名称和城市之间有文字的地方是公寓号或字母。在上面的示例中,当我们尝试将地址用于其他服务(例如 Google 地理定位)时会出错。一个建议的修复方法是简单地去除特殊字符,但我相信一定有更好的方法。
我想知道这个A&#C
是什么意思。它看起来像某种转义序列,但不是我熟悉的格式。请告诉我这些奇怪的字符序列是什么意思。
我不太确定,但我怀疑 "canonical" 转义序列看起来像这样。在ABAP环境中,#
用于替换不可打印的字符。可能是首先将数据导入 SAP 系统时未正确清理数据,并且在写入输出文件时,一些不可打印的字符被替换为 #
。另一种解释可能是其中一个字段包含非 ASCII unicode 字符(如 ),导出程序无法将其转换为选定的目标代码页。如果不检查实际的源数据集,很难说清楚。当然,也可能是一些编程错误或奇怪的自定义字段分隔符...
我正在开发一个从 CSV 文件导入数据的应用程序。我听说CSV文件里的数据来自SAP,我完全不熟悉。
我的客户表示存在问题。 CSV 文件中的一列数据包含邮政地址。有时,系统看不到有效地址。这是一个稍微虚构的例子:
1234 MAIN ST A&#C HOUSTON
如您所见,有一个街道号码、一个街道名称和一个城市,都是大写字母。没有指定州或邮政编码。在 CSV 文件中,假定所有地址都处于相同状态。
通常,街道名称和城市之间有文字的地方是公寓号或字母。在上面的示例中,当我们尝试将地址用于其他服务(例如 Google 地理定位)时会出错。一个建议的修复方法是简单地去除特殊字符,但我相信一定有更好的方法。
我想知道这个A&#C
是什么意思。它看起来像某种转义序列,但不是我熟悉的格式。请告诉我这些奇怪的字符序列是什么意思。
我不太确定,但我怀疑 "canonical" 转义序列看起来像这样。在ABAP环境中,#
用于替换不可打印的字符。可能是首先将数据导入 SAP 系统时未正确清理数据,并且在写入输出文件时,一些不可打印的字符被替换为 #
。另一种解释可能是其中一个字段包含非 ASCII unicode 字符(如 ),导出程序无法将其转换为选定的目标代码页。如果不检查实际的源数据集,很难说清楚。当然,也可能是一些编程错误或奇怪的自定义字段分隔符...