这个代表变音符号的疯狂德语字符组合是什么?

What is this crazy German character combination to represent an umlaut?

我只是在解析以下内容 website

找到文本

und wären damit auch

起初,“ä”看起来非常好,但是一旦我检查它,就会发现这不是常规的“ä”(表示为 ascw 228)而是这个:

ascw: 97, char: a
ascw: 776, char: ¨

我以前从未见过这样表示的“ä”。

网站怎么会使用这种奇怪的字符组合,它可能有什么好处?

你在问题中没有提到的是使用的编码。很明显它是基于 Unicode 的编码。

在 Unicode 中,代码点 U+0308(十进制为 776)是 combining diaeresis。从字母 a 和分音符中,创建了德语字符 ä

确实有两种方法可以用变音符(在本例中为 ä)表示德语字符。作为单个代码点:

U+00E4 latin small letter A with diaeresis

或者作为两个代码点的序列:

U+0041 latin small letter A
U+0308 combining diaeresis

在大多数情况下,Unicode 使用两个代码点,因为它需要更少的代码点来启用带有变音符号的大范围字符。但是,由于历史原因,对于带有德语变音符号和法语重音的字母,存在一个特殊的代码点。

Unicode 库是大多数编程语言提供的功能,可规范化 字符串,即将所有序列转换为单个代码点(如果可能)或将所有单个代码点扩展为两个代码点序列。另见 Unicode Normalization Forms.