十进制的 UTF-8

UTF-8 in decimal

是否可以用小数表示 UTF-8 编码?我认为只有 255 之前的值才是正确的,对吗? 据我所知,我们只能用十六进制或二进制形式表示UTF-8。

我认为这是可能的。我们来看一个例子:

∫的 Unicode 代码点是 U+222B。

其UTF-8编码为E288AB,十六进制表示。在八进制中,这将是 342 210 253。在十进制中,它将是 226 136 171。也就是说,如果您分别表示每个字节。

如果将相同的 3 个字节看成一个数字,则十六进制为 E288AB70504253 八进制;和 14846123 十进制。