sprintf() 在某些运行时处理 %s 扩展 ASCII (ISO 8859-1)?

sprintf() handling of %s extended ASCII (ISO 8859-1) on some runtimes?

我在我的 C 应用程序中使用 ISO 8859-1(拉丁语扩展 ASCII 字符集)。当我 strcpy/strcat 将字符串的部分放在一起时,它工作正常。但是当我使用 sprintf("%s %s") 时,在某些运行时(特别是 Android 的某些版本),字符串将在扩展 ASCII 字符(特别是 é 时被截断,尽管我没有尝试过其他字符)被击中

我认为 %s 只是应该复制字节直到 '[=18=]' 被击中。我怀疑 strcpy/strcat 有效,因为它确实做到了这一点,没有任何格式。这里可能发生了什么?

我应该注意,我不是使用 printf() 查看文本,而是我自己的文本渲染引擎,它可以很好地处理 ISO-8859-1。

更新: 澄清一下,我有一个 NDK 应用程序,它将字符串保存在 C 中,并将其传递给我基于 OpenGL 的文本渲染引擎。如果我将完整的字符串作为 char* 文字传递,它会正常显示。如果我 sprintf() 将这些部分放在一起,它会在 é 字符处被截断。 例如:

char buffer[1024];
strcpy(buffer, "This is ");
strcat(buffer, "the string I want to diésplay.");

这很好。但是这个:

sprintf(buffer, "%s%s", "This is ", "the string I want to diésplay.");

打印为:

This is the string I want to di

s[n]printf() 的行为与 strcpy()strcat() 等字符串操作函数的行为不同。当呈现相同的格式和打印项目时,printf 系列函数都需要生成相同的字节序列。唯一的区别在于这些字节的发送位置。因此,如果您的 C 库构建为在通过 printf() 打印到标准流时对字符串数据执行转换(可能是转码),那么它会在通过 [= 打印到字符串时执行相同的转换15=].

"printf" 中的 "f" 用于 "formatted"。该标准既没有说明也没有暗示格式化字符串必须意味着将其字节逐字转储到输出,因此我上面假设的转码或其他转换并非不可能。事实上,the docs for some versions of these functions 表示语言环境依赖性 ("Note that the length of the strings produced is locale-dependent and difficult to predict"),因此特别是转码是一种真正的可能性。

对您描述的第三方观察的任何具体解释都必然是推测性的,因为您没有提供足够的代码或数据来做出自信的诊断。我倾向于怀疑围绕 运行 在使用与程序内部使用的字符编码不同的字符编码的语言环境中运行程序的问题。如果是这样,那么您可以通过改变您 运行 所在的语言环境来在本地重现该问题,并且您可以通过确保您的程序始终 运行 的某种方式来解决该问题在合适的地方。除其他事项外,您可能会使用 getlocale()setlocale() 函数来提供帮助,特别是如果您想要限制执行区域设置控制的范围。

由于最终你只依赖 printf 系列函数来进行字符串操作,但是,我认为最好使用问题中提供的解决方法:尽可能多地使用 C 的专用字符串操作函数,例如 strcpy()strncat(),以执行您的字符串构建。由于您的实际输出不依赖于 stdio 函数,因此应该没问题。