如何使用简单的转义序列对东欧(波兰)符号进行编码?

How to encode East-European (Polish) signs using simple escape sequences?

我正在用 C 开发嵌入式应用程序,它必须符合 MISRA 标准。它将涉及使用包含波兰语符号 (ąęćłńśźż) 的字符串。我尝试使用 octal/hex 转义序列对它们进行编码:

dictionary[archive_error] = "B" "\x88" "ąd pamieci";

但规则 4.1 禁止这些行为。 MISRA-C 2004。此规则是必需的。

我的问题是:仅使用 ISO/IEC 9899 的简单转义序列是否有可能以及如何对该字符集进行编码?

不清楚您使用的是哪个 MISRA 版本。

MISRA-C:2004 的规则 4.1 只是禁止非标准的转义序列。在 MISRA-C:2004 TC1 中,这后来被更改为禁止所有十六进制和八进制转义序列(除非您小心,否则它们具有实现定义的行为)。显然,这条规则及其所谓的更正是委员会的一个小错误。

该规则已在最新的 MISRA-C:2012 中得到正确修复,其中规则 4.1 规定转义序列应终止,无论是在新转义序列的开头还是在字符串文字的结尾,只是就像你的例子一样。

因此您发布的代码不符合 MISRA-C:2004,但完全符合 MISRA-C:2012。如果您使用的是前者,我只是提出一个偏差并参考 MISRA-C:2012 规则 4.1。

否则,解决方法是简单地使用与整数混合的字符文字,而不是字符串文字:

dictionary[archive_error] = {'B', 0x88u, 'a', ... , '[=10=]'};