当字符串文字以换行符结尾时,strdup 大小为 4 的无效读取 \n

strdup invalid read of size 4 when string literal is ending with newline \n

当 src 字符串以 \n 结尾时出现无效读取错误,当我删除 \n:

时错误消失
#include <stdio.h>
#include <stdlib.h>
#include <string.h>

int main (void)
{
    char *txt = strdup ("this is a not socket terminated message\n");
    printf ("%d: %s\n", strlen (txt), txt);
    free (txt);
    return 0;
}

valgrind 输出:

==18929== HEAP SUMMARY:
==18929==     in use at exit: 0 bytes in 0 blocks
==18929==   total heap usage: 2 allocs, 2 frees, 84 bytes allocated
==18929== 
==18929== All heap blocks were freed -- no leaks are possible
==18929== 
==18929== ERROR SUMMARY: 1 errors from 1 contexts (suppressed: 0 from 0)
==18929== 
==18929== 1 errors in context 1 of 1:
==18929== Invalid read of size 4
==18929==    at 0x804847E: main (in /tmp/test)
==18929==  Address 0x4204050 is 40 bytes inside a block of size 41 alloc'd
==18929==    at 0x402A17C: malloc (in /usr/lib/valgrind/vgpreload_memcheck-x86-linux.so)
==18929==    by 0x8048415: main (in /tmp/test)
==18929== 
==18929== ERROR SUMMARY: 1 errors from 1 contexts (suppressed: 0 from 0)

如何在不牺牲换行符的情况下解决这个问题?

错误消息似乎表明 strlen 读取了 strdup 分配的 malloced 缓冲区。在 32 位平台上,最佳 strlen 实现可以一次将 4 个字节读入 32 位寄存器并执行一些 bit-twiddling 以查看其中是否有空字节。如果在字符串末尾附近,剩余的字节少于 4 个,但仍读取 4 个字节以执行空字节检查,那么我可以看到打印此错误。在那种情况下,大概 strlen 实施者会知道它是否 "safe" 在特定平台上执行此操作,在这种情况下,valgrind 错误是误报。

这与换行符无关,也与 printf 格式说明符无关。您已经在 strlen() 中发现了可以说是错误的东西,我可以告诉您一定是在使用 gcc。

您的程序代码完全没问题。 printf 格式说明符可能会好一点,但它不会导致您看到的 valgrind 错误。让我们看看那个 valgrind 错误:

==18929== Invalid read of size 4
==18929==    at 0x804847E: main (in /tmp/test)
==18929==  Address 0x4204050 is 40 bytes inside a block of size 41 alloc'd
==18929==    at 0x402A17C: malloc (in /usr/lib/valgrind/vgpreload_memcheck-x86-linux.so)
==18929==    by 0x8048415: main (in /tmp/test)

"Invalid read of size 4"是我们必须了解的第一个消息。这意味着处理器 运行 一条指令将从内存中加载 4 个连续字节。下一行表示试图读取的地址是 "Address 0x4204050 is 40 bytes inside a block of size 41 alloc'd."

有了这些信息,我们就可以搞清楚了。首先,如果将 '\n' 替换为 '$' 或任何其他字符,将产生相同的错误。试试吧。

其次,我们可以看到您的字符串中有 40 个字符。添加 [=14=] 终止字符会使用于表示字符串的总字节数达到 41。

因为我们收到消息 "Address 0x4204050 is 40 bytes inside a block of size 41 alloc'd,",所以我们现在知道出了什么问题。

  1. strdup() 分配了正确的内存量,41 字节。
  2. strlen() 试图读取 4 个字节,从第 40 个字节开始,这将扩展到 non-existent 第 43 个字节。
  3. valgrind 发现了问题

这是一个 glib() 错误。曾几何时,一个名为 Tiny C Compiler (TCC) 的项目开始起飞。巧合的是,glib 被彻底改变了,以至于正常的字符串函数,例如 strlen() 不再存在。它们被优化版本所取代,这些版本使用各种方法读取内存,例如一次读取四个字节。同时更改 gcc 以生成对适当实现的调用,具体取决于输入指针的对齐、编译的硬件等。当对 GNU 环境的这种更改使得生成一个如此困难时,TCC 项目被放弃了新的 C 编译器,取消了对标准库使用 glib 的能力。

如果您报告错误,glib 维护者可能不会修复它。原因是在实际使用中,这可能永远不会导致实际崩溃。 strlen 函数一次读取 4 个字节,因为它发现地址是 4 字节对齐的。从 4-byte-aligned 地址读取 4 个字节总是可能的,而不会出现段错误,因为从该地址读取 1 个字节会成功。因此,来自 valgrind 的警告并没有揭示潜在的崩溃,只是关于如何编程的假设不匹配。我认为 valgrind 在技术上是正确的,但我认为 glib 维护者做任何事情来压制警告的可能性为零。