strace:没有 <resumed> 的连续 <unfinished...> 系统调用是什么意思?

strace: What do consecutive <unfinished...> syscall with no <resumed> mean?

我正在尝试使用 strace -tt -f 调试用 Python 编写的多线程网络服务器,strace 输出让我感到困惑,因为似乎有多个连续的系统调用 <unfinished...>在同一个线程上,之后没有观察到恢复:

9675  22:58:28.407844 <... recvfrom resumed> "RTQ[=12=]\n", 7, 0, NULL, NULL) = 7
9675  22:58:28.518079 recvfrom(3, "RVQ\n", 7, 0, NULL, NULL) = 7
9675  22:58:28.518672 sendto(7, "[=12=][=12=][=12=][=12=]RVQ[=12=]\n", 12, 0, NULL, 0) = 12
9675  22:58:28.536676 poll([{fd=7, events=POLLIN|POLLPRI}], 1, 0 <unfinished ...>
9675  22:58:28.536739 <... poll resumed> ) = 1 ([{fd=7, revents=POLLIN}])
9675  22:58:28.538515 recvfrom(7,  <unfinished ...>
9675  22:58:28.539400 recvfrom(7,  <unfinished ...>
9675  22:58:28.539768 sendto(7, "[=12=][=12=][=12=][=12=]RWQ[=12=]\n", 12, 0, NULL, 0 <unfinished ...>
9675  22:58:28.540629 poll([{fd=7, events=POLLIN|POLLPRI}], 1, 0 <unfinished ...>
9675  22:58:28.540666 <... poll resumed> ) = 1 ([{fd=7, revents=POLLIN|POLLERR|POLLHUP}])
9675  22:58:28.541170 recvfrom(7,  <unfinished ...>
9675  22:58:28.542603 recvfrom(7,  <unfinished ...>
9675  22:58:28.543449 shutdown(7, SHUT_RDWR <unfinished ...>
9675  22:58:28.544451 close(7 <unfinished ...>
9656  22:58:28.555189 accept4(5, {sa_family=AF_INET, sin_port=htons(38282), sin_addr=inet_addr("127.0.0.1")}, [16], SOCK_CLOEXEC) = 7
9656  22:58:28.555288 ioctl(7, FIONBIO, [0]) = 0
9656  22:58:28.555338 ioctl(7, FIONBIO, [0]) = 0
9656  22:58:28.555749 getpeername(7, {sa_family=AF_INET, sin_port=htons(38282), sin_addr=inet_addr("127.0.0.1")}, [16]) = 0
9656  22:58:28.555810 getsockname(7, {sa_family=AF_INET, sin_port=htons(6000), sin_addr=inet_addr("127.0.0.1")}, [16]) = 0
9656  22:58:28.555929 getpeername(7, {sa_family=AF_INET, sin_port=htons(38282), sin_addr=inet_addr("127.0.0.1")}, [16]) = 0
9675  22:58:28.560799 sendto(7, "[=12=][=12=][=12=][=12=]QPRQ\n", 14, 0, NULL, 0) = 14

确保您尝试使用“recvfrom”获取数据的套接字已打开并且正在返回数据,因为您的线程似乎卡在了那个点,因为套接字没有返回任何数据。

也尝试在代码中添加异常处理以更好地调试它。

根据@OznOg的建议,是因为多线程应用运行速度太快,所以strace掉了一些结果。

作为更好的选择,我切换到更快的 perf trace ./app,问题就解决了。请注意,如果您看到 perf trace 抱怨 ignored trace,您只需将事件缓冲区大小增加 sudo sh -c "echo 1032 > /proc/sys/kernel/perf_event_mlock_kb"