调试 MPI 应用程序时正在关闭 xterm
xterm's are being closed while debugging an MPI application
我在使用 lldb
调试 MPI 应用程序时遇到问题。本质上,我通过
将它附加到每个进程
mpirun_lldb() {
mpirun --mca orte_base_help_aggregate 0 --mca mpi_abort_print_stack 1 -np xterm -hold -e lldb -f -- "${@:3}"
}
但在某些时候 MPI_Abort
发生,所有 xterm
windows 都立即关闭,我什至无法读取堆栈,更不用说调试和检查变量了:
MPI_ABORT was invoked on rank 2 in communicator MPI_COMM_WORLD
with errorcode 255.
NOTE: invoking MPI_ABORT causes Open MPI to kill all MPI processes.
You may or may not see output from other processes, depending on
exactly when Open MPI kills them.
我尝试将 -hold
用于 xterm
,但这没有帮助。
p.s。我无权访问像 TotalView 这样的授权调试器。这是我第一次遇到上述简单方法的问题。
抱歉,添加断点b MPI_Abort
解决了问题。
我在使用 lldb
调试 MPI 应用程序时遇到问题。本质上,我通过
mpirun_lldb() {
mpirun --mca orte_base_help_aggregate 0 --mca mpi_abort_print_stack 1 -np xterm -hold -e lldb -f -- "${@:3}"
}
但在某些时候 MPI_Abort
发生,所有 xterm
windows 都立即关闭,我什至无法读取堆栈,更不用说调试和检查变量了:
MPI_ABORT was invoked on rank 2 in communicator MPI_COMM_WORLD
with errorcode 255.
NOTE: invoking MPI_ABORT causes Open MPI to kill all MPI processes.
You may or may not see output from other processes, depending on
exactly when Open MPI kills them.
我尝试将 -hold
用于 xterm
,但这没有帮助。
p.s。我无权访问像 TotalView 这样的授权调试器。这是我第一次遇到上述简单方法的问题。
抱歉,添加断点b MPI_Abort
解决了问题。