`mpirun -n 2 ./ax`、両方のプロセスはepoll_waitによって中断されました。なぜですか?

`mpirun -n 2 ./ax`、両方のプロセスはepoll_waitによって中断されました。なぜですか?

私はmpiプログラムを実行しましたmpirun -n 2 ./a.x。しかし、両方のプロセスが中断されました。そしていつも停滞していて、ほぼ(実際には一度だけ)通過しました。

strace後続の情報が見つかりましたが、lsofどちらのプロセスも同じファイルを読み書きするのを待っていますが、まだ準備ができていません。それでは、このファイルが何であるか、なぜ常にアクセスできないのかを調べる方法は何ですか?

もしアイデアがあったり、必要なものがあれば教えてください。ありがとうございます!

//use `strace -p  31352`  
epoll_wait(18, [], 100, 0)              = 0
epoll_wait(18, [], 100, 0)              = 0
epoll_wait(18, [], 100, 0)              = 0
<...endless>
//use `strace -p 31351` 
epoll_wait(19, [], 100, 0)              = 0
epoll_wait(19, [], 100, 0)              = 0
epoll_wait(19, [], 100, 0)              = 0
<...endless>

//use `lsof -p 31352`
pfci.x  31352 jslo   18u  a_inode               0,13         0     11815 [eventpoll]
//use `lsof -p 31351`
pfci.x  31351 jslo   19u  a_inode               0,13         0     11815 [eventpoll]

ベストアンサー1

おすすめ記事