[SCore-users-jp] SCore7 beta4におけるpmxtestについて教えてください

Kameyama Toyohisa kameyama @ pccluster.org
2010年 8月 17日 (火) 13:38:19 JST


亀山です.

(08/11/10 14:57), Hiroaki Shibata Wrote:
> しかし、machinefile1_4に4台のマシン(pcc1,2,3,4)を記述して
> scout -g machinefile1_4 -e pmxtest -iter 1 -network ethernet
> を実行すると、最初は問題ないのですが、
> 
> -----------------------------------------------------------
>>>> [2->3->2] 1.4KB .. 5.08 KP/s (2600 pkt)  196.94 us/p  7.41 MB/s
> [3->0->3] 1.4KB .. 5.05 KP/s (2600 pkt)  198.06 us/p  7.37 MB/s
> [3->1->3] 1.4KB .. 5.00 KP/s (2600 pkt)  199.85 us/p  7.31 MB/s
> 
> Send&Recv, Peer-to-Peer, Burst Communication
> [3->2->3] 1.4KB .. 5.08 KP/s (2600 pkt)  196.93 us/p  7.41 MB/s
> -----------------------------------------------------------
> 
> と出力されたところで毎回止まってしまいます。
> 
> Compute Host は8CPUのマシンでNICがeth0,eth1の2枚ささっています。
> 2台指定では問題なく動くため、原因が推測できておりません。上記の
> ような現象はどのような場合に発生するのかをお教え願えますでしょうか。

これは pmxtest の bug です.
timing によって pcc1 で send&recv の処理を開始しているのに
pcc2 ではまだ pingpong の処理を行っている場合があり, この場合に
pcc1 で send&recv の処理が終わらないという判定を行う場合があります.

score7-src/SCore/test/pmx/twosided.c の

   if( nodeno == 0 ) {
     fprintf( output, "\nSend&Recv, Peer-to-Peer, Burst Communication\n" );
   }
の前に
   scout_barrier();
を入れてください.

Kameyama Toyohisa



SCore-users-jp メーリングリストの案内