[SCore-users-jp] scored$B$K$D$$(B$B$F(B
kameyama @ pccluster.org
kameyama @ pccluster.org
2005年 2月 9日 (水) 20:26:42 JST
亀山です.
In article <000001c50e95$c82f82c0$2201a8c0 @ tsuyoshi> "Tsuyoshi Ooishi" <tsuyoshi @ phys.aoyama.ac.jp> wrotes:
> [tsuyoshi @ serv himeno]$ scout -g half1
> SCOUT: Spawning done.
> SCOUT: session started.
> [tsuyoshi @ serv himeno]$ mpif90 himenobmtxpr.f
> [tsuyoshi @ serv himeno]$ mpirun -np 8 -nolocal -machinefile
> machinename.txt a.out
MPICH/SCore は MPICH/p4 などとは異り, 実行はすべて計算ホストで
行うので, -nolocal は不要です.
また, scout の環境で実行している場合, 実行するホストはわかっていますので,
machinefile も不要です.
よって, ここは
$ mpirun -np 8 a.out
で実行できます.
(もしくは, scout に入らないで
$ mpirun -np 8 -machinefile machinename.txt a.out
group 指定を使用して
$ mpirun -np 8 -score group=half1 a.out
などと起動することもできます.)
大石さんのように起動した場合, machinefile.txt を使用して別の scout
を起動して実行します.
(手元の環境では成功しました.)
> しかし、全クライアントノードにおいてプロセス状態を確認したところ、
> scoutd.exe
> のCPU使用率が約100%となってずっと動き続けてしまい、ジョブが流れずにおり
> ます。
scoutd は scout を起動するための daemon で,
> SCOUT: Spawning done.
で役割は済んでいるはずなのですが...
(subject は scored になっていますが, scoutd で正しいでしょうか?)
また, CPU 使用率が 100 % のプロセスを
strace -p pid
と system call trace してみると何をやろうとしているのかわかるかもしれません.
from Kameyama Toyohisa
SCore-users-jp メーリングリストの案内