[SCore-users-jp] scored$B$K$D$$(B$B$F(B

kameyama @ pccluster.org kameyama @ pccluster.org
2005年 2月 9日 (水) 20:26:42 JST


亀山です.

In article <000001c50e95$c82f82c0$2201a8c0 @ tsuyoshi> "Tsuyoshi Ooishi" <tsuyoshi @ phys.aoyama.ac.jp> wrotes:
> [tsuyoshi @ serv himeno]$ scout  -g half1
> SCOUT: Spawning done.
> SCOUT: session started.
> [tsuyoshi @ serv himeno]$ mpif90 himenobmtxpr.f
> [tsuyoshi @ serv himeno]$ mpirun -np 8 -nolocal -machinefile
> machinename.txt a.out

MPICH/SCore は MPICH/p4 などとは異り, 実行はすべて計算ホストで
行うので, -nolocal は不要です.

また, scout の環境で実行している場合, 実行するホストはわかっていますので,
machinefile も不要です.
よって, ここは
    $ mpirun -np 8 a.out
で実行できます.

(もしくは, scout に入らないで
    $ mpirun -np 8  -machinefile machinename.txt a.out
group 指定を使用して
    $ mpirun -np 8 -score group=half1 a.out
などと起動することもできます.)

大石さんのように起動した場合, machinefile.txt を使用して別の scout
を起動して実行します.
(手元の環境では成功しました.)

> しかし、全クライアントノードにおいてプロセス状態を確認したところ、
> scoutd.exe
> のCPU使用率が約100%となってずっと動き続けてしまい、ジョブが流れずにおり
> ます。

scoutd は scout を起動するための daemon で,

> SCOUT: Spawning done.

で役割は済んでいるはずなのですが...
(subject は scored になっていますが, scoutd で正しいでしょうか?)

また, CPU 使用率が 100 % のプロセスを
    strace -p pid
と system call trace してみると何をやろうとしているのかわかるかもしれません.

                       from Kameyama Toyohisa



SCore-users-jp メーリングリストの案内