[SCore-users-jp] scoutがダンマリます

kameyama @ pccluster.org kameyama @ pccluster.org
2005年 5月 17日 (火) 10:29:26 JST


亀山です.

In article <001201c55a7c$cb2a03a0$2c531e0a @ SDLPC44> "naoki sugitani" <naoki.sugitani @ zx.necel.com> wrotes:
> > もしくは,
> >     % scout -debug -g pccall
> > とするともうすこし詳しいメッセージが出ます.
> > この出力を送ってくださるともっと原因がわかるかも知れません.
> 
> 上記コマンドを実行したところ、以下のメッセージを出力してダンマリます。
> # scout -debug -g pccall
> {BEP} backend_proc(0)
> {BEP} backend_proc(first=0,nhosts=3)
> {BEP} > spawn_next_proc()
> {BEP}   spawn_next_proc(/opt/score5.4.0/deploy/scremote 0
> cftpc1.ulsys.lsi.nec.c
> o.jp 32911 cftpc1.ulsys.lsi.nec.co.jp 32911 1 0)
> {BEP} < spawn_next_proc()

scout を起動した host の official name が
     cftpc1.ulsys.lsi.nec.co.jp
になっているようです.
(前の mail から推測すると, この host は ether が 2 枚以上ささっていて
compute host につながっていないほうの hostname がついているのでは
ないかと思いますが...)
最初の compute host は cftpc1.ulsys.lsi.nec.co.jp の
scout に接続しようとします.
しかし, compute host のほうではこの名前の解決ができないか,
解決できても network unreachable になってしまうのではないでしょうか?

scout を起動する host の hostname を compute host 側の
    hostgw.local
に変更するか, compute host から cftpc1.ulsys.lsi.nec.co.jp で
接続できるようにするかすれば動くと思います.

> なお、PM/Myrinetのループバックテストは全ノード正常終了します。
> しかし、SCore-Dテスト手順では以下のエラーとなりました。

SCore-D を動かすためには scout 環境である必要があります.
(multi user mode ならばその必要はありませんが, multi user mode
で SCore-D を動かすときに scout 環境にいる必要があります.)
というわけで, 先に scout を動かさないといけないことになります.

                       from Kameyama Toyohisa



SCore-users-jp メーリングリストの案内