[SCore-users-jp] pm_path_lookupとは?

kameyama @ pccluster.org kameyama @ pccluster.org
2004年 12月 13日 (月) 14:31:39 JST


亀山です.

In article <41BD1B21.F062C010 @ pst.fujitsu.com> 原 元康 <m-hara @ pst.fujitsu.com> wrotes:
>   当方のSCore環境において、計算ノード上のscored.exeが終了しない現象が発生しま
> した。
>  その時のpsの出力は、以下となります。
> 
> ---ここから---
>   F S UID        PID  PPID    SZ WCHAN  STIME     TIME CMD
> 140 S guest    10133     1   673 do_sel 13:09 00:00:00 /opt/score-5.6.1/deplo
> y/bin.i386-redhat8-linux2_4/scremote.exe 0 pc2 4
> 000 S guest    10134 10133  6890 do_sel 13:09 00:01:53 /opt/score-5.6.1/deplo
> y/bin.i386-redhat8-linux2_4/scored.exe -singleuse
> 040 S guest    10158 10134     0 end    13:09 00:00:00 [pm_path_lookup]
> ---ここまで---
> 
>   上記、psの[pm_path_lookup]とは何ものなでしょうか?

ps の出力から SCore 5.6.1 だと推測したのですが,
SCore-D のソースは 5.8.0 以降のようにみえます.
(watch_child() のコードが変っています.)
SCore のバージョンはいくつでしょうか?

SCore のソースには pm_path_lookup は無いようです.
多分, 実際に動かそうとしている program だと思うのですが...
    scrun -group=pcc2 ./pm_path_lookup
とかで起動していませんでしょうか?
(scored で wait4() していてきちんと終了していないのが若干引っ掛かりますけど...)

>  また、現象が発生した時に、scored.exeに対して、straceを実施したところ、以下
> の部分で
> ループしていることを確認できています。

scored としては, 起動した program (pm_path_lookup?) が終了した
(wait(4) で ECHILD が帰っていますので) のに
それに気が付いていない (single user ならそれで終了するはず)
情況であると思います.

上記の理由で SCore の version が不明ですが, SCore 5.6.1 でしたら
SCore 5.8.2 に上げると改善するかもしれません.

                       from Kameyama Toyohisa



SCore-users-jp メーリングリストの案内