[SCore-users-jp] pm_path_lookupとは?
kameyama @ pccluster.org
kameyama @ pccluster.org
2004年 12月 13日 (月) 14:31:39 JST
亀山です.
In article <41BD1B21.F062C010 @ pst.fujitsu.com> 原 元康 <m-hara @ pst.fujitsu.com> wrotes:
> 当方のSCore環境において、計算ノード上のscored.exeが終了しない現象が発生しま
> した。
> その時のpsの出力は、以下となります。
>
> ---ここから---
> F S UID PID PPID SZ WCHAN STIME TIME CMD
> 140 S guest 10133 1 673 do_sel 13:09 00:00:00 /opt/score-5.6.1/deplo
> y/bin.i386-redhat8-linux2_4/scremote.exe 0 pc2 4
> 000 S guest 10134 10133 6890 do_sel 13:09 00:01:53 /opt/score-5.6.1/deplo
> y/bin.i386-redhat8-linux2_4/scored.exe -singleuse
> 040 S guest 10158 10134 0 end 13:09 00:00:00 [pm_path_lookup]
> ---ここまで---
>
> 上記、psの[pm_path_lookup]とは何ものなでしょうか?
ps の出力から SCore 5.6.1 だと推測したのですが,
SCore-D のソースは 5.8.0 以降のようにみえます.
(watch_child() のコードが変っています.)
SCore のバージョンはいくつでしょうか?
SCore のソースには pm_path_lookup は無いようです.
多分, 実際に動かそうとしている program だと思うのですが...
scrun -group=pcc2 ./pm_path_lookup
とかで起動していませんでしょうか?
(scored で wait4() していてきちんと終了していないのが若干引っ掛かりますけど...)
> また、現象が発生した時に、scored.exeに対して、straceを実施したところ、以下
> の部分で
> ループしていることを確認できています。
scored としては, 起動した program (pm_path_lookup?) が終了した
(wait(4) で ECHILD が帰っていますので) のに
それに気が付いていない (single user ならそれで終了するはず)
情況であると思います.
上記の理由で SCore の version が不明ですが, SCore 5.6.1 でしたら
SCore 5.8.2 に上げると改善するかもしれません.
from Kameyama Toyohisa
SCore-users-jp メーリングリストの案内