[SCore-users-jp] 計算ノードダウン時のジョブ実行について

kameyama @ pccluster.org kameyama @ pccluster.org
2003年 12月 24日 (水) 09:27:07 JST


亀山です.

In article <006001c3c91f$7e2a0cc0$570aa8c0 @ Globus> "Mitsugu Kawaguchi" <m-kawaguchi @ pst.fujitsu.com> wrotes:
> シングルユーザモードの場合なら、Ctrl+Cで終了させればよいですが、
> PBSなどのバッチソフトを利用してジョブ実行する場合、
> バッチジョブとしてはずっと実行中扱いになるかと思いますが、
> どうでしょうか?回避策とかはあるのでしょうか?

PBS の場合は compute host で pbs_mom が動いていて, その daemon と
server が通信していて compute host の状態をみているので,
その host が down していることはわかります.
server は down している host に job を割り当てることはしません.

よって, "実行中扱いになる" ことはなく, 別の host を割り当てられるか,
host の数が足らない場合は実行保留状態に留まることになります.

                       from Kameyama Toyohisa



SCore-users-jp メーリングリストの案内