[SCore-users-jp] 計算ノードダウン時のジョブ実行について
kameyama @ pccluster.org
kameyama @ pccluster.org
2003年 12月 24日 (水) 09:27:07 JST
亀山です.
In article <006001c3c91f$7e2a0cc0$570aa8c0 @ Globus> "Mitsugu Kawaguchi" <m-kawaguchi @ pst.fujitsu.com> wrotes:
> シングルユーザモードの場合なら、Ctrl+Cで終了させればよいですが、
> PBSなどのバッチソフトを利用してジョブ実行する場合、
> バッチジョブとしてはずっと実行中扱いになるかと思いますが、
> どうでしょうか?回避策とかはあるのでしょうか?
PBS の場合は compute host で pbs_mom が動いていて, その daemon と
server が通信していて compute host の状態をみているので,
その host が down していることはわかります.
server は down している host に job を割り当てることはしません.
よって, "実行中扱いになる" ことはなく, 別の host を割り当てられるか,
host の数が足らない場合は実行保留状態に留まることになります.
from Kameyama Toyohisa
SCore-users-jp メーリングリストの案内