[SCore-users-jp] PCクラスタのバックアップPCについて
kameyama @ pccluster.org
kameyama @ pccluster.org
2002年 6月 11日 (火) 19:30:40 JST
亀山です.
In article <5.0.2.5.2.20020611182142.00bbd8f0 @ 133.141.16.40> Takaya Yamamoto <Yamamoto.Takaya @ wrc.melco.co.jp> wrotes:
> そこで質問ですが、
> ・PCが1台故障で停止した場合でも、実行中のプログラムは動きつづけるのでしょうか
> ?
これは SCore-D の multi user mode でのみ可能です.
(予備の PC はすでに動いていなければなりませんけど...)
scored を再起動して, checkpoint をとったところから restart します.
詳しくは
http://www.pccluster.org/score/dist/score/html/ja/reference/scored/auto.html
を参照してください.
実行中のプログラムがどこから再開するかは
checkpoint の間隔に依存します.
> ・故障停止した後予備のPCが動作開始するまで、どのぐらい時間がかかるのでしょう
> か?
これは sc_watch の監視タイマの時間間隔に依存します.
> ・実行中のプログラムを止めることなく、停止したPCの接続をはずして、
> そのはずした部分に新たに別の予備のPCを接続することは可能でしょうか?
これは上記の質問に関連したものでしょうか?
それとも独立 (予備マシンを登録していない場合, 新しい PC を接続して
その PC で再開する) でしょうか?
前者でしたら, その PC は使用されていないので接続することに問題は
無いと思います.
その PC を実際に使用するのは別のタイミングになりますが...
後者も sc_watch のやることを手動で行えば良いのでなんとかなると思います.
どちらにしろ PM/Ethernet を使用する場合は ethernet の config file
を修正する必要がありそうですが...
from Kameyama Toyohisa
SCore-users-jp メーリングリストの案内