[SCore-users-jp] PCクラスタのバックアップPCについて

kameyama @ pccluster.org kameyama @ pccluster.org
2002年 6月 11日 (火) 19:30:40 JST


亀山です.

In article <5.0.2.5.2.20020611182142.00bbd8f0 @ 133.141.16.40> Takaya Yamamoto <Yamamoto.Takaya @ wrc.melco.co.jp> wrotes:
> そこで質問ですが、
> ・PCが1台故障で停止した場合でも、実行中のプログラムは動きつづけるのでしょうか
>
これは SCore-D の multi user mode でのみ可能です.
(予備の PC はすでに動いていなければなりませんけど...)
scored を再起動して, checkpoint をとったところから restart します.
詳しくは
    http://www.pccluster.org/score/dist/score/html/ja/reference/scored/auto.html
を参照してください.
実行中のプログラムがどこから再開するかは
checkpoint の間隔に依存します.

> ・故障停止した後予備のPCが動作開始するまで、どのぐらい時間がかかるのでしょう
> か?

これは sc_watch の監視タイマの時間間隔に依存します.

> ・実行中のプログラムを止めることなく、停止したPCの接続をはずして、
>  そのはずした部分に新たに別の予備のPCを接続することは可能でしょうか?

これは上記の質問に関連したものでしょうか?
それとも独立 (予備マシンを登録していない場合, 新しい PC を接続して
その PC で再開する) でしょうか?

前者でしたら, その PC は使用されていないので接続することに問題は
無いと思います.
その PC を実際に使用するのは別のタイミングになりますが...
後者も sc_watch のやることを手動で行えば良いのでなんとかなると思います.
どちらにしろ PM/Ethernet を使用する場合は ethernet の config file
を修正する必要がありそうですが...

                       from Kameyama Toyohisa



SCore-users-jp メーリングリストの案内