[devel] [SCore-users-jp] チェックポイント機能について

Atsushi HORI hori @ swimmy-soft.com
2001年 12月 19日 (水) 18:53:57 JST


堀@スイミー・ソフトウェアです.

>とありますが例えば64台のホストがあるとします。そのうち32ホストでジョブを走ら
>せ、その1つが故障した場合、残りの32台のうち1台が置き換わるのでしょうか。そ
>の1台は自動に選択されるのでしょうか。

SCore ではクラスタをどのように構成するかというデータベースがあり,クラ
スタを構成するホストについては「故障したらこのホストで代替する」という
記述ができるようになっています.

おっしゃるようなことは,そのようにデータベースにそのような記述があれば
そうなります.しかし,そうすると,別に64台のホストで走る並列ジョブがあ
ったとすると,置き換えてしまった後は63台しかありませんから,そのジョブ
は実行を再開できなくなってしまいます.

想定しているのは,64台とは別にホットスタンバイしているホストがあって,
故障したホストはそれに置き換わる,というシナリオです.

もちろん同時に2台故障した場合は復帰できません.RAID だってそうですよね?




SCore-users-jp メーリングリストの案内