[devel] [SCore-users-jp] チェックポイント機能について

takuma c8538 @ st.cs.kumamoto-u.ac.jp
2001年 12月 19日 (水) 19:35:24 JST


ありがとうございます。再開の仕組みはわかりました。

scorehosts.db 内に spare で記述すればいいんですね。

山本
   



Atsushi HORI wrote:

> 堀@スイミー・ソフトウェアです.
>
> >とありますが例えば64台のホストがあるとします。そのうち32ホストでジョブを走ら
> >せ、その1つが故障した場合、残りの32台のうち1台が置き換わるのでしょうか。そ
> >の1台は自動に選択されるのでしょうか。
>
> SCore ではクラスタをどのように構成するかというデータベースがあり,クラ
> スタを構成するホストについては「故障したらこのホストで代替する」という
> 記述ができるようになっています.
>
> おっしゃるようなことは,そのようにデータベースにそのような記述があれば
> そうなります.しかし,そうすると,別に64台のホストで走る並列ジョブがあ
> ったとすると,置き換えてしまった後は63台しかありませんから,そのジョブ
> は実行を再開できなくなってしまいます.
>
> 想定しているのは,64台とは別にホットスタンバイしているホストがあって,
> 故障したホストはそれに置き換わる,というシナリオです.
>
> もちろん同時に2台故障した場合は復帰できません.RAID だってそうですよね?
>
> _______________________________________________
> SCore-users-jp mailing list
> SCore-users-jp @ pccluster.org
> http://www.pccluster.org/mailman/listinfo/score-users-jp




SCore-users-jp メーリングリストの案内