[SCore-users-jp] 性能差のある機種混在環境での運用
Keizo Hayashi
k-hayashiatsogo-eng.co.jp
2002年 8月 23日 (金) 17:39:38 JST
綜合技術コンサルタント 林です。
亀山様
異機種混在に関するていねいな回答、どうもありがとうございます。
良く理解できました。
ですがまだ解決しておりませんので、引き続きお願いしたく思います。
長文ですがよろしくお願いします。
つぎの機種構成
> > HP製パソコン:Celeron950MHz、メモリ320MB・・・サーバ兼計算ホスト
> > HP製パソコン:Celeron1.1GHz、メモリ256MB ・・・計算ホスト
> > の2台構成では、クラスタが正常に機能しました。
> > つぎに、以下を追加して3台構成にしました。
> > NEC製ノートPC:Celeron400MHz、メモリ64MB ・・・計算ホスト
3台目ホストを追加すると計算ができなくなる件について、以下報告します。
追記:NEC製ノートPCは、Intel440MXチップセット、LANは82557チップでした。
1. ネットワークは上記3台だけで構成、ファストイーサ・スイッチ接続です。
いずれのケーブルも2m程度の短いケーブルですので、ケーブルねじれ等の
影響はないと思っています。スイッチングハブのランプも、100M全二重を示す
ランプが点いています(ハブはアライド製で、粗悪品ではないと思います)。
2. 上記のように、マシンはすべて100Mですが、FTPで大きなファイルを送受信
したとき、3台目のノートPCだけ、パフォーマンスが悪いです。
(CPUが遅いせい?)
これは、pingでも同じ傾向がみられます。
HP--HPのFTP通信 = 4MB/sec程度 pingの反応 110〜120マイクロ秒
HP--ノートPCのFTP通信 = 1.3MB/sec pingの反応 3〜5ミリ秒
3. 動作不良を起こしているノートPCは、サーバホストでEITを使って作成する
フロッピーディスクを使ってセットアップしました。
起動時メッセージ(dmesg)も、エラーは見あたらないです(全部OKと出てます)
見落としがあるかもしれませんが。
NFSマウントやrlogin、rshも正常に動作します。
4. 各種テストを実施した結果は、以下の通りです。
(すべてサーバホストで実行。計算ホストはリブート以外、一切操作しません)
・ シェルで rpmtest <ノートPChost名> ethernet -reply と打ち、
もう1枚の画面で rpmtest <> ethernet -dest 1 -ping と打つと、
エラーとダンプメッセージが表示されます。全く通信できてないようです。
ノートPCの代わりにCele-1.1GHzの計算ホストを指定すると、テストは成功しま
す。
気になるのは、Cele-1.1GHzの計算ホストでテストした後に、再度ノートPCで
テストすると、正常終了が返されることです。ハブのランプを見ていると、
ノートPCを見に行かずに、Cele-1.1GHzを見に行ってしまってるようです。
・ scoutの起動
scout -g test1 と打つと(test1は、クラスタグループ名)、
SCOUT:Spawn done.
SCOUT:session started
と、うまく起動してくれます。
その後 scout hostname と打つと、きちんと3台のホスト名が返ってきて、
正常終了します。
しかし、肝心のプログラムが動いてくれません。マンデルブロー描画デモや、
ラプラス計算サンプルを投入しても無反応です(フリーズはしません)。
また、scout起動がうまくいくのは、最初の1回だけが多いです。
上記の状態で exit と打って SCOREシェルを抜けてから、再度 scout -g test1
と打つと、
SCOUT:Spawning <サーバhost名>
と表示されたままになり、SCOREシェルを起動できないことがあります。
ノートPCでPMが動作していないように見えます(dmesgは正常に見えますが)
正直に言って、3台目のマシンをうまくクラスタとして動作させる方法が
分かりません。
セットアップにしても、フロッピーをセットして、あとは全自動で進みますから、
どこへ手を付けたらよいものか、私には??です。
何か良いアドバイスをいただければ幸いです。
株式会社 綜合技術コンサルタント 事業本部 IT管理室
林 敬三 k-hayashi at sogo-eng.co.jp
SCore-users-jp メーリングリストの案内