PM/Ethernet のテスト方法

このテスト方法は server で X window システムが既に動いていることを前提とします。
  1. etherpmctl コマンド
    etherpmctl コマンドが全てのホスト上の pm_ethernet rc スクリプトでブート時に実行されていることを確認してください。 まだ実行されていなかった場合は次のようにして全てのホストで実行してください:
    $ su
    Password:
    # /etc/rc.d/init.d/pm_ethernet start
    
  2. Point-to-Point テスト (メッセージ)
    PM カーネルドライバが全てのホスト上にインストール済みであることを確認してください。 PM の通信機能をテストするためには、rpmtest コマンドを使用します。 たとえば、comp0 (ノード 0) から comp1 (ノード 1) へ 通信できるかどうかをテストしたい場合は次のようにしてください。

    server host 上のウィンドウで以下のコマンドを実行します:

    $ cd /opt/score/sbin
    $ ./rpmtest comp1 ethernet -reply
    
    server host の別のウィンドウで次のコマンドを実行します:
    $ cd /opt/score/sbin
    $ ./rpmtest comp0 ethernet -dest 1 -ping
    	成功: "8     0.000113725" のような2つの数字が表示されます
                     1番目の数字はデータのサイズ(byte)です
                     2番目の数字はレイテンシ(秒)です
    	失敗: エラーとダンプメッセージが表示されます
    
    テストを終えるときは、プロセスが無限ループしているので、server host 上の pmtest プロセスを kill するのを忘れないでください。 このテストが失敗した場合は、トラブルシューディングを参照してください。

  3. 総合テスト
    これはストレステストです。 全てのホストがランダムに巨大なメッセージを他のホストに送信します。 このテストはまた、他のホストに rsh コマンドを実行できるかの確認もします。 server host 上で次のコマンドを実行します:
    $ cd /opt/score/deploy
    $ scout -g pcc
    SCOUT: Spawn done.
    SCOUT: session started
    $ ./scstest -network ethernet
    CSTEST: BURST on ethernet
    50 K messages.
    100 K messages.
    150 K messages.
    200 K messages.
    250 K messages.
    300 K messages.
            成功: 転送されたメッセージ数が表示されます
            失敗: エラーメッセージが表示されます
    
    このテストを止めるには Ctrl-C 押すか他の中断コマンドを実行してください。
    このテストが失敗した場合は、トラブルシューディングを参照してください。

トラブルシューディング

etherpmctl コマンドが失敗
Point-to-point テストが失敗
他にトラブルがあった場合は、 SCore Users ML で知らせてください。


CREDIT
This document is a part of the SCore cluster system software developed at PC Cluster Consortium, Japan. Copyright (C) 2003 PC Cluster Consortium.