NAS並列ベンチマークによるアプリケーションテスト方法


構築したPCクラスタが安定して動くようになったら、 NAS並列ベンチマーク を用いて実際に構築したPCクラスタの性能を測定してみましょう。NAS並列ベンチマークは、NASAが航空関連の流体シミュレーションのスーパコンピュータ 上での実行性能を測定するために開発したものです。 このSCoreのディストリビューションCD-ROMには、NAS並列ベンチマーク (Version 2.4)の実行バイナリが添付されています。なお、実行バイナリの配 布については、NASAに了解を得ています。
  1. 実行バイナリの所在と説明

    実行バイナリはSCoreのディストリビューションCD-ROMを/mnt/cdromにマウン トした場合、/mnt/cdrom/NPB/NPB.binary.tar.gz にあります。

    このSCoreのディストリビューションCD-ROMには、NAS並列ベンチマークのうち、 ft以外のbt, cg, is, lu, mg, spの実行バイナリが含まれています。実行バイ ナリは、アプリケーション、クラス、プロセッサ数で違います。クラスは問題 サイズの小さい順にS,W,A,B,C,Dとありますが、収録バイナリはクラス A,Bです。 利用のコンパイラはgcc(g77)です。

    実行バイナリ例
    -rwxr-xr-x root/root   2062063 2003-02-04 15:14:05 bt.A.4
    -rwxr-xr-x root/root   1985116 2003-02-04 14:57:17 cg.A.4
    -rwxr-xr-x root/root   1959537 2003-02-04 16:19:37 ep.B.4
    -rwxr-xr-x root/root   1913705 2003-02-04 14:57:28 is.A.4
    -rwxr-xr-x root/root   2043303 2003-02-04 16:25:33 lu.A.4
    -rwxr-xr-x root/root   2006908 2003-02-04 16:20:56 mg.B.8
    -rwxr-xr-x root/root   2068424 2003-02-04 17:00:04 sp.B.36
    

    バイナリの説明 "Application"."Class"."CPUs"
    例:bt.A.4はbtベンチマークのクラスA、4CPUのバイナリ

  2. プログラムの実行

    lu.A.4の場合
    % scrun -nodes=4 lu.A.4
    

    sp.A.4の場合
    % scrun -nodes=4 sp.A.4
    

  3. 実行結果の確認

    実行するとプログラムの実行結果とともにベンチマークの計算結果が正しいか どうかが出力されます。
    is.B.8の例
    % scrun -nodes=8x1 is.B.8
     
    SCore-D 5.4.0 connected.
    
    
     NAS Parallel Benchmarks 2.4 -- IS Benchmark
    
     Size:  33554432  (class B)
     Iterations:   10
     Number of processes:     8
    
       iteration
            1
            2
            3
            4
            5
            6
            7
            8
            9
            10
    
    
     IS Benchmark Completed
     Class           =                        B
     Size            =                 33554432
     Iterations      =                       10
     Time in seconds =                     8.00
     Total processes =                        8
     Compiled procs  =                        8
     Mop/s total     =                    41.95
     Mop/s/process   =                     5.24
     Operation type  =              keys ranked
     Verification    =               SUCCESSFUL
     Version         =                      2.4
     Compile date    =              04 Feb 2003
    
     Compile options:
        MPICC        = mpicc 
        CLINK        = mpicc 
        CMPI_LIB     = (none)
        CMPI_INC     = (none)
        CFLAGS       = -O4
        CLINKFLAGS   = (none)
    
    
     Please send the results of this run to:
    
     NPB Development Team
     Internet: npb@nas.nasa.gov
    
     If email is not available, send this to:
    
     MS T27A-1
     NASA Ames Research Center
     Moffett Field, CA  94035-1000
    
     Fax: 650-604-3957
    

    実行結果では、Mop/s total(/s/process)とVerificationの項が重要です。ノー ド数を変えてみて、台数が増えた場合に性能が向上しているか?、計算結果が 正しいかを確認します。

  4. 実行データを比較してみる

    PCクラスタコンソーシアムでは、調査、評価部会の主催でNAS並列ベンチマー クの実行結果を収集することを計画しています。詳細については、 PCクラスタコンソーシアムのページ やSCore-Users MLで流す予定です。

トラブルシューディング

性能が良くない

計算結果がSUCESSFULにならない


CREDIT
This document is a part of the SCore cluster system software developed at PC Cluster Consortium, Japan. Copyright (C) 2003 PC Cluster Consortium.