[SCore-users-jp] MPICH 環境と SCore 環境の比較

Shinji Sumimoto s-sumi @ flab.fujitsu.co.jp
2004年 3月 10日 (水) 14:05:07 JST


駒澤さま

富士通研の住元です。

From: "P.D" <diver_oct1981 @ yahoo.co.jp>
Subject: Re: [SCore-users-jp] MPICH 環境と SCore 環境の比較
Date: Sat, 6 Mar 2004 19:37:35 +0900 (JST)
Message-ID: <20040306103735.96890.qmail @ web705.mail.yahoo.co.jp>

diver_oct1981> 住元様
diver_oct1981> 
diver_oct1981> いつもお世話になります琉球大学の駒澤です。
diver_oct1981> お返事遅れてしまいまして大変申し訳ありません。
diver_oct1981> 
diver_oct1981> > 1) MPICHとの性能差はどれくらいでしょう?
diver_oct1981> に関しましては姫野ベンチマークで
diver_oct1981> $./paramset M 1 1 4
diver_oct1981> と設定をしまして4台同士で計った結果
diver_oct1981> MPICH:512.3MFlops
diver_oct1981> SCore:467.2MFlops
diver_oct1981> の差がでてきます。

diver_oct1981> 
diver_oct1981> > 2)そのアプリケーションはNFS経由でデータを大量に書き出
diver_oct1981> し
diver_oct1981> >てますか?
diver_oct1981> に関しましては自分で作った数値計算でただのMPIプログラム
diver_oct1981> で
diver_oct1981> しすのでそこまで大量のデータの送受信は行っていないと思う
diver_oct1981> のですが。一回の送受信で多い時で1000個のデータ程度です。
diver_oct1981> 
diver_oct1981> > 3)重複しての確認になるかも知れませんが、NICの種類とデ
diver_oct1981> バ
diver_oct1981> >イスドライバのバージョンを教えてください。
diver_oct1981> に関しましては
diver_oct1981> ・CPU:Pentium IV2.66GHz
diver_oct1981> ・メモリ:DDR512-2100-2.5(OEM)512MB 
diver_oct1981> ・マザーボード:GA-8SG667,SiS 648 chipset(GIGABYTE)
diver_oct1981> ・NIC:FA310TX REV-D2(NETGEAR)
diver_oct1981> ・MPICH環境:1.2.5.2
diver_oct1981> ・SCore環境:5.6.0
diver_oct1981> という環境でおこなっています
diver_oct1981> あれから少し自分なりに姫野ベンチを用いて解析を行ってみた
diver_oct1981> のですがMPICHとSCoreのMFlops数の伸びがMPICHは台数を増や
diver_oct1981> すにつれ落ちているのに比べSCoreは一定の伸びを見せており
diver_oct1981> ます。このことからMPICHはある程度の台数で頭打ちになって
diver_oct1981> しまいSCoreの利点は台数を増やしていった時にみえてくるの
diver_oct1981> ではと考えられます。この点はいかがでしょうか。

ネットワークは100BTのドライバはtulipでよろしいでしょうか?  2年前に評価
したところでは、純粋のtulipを使った場合でも2.4付属のtulip.cはあまり性
能が良くありませんでした。

そうだとすると、

maxnsend 24 
backoff 2400

の設定よりも

maxnsend 16 
backoff 3600

の方が性能が出やすいと思います。

あと、
scrun -nodes=4x1,mpi_eager=1000000 a.out
ではどうでしょうか?

SCoreのtulipドライバは性能が高く、安定して動作するようにデバイスドライ
バにいくつか修正しています。ですが、この最適化が互換チップで有効かどう
かは検証できていません。

diver_oct1981> また、NPBをベンチマークとしてとろうとしたのですが
diver_oct1981> 例えばlu.2.Aを生成しようと考えた場合エラーが出てきて
diver_oct1981> しまいます。
diver_oct1981> 方法*******************************************
diver_oct1981> cd NPB2.4.1/NPB2.4-MPI/config
diver_oct1981> make.defをコピーで作成し以下のように設定を変更
diver_oct1981> MPIF77		=/opt/score/bin/mpif77
diver_oct1981> FLINK		=/opt/score/bin/mpif77
diver_oct1981> MPICC		=/opt/score/bin/mpicc
diver_oct1981> CLINK		=/opt/score/bin/mpicc
diver_oct1981> その後makeします。
diver_oct1981> $make LU NPROCS=2 CLASS=A
diver_oct1981> しかし、/NPB2.4-MPI/LU/init_comm.oにエラーがあると
diver_oct1981> 言われてしまいます。
diver_oct1981> 何か良い解決方法があればこの点につきましても
diver_oct1981> アドバイスをいただけると大変助かります。それでは
diver_oct1981> お手数ですがなにとぞよろしくお願いいたします。
diver_oct1981>      
diver_oct1981>  ****************
diver_oct1981>  琉球大学 理学部
diver_oct1981>   駒澤 孝美
diver_oct1981>  ****************
diver_oct1981> 
diver_oct1981> 
diver_oct1981> _______________________________________________
diver_oct1981> SCore-users-jp mailing list
diver_oct1981> SCore-users-jp @ pccluster.org
diver_oct1981> http://www.pccluster.org/mailman/listinfo/score-users-jp
diver_oct1981> 
diver_oct1981> 
------
Shinji Sumimoto, Fujitsu Labs



SCore-users-jp メーリングリストの案内