[SCore-users-jp] Score+Scash+OmniMP

長谷川 篤史 a-hasega @ ats.nis.nec.co.jp
2002年 2月 25日 (月) 22:33:49 JST


始めまして、長谷川@NEC情報システムズと申します。
omniのランタイムライブラリ関連の開発を担当しておりました。


> で、この小規模な計算では、やはりノード数を増やす方が遅くなりました。
> (スイッチはギガビットですが、NICが100base)

原田さんもおっしゃられていますが、Omni/SCASHは、
分散共有メモリシステム上にOpenMP環境を実装しているため、
Remote Memory Readの速度が、かなり、プログラムの実行に影響を及ぼします。
myrinet2000のシステムですと、Remote Memory Readの速度が早いため、
性能が出やすいですが、100Base/Tでは、かなり難しいと思われます。

他にも、Omniをethernetで使用したいという意見が出でいましたので、
参考までに、Omniに付属のサンプル(/opt/omni/lib/openmp/examples/scash-
test/cg)をSCore-IIIクラスタで測定した結果を乗せておきます。

バリア同期が多く、omni/scashのsampleとしては、あまりよくないのですが....
簡単な行列演算で、ソースも付属していますので、なにかの参考にでもしていた
だけると幸いです。

==========================================================
cg-omp

myrinet2000
------------------------
node
: time
-------------------------
1
: 25.407382
2
: 18.099523
4
: 11.862331
8
:  9.582161
16
: 10.298733
32
: 14.122206


ether express pro 100
------------------------
node
: time
-------------------------
1
:  25.023178
2
:  49.618274
4
:  62.386232
8
:  90.973922
16
: 113.604717
32
: 159.409118
==========================================================

 
> 手元にNetgearの1000base-SXのNICがあるのですが、ethernetベースなら
> 改善されないのでしょうね。。。(それ以前に、scoreが対応してない?)

1000Baseのイーサネットを使ったOmni/SCASHの性能測定を行ってませんでしたで、
どのていど性能が改善されるのかはわかりません。
申し訳ありません。


> 私が使いたいのは微分方程式を数値的に解くレイトレーシングなので、
> PE間の通信は遅くても良いのでPCクラスタが適すると思ったのですが。。。

> 教訓
> (1)高機能スイッチには気をつけよう
> (2)メモリは鬼ほど積もう

メモリに関してですが、
  OMPC_DEBUG=1 ./a.out
として実行すると、デバッグメッセージとして、
プログラムが使用する共有メモリ容量を出力します。
実行には、最低でも、その倍の物理メモリを必要とします。
                            ~~~~
このため、不必要な変数はthread-private, private変数にして、
shared変数を減らすような工夫が必要となります。
 

---
長谷川 篤史  E-Mail:a-hasega @ ats.nis.nec.co.jp
株式会社NEC情報システムズ 基盤ソフトウェア事業部 サイエンス基盤部
外線:03-3798-9991(Fax.03-3798-9198) / 内線:8-115-2410(Fax.8-115-2419)




SCore-users-jp メーリングリストの案内