[SCore-users-jp] PM/Myrinet及びPM/S hmemにおけるゼロコピー機能のメカニズム
hi-morita @ itg.hitachi.co.jp
hi-morita @ itg.hitachi.co.jp
2004年 2月 25日 (水) 15:22:26 JST
SCore開発関係者様
日立製作所の森田と申します。
SCoreのゼロコピー機能に関して、下記質問に対する回答をお願い致します。
-----以下、質問
通信部と演算部がオーバーラップしていないMPIを使用したプログラム(参考(1))
において、ゼロコピー機能を用いて性能測定を実施しました。
その結果、ノード内MPI並列の性能測定(参考(2))ではゼロコピー機能をONにした
場合、ゼロコピー機能をOFFにした場合と比較して演算部の性能が向上しました。
しかし、ノード間及びノード内MPI並列の性能測定(参考(3))ではゼロコピー機能
をONにした場合、ゼロコピー機能をOFFにした場合と比較して演算部の性能が劣
化しました。
上記の現象の原因を下記の点を考慮してご教授頂きたく、よろしくお願い致します。
・ゼロコピー機能がどのような動作をするのか。(動作の仕様を詳細にお願いします。)
・動作の仕様を考慮して、ゼロコピー機能が演算に対してどのような影響を与えるのか。
参考
(1) プログラムの概略
時間計測
通信部
時間計測
同期
時間計測
演算部
時間計測
(2) 4way(1*4)の場合
ゼロコピーON ゼロコピーOFF
1. 演算部分の性能[MFLOPS] 7758 6161
2. 通信部分の性能[MB/sec] 249.7 149.5
(3) 8way(2*4)の場合
ゼロコピーON ゼロコピーOFF
1. 演算部分の性能[MFLOPS] 7294 13774
2. 通信部分の性能[MB/sec] 71.5 61.7
(4) システム構成
1. 測定機 HA8500/630(4way/1node, Memory 16GB)×2台
2. CPU Itanium2 L3 3MB
3. OS Red Hat Linux Advanced Sever 2.1(Kernel Version 2.4.19-score)
4. コンパイラ Intel Fortranコンパイラ Version 7.1 Build 20030307
5. 並列実行環境 SCore 5.4
6. ノード間ネットワーク Myrinet2000(250MB/sec)
-以上-
SCore-users-jp メーリングリストの案内