[SCore-users-jp] PM/Myrinet及びPM/S hmemにおけるゼロコピー機能のメカニズム

hi-morita @ itg.hitachi.co.jp hi-morita @ itg.hitachi.co.jp
2004年 2月 25日 (水) 15:22:26 JST


SCore開発関係者様

日立製作所の森田と申します。

SCoreのゼロコピー機能に関して、下記質問に対する回答をお願い致します。

-----以下、質問

通信部と演算部がオーバーラップしていないMPIを使用したプログラム(参考(1))
において、ゼロコピー機能を用いて性能測定を実施しました。

その結果、ノード内MPI並列の性能測定(参考(2))ではゼロコピー機能をONにした
場合、ゼロコピー機能をOFFにした場合と比較して演算部の性能が向上しました。

しかし、ノード間及びノード内MPI並列の性能測定(参考(3))ではゼロコピー機能
をONにした場合、ゼロコピー機能をOFFにした場合と比較して演算部の性能が劣
化しました。

上記の現象の原因を下記の点を考慮してご教授頂きたく、よろしくお願い致します。

・ゼロコピー機能がどのような動作をするのか。(動作の仕様を詳細にお願いします。)
・動作の仕様を考慮して、ゼロコピー機能が演算に対してどのような影響を与えるのか。

参考

(1) プログラムの概略

時間計測
通信部
時間計測
同期
時間計測
演算部
時間計測

(2) 4way(1*4)の場合
                          ゼロコピーON  ゼロコピーOFF
 1. 演算部分の性能[MFLOPS]    7758       6161
 2. 通信部分の性能[MB/sec]    249.7      149.5

(3) 8way(2*4)の場合
                          ゼロコピーON  ゼロコピーOFF
 1. 演算部分の性能[MFLOPS]    7294      13774
 2. 通信部分の性能[MB/sec]    71.5       61.7

(4) システム構成

 1. 測定機 HA8500/630(4way/1node, Memory 16GB)×2台
 2. CPU Itanium2 L3 3MB
 3. OS Red Hat Linux Advanced Sever 2.1(Kernel Version 2.4.19-score)
 4. コンパイラ Intel Fortranコンパイラ Version 7.1 Build 20030307
 5. 並列実行環境 SCore 5.4
 6. ノード間ネットワーク Myrinet2000(250MB/sec)

-以上-



SCore-users-jp メーリングリストの案内