[SCore-users-jp] PM/Myrinet及びPM/S hmemにおけるゼロコピー機能のメカニズム

kameyama @ pccluster.org kameyama @ pccluster.org
2004年 2月 26日 (木) 09:37:23 JST


亀山です.
ちなみに, これらの実験で結果自体は正しかったのですよね?

In article <200402251232.VAA14015 @ smgw01.itg.hitachi.co.jp.> hi-morita @ itg.hitachi.co.jp wrotes:
> 演算部では主に行列演算を行っています。
> 演算部ではMPI等の通信関数は使用しておりません。

確認ですが, そうすると, 最終的に各プロセスで計算した結果を
統合して出力する必要がある (そのために MPI の関数を使用する必要がある)
と思いますが, その部分は演算部の後の計測範囲外の部分にあるという
認識でよろしいでしょうか?

> 以上より、完全に演算部は通信部と独立になっており、ゼロコピー機能は
> 演算部に影響を及ぼさないと考えております。

私もそう思います.

> (1) 通信部と演算部が独立しているプログラムにおいて、ゼロコピー機能は
>     演算部分に影響を与える(演算部分の性能が向上/劣化する)のでしょうか。

影響は与えないはずです.

> >>(3) 8way(2*4)の場合
> >>                          ゼロコピーON  ゼロコピーOFF
> >> 1. 演算部分の性能[MFLOPS]    7294      13774
> >> 2. 通信部分の性能[MB/sec]    71.5       61.7
> 
>     特に上記結果において、何故、演算部分の性能が大きく劣化したのでしょうか。

わかりません.

確かにこの結果をみると, 誤差以上の差があるように思われますが,
本当に誤差ではないのか, zerocopy 以外の要因が存在しないのかが
不明です.
(ちなみに, プログラムを実行したときの性能のばらつきは
どの程度あるのでしょうか?)

zerocopy の通信性能も, Myrinet の通信性能 250 MB/sec と単純に比較すると
小さいような気がしますが, 4 process あるので 4 倍の通信が行なわれると
考えると zerocopy on のとき 280 MB/sec となり, 今度は少し速すぎる
ような気もしますし...

> (2) 亀山様の回答を読んだ私の理解では、ゼロコピー機能は通信部分のみ影響
>     を与える機能と理解したのですが、正しいでしょうか。

正しいです.

                       from Kameyama Toyohisa



SCore-users-jp メーリングリストの案内