[SCore-users-jp] PM/Myrinet及びPM/S hmemにおけるゼロコピー機能のメカニズム
kameyama @ pccluster.org
kameyama @ pccluster.org
2004年 2月 26日 (木) 09:37:23 JST
亀山です.
ちなみに, これらの実験で結果自体は正しかったのですよね?
In article <200402251232.VAA14015 @ smgw01.itg.hitachi.co.jp.> hi-morita @ itg.hitachi.co.jp wrotes:
> 演算部では主に行列演算を行っています。
> 演算部ではMPI等の通信関数は使用しておりません。
確認ですが, そうすると, 最終的に各プロセスで計算した結果を
統合して出力する必要がある (そのために MPI の関数を使用する必要がある)
と思いますが, その部分は演算部の後の計測範囲外の部分にあるという
認識でよろしいでしょうか?
> 以上より、完全に演算部は通信部と独立になっており、ゼロコピー機能は
> 演算部に影響を及ぼさないと考えております。
私もそう思います.
> (1) 通信部と演算部が独立しているプログラムにおいて、ゼロコピー機能は
> 演算部分に影響を与える(演算部分の性能が向上/劣化する)のでしょうか。
影響は与えないはずです.
> >>(3) 8way(2*4)の場合
> >> ゼロコピーON ゼロコピーOFF
> >> 1. 演算部分の性能[MFLOPS] 7294 13774
> >> 2. 通信部分の性能[MB/sec] 71.5 61.7
>
> 特に上記結果において、何故、演算部分の性能が大きく劣化したのでしょうか。
わかりません.
確かにこの結果をみると, 誤差以上の差があるように思われますが,
本当に誤差ではないのか, zerocopy 以外の要因が存在しないのかが
不明です.
(ちなみに, プログラムを実行したときの性能のばらつきは
どの程度あるのでしょうか?)
zerocopy の通信性能も, Myrinet の通信性能 250 MB/sec と単純に比較すると
小さいような気がしますが, 4 process あるので 4 倍の通信が行なわれると
考えると zerocopy on のとき 280 MB/sec となり, 今度は少し速すぎる
ような気もしますし...
> (2) 亀山様の回答を読んだ私の理解では、ゼロコピー機能は通信部分のみ影響
> を与える機能と理解したのですが、正しいでしょうか。
正しいです.
from Kameyama Toyohisa
SCore-users-jp メーリングリストの案内