[SCore-users-jp] Re: Is it a MPICH-SCore problem?

Ryoichi INAGAKI inagaki @ ueda.info.waseda.ac.jp
2005年 12月 8日 (木) 16:35:18 JST


住元様

早稲田大学の稲垣です。
ご指摘いただいた点について調べてみました。

On Thu, 08 Dec 2005 14:58:01 +0900 (JST), 
Shinji Sumimoto <s-sumi @ flab.fujitsu.co.jp> wrote:

> プログラムを stat=all オプションを使った時に得られるCPU結果と実際の
> elapse時間とは差がありますでしょうか? 
> 
>> $ scrun -nodes=4x1,stat=all ./a.out

これについては特に差が発生しませんでした。

[inagaki @ salers matrix]$ scrun -nodes=1x1,stat=all ./a.out
SCore-D 5.8.3 connected.
<0:0> SCORE: One node ready.
     2.490 sec.

-=-=-=-= SCore-D Statistics =-=-=-=-
Nodes:1, User:2.657[S], Elapsed:2.860[S], CSW:1, CKPT:0
1[hosts]x1[procs], salers00.clusters.ueda.info.waseda.ac.jp...salers00.clusters.ueda.info.waseda.ac.jp

#Node UsrTime  SysTime      Mem   Disk   #SC  IO  Exit
    0 2.544[S]  63.0[m] 14.30[MB]  1[MB]   5 0[B]    0
  Min 2.544[S]  63.0[m] 14.30[MB]  1[MB]   5 0[B]  ---
  Max 2.544[S]  63.0[m] 14.30[MB]  1[MB]   5 0[B]  ---
  Ave 2.544[S]  63.0[m] 14.30[MB]  1[MB]   5 0[B]  ---

[inagaki @ salers matrix]$ scrun -nodes=2x1,stat=all ./a.out
SCore-D 5.8.3 connected.
<0:0> SCORE: 2 nodes (2x1) ready.
     7.210 sec.
     7.220 sec.

-=-=-=-= SCore-D Statistics =-=-=-=-
Nodes:2, User:7.448[S], Elapsed:7.651[S], CSW:1, CKPT:0
2[hosts]x1[procs], salers00.clusters.ueda.info.waseda.ac.jp...salers01.clusters.ueda.info.waseda.ac.jp
 [0:0]
Network:
ethernet/ethernet:1[1];
 [1:0] ethernet/ethernet:1[1];

#Node UsrTime  SysTime      Mem   Disk   #SC  IO  Exit
    0 7.275[S]  80.0[m] 15.07[MB]  1[MB]   5 0[B]    0
    1 7.280[S]  92.0[m] 14.80[MB]  1[MB]   5 0[B]    0
  Min 7.275[S]  80.0[m] 14.80[MB]  1[MB]   5 0[B]  ---
  Max 7.280[S]  92.0[m] 15.07[MB]  1[MB]   5 0[B]  ---
  Ave 7.277[S]  86.0[m] 14.93[MB]  1[MB]   5 0[B]  ---


 
> また 以下のドキュメントにあるPM のテスト結果はどうでしょう?
> 
> http://www.pccluster.org/score/dist/score/html/ja/installation/pm-test.html

PM/Ethernet, PM/Shmem についてテストを行ったところ、
PM/Ethernet の Point-to-Point テストの挙動に不審な部分がありました。

rpmtest が普通に成功する場合と応答が返ってこない場合があり、その割合は
後者の方が多いです。計算ノードの /proc/pm/ethernet/0/info を見てみたと
ころ

Dev error       :       2

という値が設定されていました。他の計算ノードでも 0 以上の値が設定され
ていたので、何かしら PM ドライバ周辺でエラーが発生しているということを
意味しているのでしょうか・・・?

使用しているネットワークデバイスは Broadcom BCM5721 で Fedora Core 4
では tg3 ドライバを使用しています。

PM/Ethernet の scstest, PM/Shmem のすべてのテストについてはエラーなど
は発生しませんでした。

_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/
  早稲田大学大学院 理工学研究科
  情報・ネットワーク専攻 上田研究室 D1

  稲垣 良一  <inagaki @ ueda.info.waseda.ac.jp> 
_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/



SCore-users-jp メーリングリストの案内