[SCore-users-jp] pm-myrinet / pm-ethenet

Shinji Sumimoto s-sumi @ flab.fujitsu.co.jp
2004年 3月 17日 (水) 11:53:00 JST


菅野さま

富士通研の住元です。

From: "technical-center" <essb01 @ sse.co.jp>
Subject: [SCore-users-jp] pm-myrinet / pm-ethenet
Date: Mon, 15 Mar 2004 18:21:35 +0900
Message-ID: <000601c40a6e$ea3c57c0$0f321eac @ 98NX>

essb01> 住商エレクトロニクスの菅野と申します。
essb01> いつもお世話になっております。
essb01> 
essb01> 現在、SCore5.6.1のセットアップをしているのですが、
essb01> 以下がうまく動作しません。何か設定を変更する必要が
essb01> ございますでしょうか?
essb01> 念のため、関係ありそうなファイルを添付します。
essb01> 
essb01> 1.PM-Myrinet
essb01> 
essb01> Score5.6.1にて、PM-Myrinetのテストを動かすと、
essb01> 以下のように何回かに一度は、動作するのですが、
essb01> ほとんどエラーで動作しません。
essb01> 
essb01> Myrinetのエンクロージャは、64ポート用で、
essb01> ボードは、M3-SW16-8Fです。ボードは、1枚のみにしたり、
essb01> 8枚全てセットしたり、いろいろ試しても同様です。
essb01> 
essb01> lanaixp.interruptbugfix.mcp
essb01> は、所定のディレクトリにコピーし、scorehosts.dbも編集しています。
essb01> 計算ノードをシャットダウン、サーバをrebootし、計算ノードを
essb01> 再起動しても同様です。
essb01> 
essb01> 
essb01> # ./rpmtest comp00 myrinetxp -dest 0 -ping
essb01> 8	4.16347e-06
essb01> # ./rpmtest comp00 myrinetxp -dest 0 -ping
essb01> [0] chan=0, crc=0, unknown=0, nres=0, arep=0
essb01> [0] recv: recv=0, ack=0, nack=0, write=0, wack=0, read=0, rreply=0,
essb01> discard=0
essb01> [0] recv: put_addr=16, get_addr=0
essb01> [0] recv: error=0(0), data=0:0(0) 1:0(0) 2:0(0) 3:0(0) 4:0(0) 5:0(0) 6:0(0)
essb01> 7:0(0)
essb01> [0] send: send=0, ack=0, nack=0, write=0, wack=0, read=0, rreply=0,
essb01> resend=0,0
essb01> [0] send: request=0, disable=0, deactivated=0, last_write=(0, 0),
essb01> last_read=(0, 0)
essb01> [0] send: putp=1, getp=1, relp=1
essb01> [0] send: error=0(0), data=0:0(0) 1:0(0) 2:0(0) 3:0(0) 4:0(0) 5:0(0) 6:0(0)
essb01> 7:0(0)
essb01> [0] retry: count=0, putp=0, getp=0, request=0
essb01> 
essb01> [0] reply: putp=0, getp=0, request=0
essb01> 
essb01> waiting ack
essb01> 
essb01> waiting to send
essb01> 
essb01> message ack info
essb01> [0] REL-MSG:(0) sack=0, rack=1, stat=8
essb01> rma ack info
essb01> pmReceive: Connection timed out(110)

おそらく、ループバックの試験と思われますが、2ノード通信でも同じ状況で
しょうか? MyrinetXPについては、いくつか不具合が見つかり現在修正中です。

修正は次のdistributionでの配布になりますが、住商エレクトロニクスはPCク
ラスタコンソーシアム会員企業ですので、修正については別途ご相談ください。

essb01> 2.PM-Ethernet
essb01> 
essb01> pm-ethernet.confファイルにて、intreapをoffにしても、計算ノードの
essb01> /procを見ると、onのままです。/etc/init.d/pm_ethernetを
essb01> 直接編集して、offにすると、offになります。
essb01> pm-ethernet.confファイルの編集だけではだめなのでしょうか?

設定ファイルは実行時にしか読まれないので、設定ファイルを変更するのに加
えて、プログラムを実行しないと反映されません。

実行しても反映されないのであれば、オプションが間違っている可能性があります。

以上、よろしくお願いします。
------
Shinji Sumimoto, Fujitsu Labs



SCore-users-jp メーリングリストの案内