[SCore-users-jp] pm/ethernet error ( SCore 5.8.3 )

hata kei kei_hata @ hotmail.com
2005年 12月 20日 (火) 18:05:24 JST


住元様

畑田です。


サーバホストの/opt/score/etc/pm-ethernet.confに"intreap 0"を加えて、念のため
全てのマシンを再起動しました。
すると

[root @ teoworld ~]# cat /proc/pm/ethernet/0/info
PM Ethernet 0330
Version         :       "$Id: pm_ethernet_dev.c,v 1.14 2005/10/10 04:49:13 
s-sumi Exp $"
Device          :       eth0
Irq             :       0
MTU             :       1468 Bytes
Maxnodes        :       512
MaxContext      :       16
Intreap         :       off
Checksum        :       off
Dev error       :       0
Header err      :       0
Header cksum err:       0
Data cksum err  :       0
Underrun err    :       0


となりIntreapがoffになりました。Dev errorは0になったのですが、その一時間後に
1になりまた0に戻ったりしています。


rpmtestは以前おかしいようで、

[root @ teoworld ~]# rpmtest teofarm1 ethernet -reply

[root @ teoworld ~]# time rpmtest teofarm2 ethernet -dest 1 -ping
8       0.00015283

real    0m15.631s
user    0m0.002s
sys     0m0.005s
[root @ teoworld ~]# time rpmtest teofarm4 ethernet -dest 1 -ping
8       0.000124942

real    0m12.850s
user    0m0.003s
sys     0m0.004s

となり時間がかかってしまいます。また、
[root @ teoworld ~]# rpmtest teofarm2 ethernet -reply

[root @ teoworld ~]# time rpmtest teofarm1 ethernet -dest 1 -ping
pmGetSendBuffer: Invalid argument(22)

real    0m0.368s
user    0m0.001s
sys     0m0.006s

[root @ teoworld ~]# time rpmtest teofarm4 ethernet -dest 1 -ping
pmReceive: Connection timed out(110)

real    0m21.463s
user    0m0.003s
sys     0m0.004s

となりエラーがでます。 われわれのclusterの構成は

teoworld:サーバー兼計算ホスト
teofarm1:計算ホスト
teofarm2:計算ホスト
teofarm4:計算ホスト

で、それぞれ2 x xeon2.8GHzです。


一方総合テストでは少し状況が変わり、依然前のメールで報告したエラーがでるので
すが、何回もやっているとたまに

[root @ teoworld ~]# scstest -network ethernet
-config:file=/opt/score5.8.3/etc/pm-ethernet.conf
type=ethernet
SCSTEST: BURST on ethernet(chan=0,ctx=0,len=16)
50 K packets. (1.153e+02 kpps)
100 K packets. (1.076e+02 kpps)
150 K packets. (1.164e+02 kpps)
200 K packets. (1.366e+01 kpps)
250 K packets. (8.304e+01 kpps)
300 K packets. (6.819e+01 kpps)

というように通信が行なわれたりもします。

scrunのhello.ccのテストは依然は何故か-nodes=4以上使うと計算が止まってしまっ
ていたのが、"intreap 0"加えたあとは我々の全cpu数8まで使っても問題が発生しな
くなりました。

よろしくお願い致します。




>From: Shinji Sumimoto <s-sumi @ flab.fujitsu.co.jp>
>To: kei_hata @ hotmail.com
>CC: score-users-jp @ pccluster.org, s-sumi @ flab.fujitsu.co.jp
>Subject: Re: [SCore-users-jp] pm/ethernet error ( SCore 5.8.3 )
>Date: Tue, 20 Dec 2005 10:47:54 +0900 (JST)
>
>畑田様
>
>住元です。
>
>/opt/score/etc/pm-ethernet.confに以下のパラメータを設定して
>試してもらえますでしょうか?
>
>intreap 0
>
>From: "hata kei" <kei_hata @ hotmail.com>
>Subject: Re: [SCore-users-jp] pm/ethernet error ( SCore 5.8.3 )
>Date: Mon, 19 Dec 2005 20:37:31 +0900
>Message-ID: <BAY7-F980EEB3FB393805DA5F95EB3F0 @ phx.gbl>
>
>kei_hata> 住元樣
>kei_hata>
>kei_hata>  畑田です。
>kei_hata>
>kei_hata>  使用しているネットワークインターフェイスは1000MBで、スイッチは
NETGEARの16
>kei_hata> ポートのgigabitスイッチです。SCore5.8.0がインストールされたマシン
がそのうち7
>kei_hata> つのポートを使って稼働中です。今回SCore5.8.3をインストールしたマ
シンがそのう
>kei_hata> ち4つのポートを使用しています。
>kei_hata>
>kei_hata> サーバホストにおけるコマンドの実行結果は、
>kei_hata>
>kei_hata> [root @ teoworld ~]# cat /proc/pm/ethernet/0/info
>kei_hata> PM Ethernet 0330
>kei_hata> Version         :       "$Id: pm_ethernet_dev.c,v 1.14 
2005/10/10 04:49:13
>kei_hata> s-sumi Exp $"
>kei_hata> Device          :       eth0
>kei_hata> Irq             :       0
>kei_hata> MTU             :       1468 Bytes
>kei_hata> Maxnodes        :       512
>kei_hata> MaxContext      :       16
>kei_hata> Intreap         :       on
>kei_hata> Checksum        :       off
>kei_hata> Dev error       :       1
>kei_hata> Header err      :       0
>kei_hata> Header cksum err:       0
>kei_hata> Data cksum err  :       0
>kei_hata> Underrun err    :       0
>kei_hata>
>kei_hata> Point-to-Point テスト (メッセージ) に対応したpingの結果は以下の様
です。
>kei_hata> [root @ teofarm1 ~]# ping teofarm2
>kei_hata> PING teofarm2.lnf.infn.it (192.168.180.18) 56(84) bytes of data.
>kei_hata> 64 bytes from teofarm2.lnf.infn.it (192.168.180.18): icmp_seq=0 
ttl=64
>kei_hata> time=0.540 ms
>kei_hata> 64 bytes from teofarm2.lnf.infn.it (192.168.180.18): icmp_seq=1 
ttl=64
>kei_hata> time=0.083 ms
>kei_hata> 64 bytes from teofarm2.lnf.infn.it (192.168.180.18): icmp_seq=2 
ttl=64
>kei_hata> time=0.062 ms
>kei_hata> 64 bytes from teofarm2.lnf.infn.it (192.168.180.18): icmp_seq=3 
ttl=64
>kei_hata> time=0.162 ms
>kei_hata> 64 bytes from teofarm2.lnf.infn.it (192.168.180.18): icmp_seq=4 
ttl=64
>kei_hata> time=0.139 ms
>kei_hata> 64 bytes from teofarm2.lnf.infn.it (192.168.180.18): icmp_seq=5 
ttl=64
>kei_hata> time=0.122 ms
>kei_hata> 64 bytes from teofarm2.lnf.infn.it (192.168.180.18): icmp_seq=6 
ttl=64
>kei_hata> time=0.216 ms
>kei_hata> 64 bytes from teofarm2.lnf.infn.it (192.168.180.18): icmp_seq=7 
ttl=64
>kei_hata> time=0.191 ms
>kei_hata>
>kei_hata> --- teofarm2.lnf.infn.it ping statistics ---
>kei_hata> 8 packets transmitted, 8 received, 0% packet loss, time 7001ms
>kei_hata> rtt min/avg/max/mdev = 0.062/0.189/0.540/0.141 ms, pipe 2
>kei_hata>
>kei_hata>
>kei_hata> よろしくお願い致します
>kei_hata>
>kei_hata> 
_________________________________________________________________
>kei_hata> 迷惑メールやウイルスへの対策も万全「MSN Hotmail」
>kei_hata> http://promotion.msn.co.jp/hotmail/
>kei_hata>
>------
>Shinji Sumimoto, Fujitsu Labs

_________________________________________________________________
MSNショッピングでXbox360を早速チェック! 
http://shopping.msn.co.jp/softcontent/softcontent.aspx?scmId=593 




SCore-users-jp メーリングリストの案内