[SCore-users-jp] システムテストPM/Ethernet における躓き

Shinji Sumimoto s-sumi @ flab.fujitsu.co.jp
2002年 10月 9日 (水) 17:28:35 JST


富士通研の住元です。

From: KATAYAMA Yoshio <kate @ pfu.fujitsu.com>
Subject: Re: [SCore-users-jp] システムテストPM/Ethernet における躓き
Date: Wed, 09 Oct 2002 13:49:43 +0900
Message-ID: <200210090449.AA07875 @ flash.tokyo.pfu.co.jp>

kate> PFUの片山です。
kate> 
kate> Date: Wed, 09 Oct 2002 01:13:00 +0900
kate> From: Okamoto Masafumi <okamoto @ gsport.co.jp>
kate> 
kate> >ただ、試しているうちに以下のような症状がみられることがわかりました。
kate> 
kate> >./scstest -network ethernet -count n -burst  で
kate> 
kate> >nが偶数のときは極端に通信が遅くなる(n=100程度以上で行うとTimeOutしてしまう)
kate> >nが奇数のときにはn=199程度までは通信ができる、それ以上だとTimeOutしてしま>う。
kate> >(例えば、n=2のときのほうがn=99のときよりも実行に時間がかかるのです)
kate> 
kate> こちらのクラスタでも同様の現象が起きています。構成は次の通りです。
kate> 
kate> サーバホスト
kate>     Mother Board: AOpen AX4G Pro (845G)
kate>     CPU: Celeron 1.7 GHz
kate>     Memory: 256 MB (DDR PC2100)
kate>     HDD: 80 GB
kate>     NIC: On Board (RealTek 8100BL)                外部 LAN 接続用
kate>          Corega FEther PCI-TXS (RealTek 8139C)    計算ホストとの通信用
kate> 
kate> 計算ホスト(4台)
kate>     Mother Board: AOpen AX4G Pro (845G)
kate>     CPU: Pentium4 2.0A GHz
kate>     Memory: 1 GB (DDR PC2100)
kate>     HDD: 40 GB
kate>     NIC: Corega FEther PCI-TXS (RealTek 8139C)
kate>          Intel PRO/1000 T
kate> 
kate> #当初は、計算ホストの NIC は On Board + Intel PRO/1000 T でした
kate> #が、On Board NIC が WOL 対応していないので PCI-TXS にしました
kate> 
kate> network に gigethernet を指定すれば問題ないのですが、ethernet を
kate> 指定すると発生します。
kate> 
kate> >また、一度nが偶数で実行 or 大きい値のnで実行 して通信が遅くなったり、
kate> >TimeOutすると マシンをリブートしないかぎり通信は遅いままです。
kate> >(通信が遅いとは、例えば、scout hostname のようなコマンドにも5分程度の時間が
kate> >かかるような状態です)
kate> 
kate> こちらのクラスタでは、この状態になった時は計算ホストの NIC を立
kate> 上げ直す(ifdown + ifup)と、通信が正常に戻ります。ただし、1回で
kate> は直らず、何回か繰り返す必要がある時もあります。

この現象ですが、カーネルのログは何か出ていませんでしょうか?
dmesg, /var/log/messages /var/log/bootlog などです。

以下のフォーマットの出力が出ているはずなのですが、、

		printk (KERN_INFO"%s: Setting %s%s-duplex based on"
				" auto-negotiated partner ability %4.4x.\n",
		        dev->name, mii_lpa == 0 ? "" :
				(mii_lpa & 0x0180) ? "100mbps " : "10mbps ",
			tp->mii.full_duplex ? "full" : "half", mii_lpa);

auto negotiation がうまくいっていない場合があるではないかと思います。

kate> 常に計算ホストで NIC の立上げ直しが必要なわけでなく、大抵は一部
kate> の計算ホストで立上げ直せば済みます。立上げ直しの要/不要は YP を
kate> 引けるか(ypcat passwd)で判定しています。
kate> 
kate> 解決策でなくて済みません。
kate> --
kate> (株)PFU OSSC)Linuxシステム部
kate> 片山 善夫
kate> Tel 044-520-6617  Fax 044-556-1022
kate> _______________________________________________
kate> SCore-users-jp mailing list
kate> SCore-users-jp @ pccluster.org
kate> http://www.pccluster.org/mailman/listinfo/score-users-jp
kate> 
kate> 
------
Shinji Sumimoto, Fujitsu Labs



SCore-users-jp メーリングリストの案内