[SCore-users-jp] システムテストPM/Ethernet における躓き

KATAYAMA Yoshio kate @ pfu.fujitsu.com
2002年 10月 9日 (水) 13:49:43 JST


PFUの片山です。

Date: Wed, 09 Oct 2002 01:13:00 +0900
From: Okamoto Masafumi <okamoto @ gsport.co.jp>

>ただ、試しているうちに以下のような症状がみられることがわかりました。

>./scstest -network ethernet -count n -burst  で

>nが偶数のときは極端に通信が遅くなる(n=100程度以上で行うとTimeOutしてしまう)
>nが奇数のときにはn=199程度までは通信ができる、それ以上だとTimeOutしてしま>う。
>(例えば、n=2のときのほうがn=99のときよりも実行に時間がかかるのです)

こちらのクラスタでも同様の現象が起きています。構成は次の通りです。

サーバホスト
    Mother Board: AOpen AX4G Pro (845G)
    CPU: Celeron 1.7 GHz
    Memory: 256 MB (DDR PC2100)
    HDD: 80 GB
    NIC: On Board (RealTek 8100BL)                外部 LAN 接続用
         Corega FEther PCI-TXS (RealTek 8139C)    計算ホストとの通信用

計算ホスト(4台)
    Mother Board: AOpen AX4G Pro (845G)
    CPU: Pentium4 2.0A GHz
    Memory: 1 GB (DDR PC2100)
    HDD: 40 GB
    NIC: Corega FEther PCI-TXS (RealTek 8139C)
         Intel PRO/1000 T

#当初は、計算ホストの NIC は On Board + Intel PRO/1000 T でした
#が、On Board NIC が WOL 対応していないので PCI-TXS にしました

network に gigethernet を指定すれば問題ないのですが、ethernet を
指定すると発生します。

>また、一度nが偶数で実行 or 大きい値のnで実行 して通信が遅くなったり、
>TimeOutすると マシンをリブートしないかぎり通信は遅いままです。
>(通信が遅いとは、例えば、scout hostname のようなコマンドにも5分程度の時間が
>かかるような状態です)

こちらのクラスタでは、この状態になった時は計算ホストの NIC を立
上げ直す(ifdown + ifup)と、通信が正常に戻ります。ただし、1回で
は直らず、何回か繰り返す必要がある時もあります。

常に計算ホストで NIC の立上げ直しが必要なわけでなく、大抵は一部
の計算ホストで立上げ直せば済みます。立上げ直しの要/不要は YP を
引けるか(ypcat passwd)で判定しています。

解決策でなくて済みません。
--
(株)PFU OSSC)Linuxシステム部
片山 善夫
Tel 044-520-6617  Fax 044-556-1022



SCore-users-jp メーリングリストの案内