[SCore-users-jp] Re:Re:Re: [SCore-users-jp]PM のエラー等について

Shinji Sumimoto s-sumi @ flab.fujitsu.co.jp
2004年 6月 10日 (木) 09:56:59 JST


池上様

富士通研の住元です。

こちらでも試してみましたが、Xeon + e1000の組合せでは長時間走らせている
とHeader Checksum errorが頻度はかなり低いですが、出ることを確認しまし
た。個別のノードに偏っていない場合でData Checksum errorが出ていなけれ
ばネットワーク的には問題ないです。

以前、同様の現象は、eepro100でも観測していて、送信のPCI DMA時にDMAが失
敗する場合があり、それがHeader Checksum Errorを引き起こす場合があるこ
とがありました。

以上、よろしくお願いします。

From: k-ikegami @ aj.jp.nec.com
Subject: [SCore-users-jp] Re:Re:Re: [SCore-users-jp]PM のエラー等について
Date: Thu, 10 Jun 2004 09:31:15 +0900
Message-ID: <20040610093115k-ikegami @ mail.jp.nec.com>

k-ikegami> 住元様
k-ikegami> 
k-ikegami> 1ヶ月以上前(4/23)に、PM/EthernetにてCheckSumエラーが
k-ikegami> 発生する件について、ご相談させて頂いた池上です。
k-ikegami> 異なるスイッチで試してみては?というご助言を頂きましたが、マシンを
k-ikegami> 自由に触れる環境に無く、今まで時間を要してしまいました。
k-ikegami> 
k-ikegami> さて、結果ですが、100Base-Tの全く異なるスイッチを使用して見たところ、
k-ikegami> やはりCheck sum errorが発生してしまいました。
k-ikegami> 頻度としては、15時間の連続運転で13件でした。(全てHeader Checksum error)
k-ikegami> この状況から、NIC周りに原因がありそうですが、PMコンフィギュレーションファイル設定の
k-ikegami> チューニングで回避できるような問題なのか、それとも純粋にHWに依存する問題なのか?
k-ikegami> 見解を頂ければ幸いです。
k-ikegami> 
k-ikegami> 2004/04/26 14:02:03 +0900にk-ikegami @ aj.jp.nec.comさんに頂いた
k-ikegami> 「[SCore-users-jp] Re: [SCore-users-jp]PMのエラー等について」への返事です。
k-ikegami> >住元様
k-ikegami> >
k-ikegami> >池上です。
k-ikegami> >
k-ikegami> >>k-ikegami> >この2つのクラスタは同じスイッチにつながっているのでしょうか?  もし、同
k-ikegami> >>k-ikegami> >じスイッチにつながっているのであれば、スイッチが怪しいのかも知れません。
k-ikegami> >>k-ikegami> >
k-ikegami> >>k-ikegami> >以前、スイッチに内蔵されているバッファメモリのビット化けにより同様の現
k-ikegami> >>k-ikegami> >象に遭遇したことがあります。
k-ikegami> >>k-ikegami> 
k-ikegami> >>k-ikegami> 二つのクラスタは完全に分離されており、スイッチも物理的に別のものです。
k-ikegami> >>k-ikegami> プロセッサ、スイッチともに型番は全く同じものです。
k-ikegami> >>k-ikegami> 
k-ikegami> >>k-ikegami> 同じスイッチ(SMC8624T)を使用しておられる方いらっしゃいませんか?
k-ikegami> >>k-ikegami> 安心したいのですが。。
k-ikegami> >>
k-ikegami> >>2台ともそうなのであれば、スイッチ個体の問題ではないですね、
k-ikegami> >>
k-ikegami> >>スイッチの問題かどうかを切り分けるために、100BTで結構ですので別のスイッ
k-ikegami> >>チに接続してどうなるかを見て頂けないでしょうか?
k-ikegami> >
k-ikegami> >マシンを常時触れる環境に無いので、直ぐには試せないのですが、
k-ikegami> >実施次第、報告させて頂きます。
k-ikegami> >(質問しておいて申し訳ありません。)
k-ikegami> >
k-ikegami> >/*----------------------------------------------*/
k-ikegami> >// 池上 光太郎 e-mail: k-ikegami @ aj.jp.nec.com
k-ikegami> >_______________________________________________
k-ikegami> >SCore-users-jp mailing list
k-ikegami> >SCore-users-jp @ pccluster.org
k-ikegami> >http://www.pccluster.org/mailman/listinfo/score-users-jp
k-ikegami> /*----------------------------------------------*/
k-ikegami> // 池上 光太郎 e-mail: k-ikegami @ aj.jp.nec.com
k-ikegami> // TEL : 042-333-5470          FAX : 042-333-5267
k-ikegami> // 日本電気株式会社 電波応用事業部 航空システム部
k-ikegami> _______________________________________________
k-ikegami> SCore-users-jp mailing list
k-ikegami> SCore-users-jp @ pccluster.org
k-ikegami> http://www.pccluster.org/mailman/listinfo/score-users-jp
k-ikegami> 
k-ikegami> 
------
Shinji Sumimoto, Fujitsu Labs



SCore-users-jp メーリングリストの案内