[SCore-users-jp] SCore-D:PANIC Network freezing timed out

kameyama @ pccluster.org kameyama @ pccluster.org
2004年 3月 30日 (火) 09:35:12 JST


亀山です.

In article <20040326150904.F6B1.MATSUZAKA @ st-systems.co.jp> Teiji Matsuzaka <matsuzaka @ st-systems.co.jp> wrotes:
> 1ノード2CPUの112ノード構成のLinuxクラスタを構築し
> Open PBS/SCoreからNPB2.4のsp.A.25を何回か実行した
> ところ次の様なエラーが発生しました。
> scored を使用して別の計算を行った時も同じエラーが
> 発生します。正常終了する場合もあります。

正常終了する場合としない場合で, machine 構成に
違いはないでしょうか?

> 【ネットワークモジュール】
> 昨年6月に導入した70ノード: broadcom5703
> (安定稼動していたシステムです)
> 増設分          42ノード: broadcom5704
> (増設後に今回のエラーが発生しております)

112 host ということは多分, 複数の switch を使用している
わけですよね?

その switch 間の速度がでない状態で,
割り当てられた 13 台が複数の host に分散されているため,
data 転送がつまってしまっているということはありませんでしょうか?

                       from Kameyama Toyohisa



SCore-users-jp メーリングリストの案内