[SCore-users-jp] SCore-D:PANIC Network freezing timed out
kameyama @ pccluster.org
kameyama @ pccluster.org
2004年 3月 30日 (火) 09:35:12 JST
亀山です.
In article <20040326150904.F6B1.MATSUZAKA @ st-systems.co.jp> Teiji Matsuzaka <matsuzaka @ st-systems.co.jp> wrotes:
> 1ノード2CPUの112ノード構成のLinuxクラスタを構築し
> Open PBS/SCoreからNPB2.4のsp.A.25を何回か実行した
> ところ次の様なエラーが発生しました。
> scored を使用して別の計算を行った時も同じエラーが
> 発生します。正常終了する場合もあります。
正常終了する場合としない場合で, machine 構成に
違いはないでしょうか?
> 【ネットワークモジュール】
> 昨年6月に導入した70ノード: broadcom5703
> (安定稼動していたシステムです)
> 増設分 42ノード: broadcom5704
> (増設後に今回のエラーが発生しております)
112 host ということは多分, 複数の switch を使用している
わけですよね?
その switch 間の速度がでない状態で,
割り当てられた 13 台が複数の host に分散されているため,
data 転送がつまってしまっているということはありませんでしょうか?
from Kameyama Toyohisa
SCore-users-jp メーリングリストの案内