[SCore-users-jp] SCore環境での不具合

Tsukahara kouta m01k0118 @ k.hosei.ac.jp
2004年 11月 4日 (木) 17:40:37 JST


法政大学情報科学部の塚原と申します。
皆様よろしくお願いします。

  現在、管理機を1台、計算ノードに64台を用い、並列計算させるためにSCore5.6.1を取り入れました。
 EITを用い計算ノードのインストールが終了し、64台のグループを作成しました。システムテストのSCore-Dテストにおいて、mpirun、scrunの実行の際、ノード数を64にすると、時間をおいても反応がなく、
  $sceptic -v -g グループ
  と打つと、いくつかの計算ノードのping が Failedし、再起動を余儀なくされました。
 また、同様の環境で計算に使用するノード数を減少させましたが、上記と同じ現象が起きました。

 次に、新たに32台でグループを構成し、mpirun,scrunを実行しましたところ、正確に結果が返ってくることが分かりました。さらに、ノード数32のグループを複数つくり、2つのグループを同時に起動し、実行させましたところ、こちらも正確に結果が返ってきました。
 
 どのようにすれば、64台でも正確に結果が返ってくるのでしょうか?
 教えていただければ幸いです。

 以下が、クラスタ環境になります。
 
管理機:
 OS:RedHat7.3
  CPU:PentiumIII 700Mhz L2-256KB  Coppermine
 Memory:PC-133 320MB(256MB+64MB)
 VGA:Canopus SPECTRA3200
 NIC:Planex GN-1200TC(RTL-8169S)ドライバのversionは1.6

計算ノード(64台):
 CPU:PentiumIII 700Mhz L2-256KB  Coppermine
 Memory:PC-133 320MB(256MB+64MB)
 VGA:Canopus SPECTRA3200
 NIC:Planex GN-1200TC(RTL-8169S)ドライバのversionは1.6

よろしくお願いします。

------------------------
法政大学情報科学部
塚原 恒太
m01k0118 @ k.hosei.ac.jp
------------------------ 




SCore-users-jp メーリングリストの案内