[SCore-users-jp] SCore 環境での不具合

m01k0118 @ mailer.k.hosei.ac.jp m01k0118 @ mailer.k.hosei.ac.jp
2004年 11月 5日 (金) 22:50:01 JST


法政大学情報科学部の塚原です。

 RTL-8169Sのドライバのバージョンを1.6から2.2に更新し直し、実行したところ、6
4台でのmpirun,scrunが無事に成功しました。
 お騒がせして申し訳ありませんでした。

> 法政大学情報科学部の塚原と申します。
> 皆様よろしくお願いします。
>
>   現在、管理機を1台、計算ノードに64台を用い、並列計算させるためにSCore5.6.1
> を取り入れました。
>  EITを用い計算ノードのインストールが終了し、64台のグループを作成しました。
> システムテストのSCore-Dテストにおいて、mpirun、scrunの実行の際、ノード数を64
> にすると、時間をおいても反応がなく、
>   $sceptic -v -g グループ
>   と打つと、いくつかの計算ノードのping が Failedし、再起動を余儀なくされま
> した。
>  また、同様の環境で計算に使用するノード数を減少させましたが、上記と同じ現象
> が起きました。
>
>  次に、新たに32台でグループを構成し、mpirun,scrunを実行しましたところ、正確
> に結果が返ってくることが分かりました。さらに、ノード数32のグループを複数つく
> り、2つのグループを同時に起動し、実行させましたところ、こちらも正確に結果が
> 返ってきました。
>  
>  どのようにすれば、64台でも正確に結果が返ってくるのでしょうか?
>  教えていただければ幸いです。
>
>  以下が、クラスタ環境になります。
>  
> 管理機:
>  OS:RedHat7.3
>   CPU:PentiumIII 700Mhz L2-256KB  Coppermine
>  Memory:PC-133 320MB(256MB+64MB)
>  VGA:Canopus SPECTRA3200
>  NIC:Planex GN-1200TC(RTL-8169S)ドライバのversionは1.6
>
> 計算ノード(64台):
>  CPU:PentiumIII 700Mhz L2-256KB  Coppermine
>  Memory:PC-133 320MB(256MB+64MB)
>  VGA:Canopus SPECTRA3200
>  NIC:Planex GN-1200TC(RTL-8169S)ドライバのversionは1.6
>
> よろしくお願いします。
>

------------------------
法政大学情報科学部
塚原 恒太
m01k0118 @ k.hosei.ac.jp
------------------------





SCore-users-jp メーリングリストの案内