[SCore-users-jp] Re: [SCore-users-jp] SCore5.0でのdemoプロの実行について

Shinji Sumimoto s-sumi @ flab.fujitsu.co.jp
2002年 3月 25日 (月) 14:03:21 JST


住元です。

報告頂いた現象は、先週コンソーシアム内での企業の試験でも発生し、再現され
ました。ただいま調査中ですので、しばらく時間を頂けないでしょうか?

Message-ID: <200203250421.AA00861 @ F4EJ.strad.ssg.fujitsu.com>

iwa> ML一同様
iwa> 
iwa> いつもお世話になっております。
iwa> 
iwa> 富士通の岩谷です。
iwa> 
iwa> 先日のシンポジウムでは大変お世話になりありがとうございました。
iwa> 重要な情報が得られて大変満足しております。
iwa> 
iwa> さて早速、先日頂いたSCoreを顧客先に導入しております。インストール
iwa> 自体は問題なく終わったのですが、テストを行っている最中に以下の現象
iwa> が発生しました。原因と対処が判れば教えてください。
iwa> 
iwa> 現在構築の環境ですが、
iwa> 
iwa> [サーバホスト]
iwa> CPU:Pentimu� Xeon 900MHz ×1
iwa> チップセット:CNB20HE
iwa> メインメモリ:1GB RDRAM(PC800、ECC対応)
iwa> 
iwa> [計算ホスト]
iwa> CPU:Xeon processor 2GHz ×2
iwa> チップセット:Intel(R) 860 システムバス:400MHz
iwa> メインメモリ:4GB RDRAM(PC800、ECC対応)
iwa> 
iwa> OSはRHL7.2でSCore5.0を使っています。
iwa> また、各計算ホスト間はGigaEtherで接続しています。
iwa> サーバホストと計算ホスト間はEhterで接続しています。
iwa> 
iwa> 起っている現象は以下の通りです。
iwa> 
iwa> [現象]
iwa> ★SCoreのデモプログラムmandelを動作させるとハングする
iwa> 
iwa> scrun /opt/score/demo/bin/mandel を行うと、以下の状態になります。
iwa> 
iwa> [サーバホスト]
iwa> ・Connected SCore-D 5.0.0が表示されるだけで、mandelのウィンドが現れない
iwa> ・mandelを起動した端末ウィンドでCtrl-Cを入力しても、mandelが終了しない
iwa>  (Ctrl-\では終了する)
iwa> ・Ctrl-\で終了させた後、Ctrl-Dでscoutを終了しようとしても終了しない
iwa>  (この状態で、更にCtrl-\を入力すると終了する)
iwa> 
iwa> [計算ホスト]
iwa> ・キーボード入力を一切受け付けない (Ctrl-Alt-Delもダメ)
iwa> ・rlogin、rsh等も受け付けない (pingには反応する)
iwa> 
iwa> このため、計算ノードの電源を切るしか対処できなくなります。動作中に電源断
iwa> を行うため、/varが被害を受けます。ただし、この被害はfsckにより修復可能で
iwa> す。
iwa> 
iwa> #これは/var/scoredに書き込みを行っているからと思われます。/var/scoredを
iwa> #独立したパーティションにしたほうが良いかもしれません
iwa> 
iwa> 計算ノードを立ち上げ直せば、再びSCoreプログラムを走らせられるようになり
iwa> ます。(管理ノードは、デーモンの再起動やリブートは不要)
iwa> 
iwa> mandelのハングは、SCoreの通信にGigaLAN、100M Etherのいずれを使っても発生
iwa> します。SCoreの構成を変更して、計算ノードを1 CPUとしてshmemを使わないよ
iwa> うにすると、mandelのハングは発生しなくなります。このため、shmemまわりに
iwa> 障害があるのではないかと思われます。
iwa> 
iwa> なお、pmandelでは、このハングは発生しません。
iwa> 
iwa> 勿論、インストール時にはshmemを指定しています。
iwa> 
iwa> よろしくお願いします。
iwa> 
iwa> ********************************************************
iwa> 富士通株式会社  システム本部)CSEC)R&Dソリューション部
iwa> 岩谷正樹/Masaki Iwatani
iwa> TEL:043-299-3242 (内)7055-2875
iwa> PHS:070-6119-4267
iwa> FAX:043-299-3010 (内)7055-5511
iwa> E-mail to:iwamasa @ jp.fujitsu.com
iwa> *********************************************************
iwa> _______________________________________________
iwa> SCore-users-jp mailing list
iwa> SCore-users-jp @ pccluster.org
iwa> http://www.pccluster.org/mailman/listinfo/score-users-jp
iwa> 
------
Shinji Sumimoto, Fujitsu Labs



SCore-users-jp メーリングリストの案内