[SCore-users-jp] rcstestでカーネルパニック

Mitsugu Kawaguchi m-kawaguchi @ pst.fujitsu.com
2003年 5月 14日 (水) 17:57:47 JST


川口@富士通プライムソフトテクノロジです。
いつもお世話になっております。

現在、rcstestを実行すると、カーネルパニックが発生するという
現象が発生しています。環境は以下の通りです。

 - SCore 5.0.1
 - kernel 2.4.18-3ベース
 - 管理ノードも計算ノード用カーネルで動作
   (管理ノードも計算ノードとして利用するため)

管理ノード上で計算ノード(box00)に対し、rcstestを実行すると
box00がカーネルパニックを起こします。

# rcstest box00 ethernet -v -timeout 10
ethernet_open_device(): -config /var/scored/scoreboard/paradox.0000V300EiDY
pmEthernetOpenDevice: Library version
  $Id: pm_ethernet.c,v 1.64 2002/03/04 09:44:42 s-sumi Exp $
pmEthernetReadConfig(0x83dafe8, unit, 0): set unit number "0" (MAX: 4).
pmEthernetReadConfig(0x83dafe8, maxnsend, 16): set maxnsend "16".
pmEthernetReadConfig(0x83dafe8, backoff, 4800): set backoff "4800" usec.
pmEthernetReadConfig(0x83dafe8, checksum, 0): set checksum "0" off.
pmEthernetOpenDevice("/var/scored/scoreboard/paradox.0000V300EiDY", 0xbffff894): pmEthernetMapEthernet(0, 0xbffff5d8): 0
Ethernet(0): fd=512
self box00.test.domain n 0 of 9 nodes 
pm_ethernetCalibrateTimer(): loop t:1.613887e+07, vt: 1.867100e-02
pm_ethernetCalibrateTimer(): loop t:1.723504e+07, vt: 1.993800e-02
pm_ethernetCalibrateTimer(): end loop t:1.723504e+07, vt: 1.993800e-02
pm_ethernetCalibrateTimer(): d0:8.643818e+08, d1:8.644319e+08
pm_ethernetCalibrateTimer(): clk:864, clock 8.644068e+02
pmEthernetOpenDevice: Driver version
  $Id: pm_ethernet_dev.c,v 1.1.1.1 2002/08/01 07:47:11 kameyama Exp $
ethernet_open_device(): success
 [0] pmEthernetCloseDevice(0x83db028): called
 starting master 0 : pe=9
starting slave:  3 2 6 7 1 5 4 8.
testing*..**..*.*.**.*.*.*..*.*.*.*.*.*.*.

この段階で、box00でカーネルパニック。
その時のメッセージ。

<0> Kernel panic : Aiee,killing interruput handler:
In interruput handler -not syncing

なお、scstestなどは正常に動作します。

また関係するかどうか不明ですが、
管理ノード上からrcp-allコマンドで巨大ファイル(その時は50MB)を
各計算ノードにコピーしようとすると管理ノードがハングします。
(小さいサイズでは発生せず)

これはSCore5.0.1の問題なのでしょうか?
以上、宜しくお願い致します。

-- 
川口 ==>  m-kawaguchi @ pst.fujitsu.com



SCore-users-jp メーリングリストの案内