[SCore-users-jp] PMのエラー等について

k-ikegami @ aj.jp.nec.com k-ikegami @ aj.jp.nec.com
2004年 4月 22日 (木) 17:28:27 JST


池上と申します。

下記2点について、ご存知の方いらっしゃいましたらご教授
頂けないでしょうか?

1.SCore計算ホストのサーバ化
#0から#5までの6台のプロセッサで、
#0をSCoreサーバ、#1〜#5を計算ホストとして使用していました。
#0が故障したためクラスタ構成から除外し、#1をSCoreサーバ、残りの4台を
計算ホストとする場合、#1はゼロから再インストールするべきなのでしょうか?
それとも、必要なファイルの更新だけで実現可能でしょうか?
その場合、どのファイルを更新すべきでしょうか?

2.PM/Ethernetのエラー
SCore上でプログラムを動かすと、PM/Ethernetのエラーが発生します。
(エラー発生例)
PM Ethernet 0330
Version		:	"$Id: pm_ethernet_dev.c,v 1.3 2003/09/22 10:40:55 s-sumi Exp $"
Device  	:	eth0
Irq     	:	31
MTU     	:	1468 Bytes
Maxnodes	:	512
MaxContext	:	16
Intreap 	:	on
Checksum 	:	on
Dev error	:	16072
Header err	:	0
Header cksum err:	4
Data cksum err	:	0
Underrun err	:	0

主な構成:
・SCoreサーバ1台
・計算ホスト:2台(2×2CPU)
・スイッチ:SMC8624T(1000BaseT)
・SCore 5.6.1 RedHat 7.3
・Omni OpenMP利用

上記の構成のクラスタが2式あり、双方で上記の様なDev ErrorやChecksum Errorが
発生しているので、HWの故障ではないと思うのですが、このような場合には何を
疑うべきでしょうか?
ヒントを頂ければ幸いです。

/*----------------------------------------------*/
// 池上 光太郎 e-mail: k-ikegami @ aj.jp.nec.com



SCore-users-jp メーリングリストの案内