[SCore-users-jp] PMのエラー等について
k-ikegami @ aj.jp.nec.com
k-ikegami @ aj.jp.nec.com
2004年 4月 22日 (木) 17:28:27 JST
池上と申します。
下記2点について、ご存知の方いらっしゃいましたらご教授
頂けないでしょうか?
1.SCore計算ホストのサーバ化
#0から#5までの6台のプロセッサで、
#0をSCoreサーバ、#1〜#5を計算ホストとして使用していました。
#0が故障したためクラスタ構成から除外し、#1をSCoreサーバ、残りの4台を
計算ホストとする場合、#1はゼロから再インストールするべきなのでしょうか?
それとも、必要なファイルの更新だけで実現可能でしょうか?
その場合、どのファイルを更新すべきでしょうか?
2.PM/Ethernetのエラー
SCore上でプログラムを動かすと、PM/Ethernetのエラーが発生します。
(エラー発生例)
PM Ethernet 0330
Version : "$Id: pm_ethernet_dev.c,v 1.3 2003/09/22 10:40:55 s-sumi Exp $"
Device : eth0
Irq : 31
MTU : 1468 Bytes
Maxnodes : 512
MaxContext : 16
Intreap : on
Checksum : on
Dev error : 16072
Header err : 0
Header cksum err: 4
Data cksum err : 0
Underrun err : 0
主な構成:
・SCoreサーバ1台
・計算ホスト:2台(2×2CPU)
・スイッチ:SMC8624T(1000BaseT)
・SCore 5.6.1 RedHat 7.3
・Omni OpenMP利用
上記の構成のクラスタが2式あり、双方で上記の様なDev ErrorやChecksum Errorが
発生しているので、HWの故障ではないと思うのですが、このような場合には何を
疑うべきでしょうか?
ヒントを頂ければ幸いです。
/*----------------------------------------------*/
// 池上 光太郎 e-mail: k-ikegami @ aj.jp.nec.com
SCore-users-jp メーリングリストの案内