[SCore-users-jp] PM ethernet/ethernet device already opened

Sugano, Mitsukuni suga @ sse.co.jp
2002年 11月 28日 (木) 18:11:32 JST


住元様:

住商エレクトロニクスの菅野です。
いつもお世話になっております。

Shinji Sumimoto wrote:
> 
> 富士通研の住元です。
> 
> From: kameyama @ pccluster.org
> Subject: Re: [SCore-users-jp] PM ethernet/ethernet device already opened
> Date: Thu, 28 Nov 2002 16:02:32 +0900
> Message-ID: <20021128070232.8E22A20040 @ neal.il.is.s.u-tokyo.ac.jp>
> 
> kameyama> 亀山です.
> kameyama>
> kameyama> In article <3DE5B822.4C011686 @ sse.co.jp> "Sugano, Mitsukuni" <suga @ sse.co.jp> wrotes:
> kameyama> > $ cd /opt/score/deploy
> kameyama> > $ scout -g pcc
> kameyama> > SCOUT: Spawn done.
> kameyama> > SCOUT: session started
> kameyama> > $ export PM_DEBUG=1
> kameyama> > $ ./scstest -network ethernet
> kameyama> >
> kameyama> > SCSTEST: BURST on ethernet(chan=0,ctx=0,len=16)
> kameyama> > pmEthernetMapEthernet(1, 0xbfffef78): open("/dev/etherpm/32", 2, 0): 16
> kameyama>
> kameyama> PM/Ethernet の device (の unit 1) の open() が EBUSY になっているようです.
> kameyama> やっぱり, 他の process が使用しているような感じですけど...
> kameyama>
> kameyama>                        from Kameyama Toyohisa
> 
> 整理してよろしいでしょうか?
> 
> 1) rpmtestは正常に動作する。
> 2) scstestのみ失敗する。
> 
> でよろしいでしょうか?

はい。

> 
> 1)が動いているので、pm-ethernet.conf は正しい。
> と推定されます。
> 
> もし、このとおりであれば、scorehosts.dbの 特定のノードのネットワークエ
> ントリがおかしいのではないかと思います。記述はどうなっていますでしょう?
> ethernetが2つ書かれていたりしないでしょうか?

確認してみます。
管理ノードの/opt/score/etc/scorehosts.dbですよね?

> 
> ちなみに、rcstestは動作しますでしょうか?

不勉強で、すみません。具体的な手順をいただけますでしょうか?

> 
> あと、/dev/etherpm/下にファイルはありますね?

問題のある計算ノードのみ確認すればよろしいでしょうか?
できれば、どのようなファイルがあるのが正解かもご教示
いただければ幸いです。

以上、よろしくお願いいたします。



−−−−−−念のため、以前MLに投げた内容を添付します。−−−−−

SCore5.0.1のクラスタシステムのうち計算ノードの1台が
HD故障で交換したため、正常なノードからddでHD丸ごと
システムをコピーし、IPアドレスとhostnameにかかわる
部分のみを手動で編集し、復旧させました。

ところが、そのシステムを含めてpm-etherの1対1テスト
は、正常に動作するもののトータルテストに失敗します。
以下は、そのテストの結果ですが、丸ごと他のノードの
システムをコピーした場合、何か他に変更すべきファイル
があるのでしょうか?
また、特別変更する必要のあるファイルがない場合、この
現象の原因がどこにあるか教えていただければ幸いです。

以上、よろしくお願いいたします。

−−−slave23がHD交換をしたシステムです−−−

[root @ master sbin]# ./rpmtest slave23 ethernet -reply
In another window;
[root @ master sbin]# ./rpmtest slave01 ethernet -dest 22 -ping
8       9.44502e-05
[root @ master sbin]# ./rpmtest slave32 ethernet -dest 22 -ping
8       9.44093e-05

(ちなみに、HOST0=slave01,...,HOST22=slave23,...です。)

[root @ master sbin]# cd /opt/score/deploy
[root @ master deploy]# scout -g pcc
SCOUT: Spawning done.  
SCOUT: session started.
[root @ master deploy]# ./scstest -network ethernet
SCSTEST: BURST on ethernet(chan=0,ctx=0,len=16)
PM ethernet/ethernet device already opened.

上記エラーが表示されます。
そこで、slave23をscorehosts.defectsに追加

[root @ master etc]# more scorehosts.defects
slave23.pccluster.org

[root @ master init.d]# ./msgbserv stop
[root @ master init.d]# ./scoreboard stop
[root @ master init.d]# ./scoreboard start
[root @ master init.d]# ./msgbserv start

[root @ master deploy]# cd /opt/score/deploy
[root @ master deploy]# scout -g pcc
SCOUT: Spawning done.  
SCOUT: session started.
[root @ master deploy]# ./scstest -network ethernet
SCSTEST: BURST on ethernet(chan=0,ctx=0,len=16)
50 K packets.
100 K packets.
150 K packets.
200 K packets.
250 K packets.
300 K packets.
350 K packets.
400 K packets.

slave23を除くと正常動作します。

−−− 以上、テスト結果です−−−



SCore-users-jp メーリングリストの案内