【再送】RE: [SCore-users-jp] No PMX network is specified

Kameyama Toyohisa kameyama @ pccluster.org
2009年 2月 17日 (火) 16:04:14 JST


亀山です.

Kazuhiro Shimada Wrote:
>>> scorehosts.db は作成してあるのですが…。
>> 環境変数 SCBDSERV を設定していないと見にいかないかもしれません.
> 
> Scoreboardが起動していなかったようです。マシン起動時には起動するように設定し
> てあるのですが、どこかで切れてしまうようです。
> あと、下記のようにプログラムの実行に失敗すると切れるようです。

SCBDSERV にファイル名を書けばファイルを直接見ます.

>>> Networkを指定しますと、以下のようになります。
>>>
>>> [root @ s104-010 ~]# scrun -group=machinefile,network=ethernet ./a.out
>>> SCORED.EXE @ s104-012#7404:ERROR: open_pmx_context() at mpcrt.c:193:
>>> pmxAddMember(ethernet): Link has been severed
>>> SCORED.EXE @ s104-010#8821:ERROR: open_pmx_context() at mpcrt.c:193:
>>> pmxAddMember(ethernet): Link has been severed
>>> SCOUT(s104-010): Process 8821 exited with non-zero status (9).
>>> SCOUT(s104-012): Process 7404 exited with non-zero status (9).
>> このとき, eth0 を使用しようとしますが, eth0 は up されていますでしょう
>> か?
>> scorehosts.db を見に行っているのでしたら, そこで指定した
>> device になりますけど...
> 
> Eth2を使用してます。Eth2を指定するには、scorehosts.dbに具体的にどのように書
> けばよろしいでしょうか。

    ethernet -type=ethernet channel=0 netdev=eth2
として host レコードに
    comp0   ... network=ethernet
を指定してください.
scorehosts.db を使用しない場合は
    scrun -group=machinefile,network=ethernet:eth2 ./a.out
と指定してください.

>>> NICはIntelのe1000eです。ちなみにbnx2を使ってプログラムを実行すると、
>> コン
>>> ピュートホストが勝手に再起動します…。
>> network を etherhxb にするとどうなるでしょうか?
> 
> 以下のようになります。
> 
> [root @ s104-010 ~]# scrun -group=machinefile,network=etherhxb ./a.out
> SCBDSERV: accept() failed.

scoreboard との接続には失敗していますが,

> SCore (7.0.0) Connected
> SCORE{1} 16 nodes (2x8) ready.

SCore-D は etherhxb で立ち上がっています.

> [1] MTMI: fatal error (0x1): score_attach_network()
> failed: 22

ところが, MPI を動かそうとしたところで失敗していますね...
多分, scoreboard が動いていなかったためだと思います.
SCBDSERV を設定しないか, ファイル名を指定してみてください.

> NISの設定は必要でしょうか。

特に必要は無いと思います.

Kameyama Toyohisa



SCore-users-jp メーリングリストの案内