[SCore-users-jp] SMP クラスタ上へのインストールについて

Tetsuhisa MAKINO makino @ giga.it.okayama-u.ac.jp
2003年 6月 2日 (月) 15:10:59 JST


牧野です。

まず、問題と思われる /opt/score/etc/pm-ethernet.conf は以下のようでした。

[root @ anzu sbin]# cat ../etc/pm-ethernet.conf
unit 0
# maxnsend 0 - 32
maxnsend 16
# backoff 1000 - 20000 (usec)
backoff 4800
# checksum (0 if off, 1 is on)
checksum 0
# PE    MAC address             base hostname           # comment

どうやら、ノードの一覧がまったくないようなので、以下のように自分で記述しました。
MAC アドレスは /opt/score/etc/scorehosts.db が include していたファイルに
記述されていたものを使っています。(もちろん確認しました)

[root @ anzu sbin]# cat ../etc/pm-ethernet.conf
unit 0
# maxnsend 0 - 32
maxnsend 16
# backoff 1000 - 20000 (usec)
backoff 4800
# checksum (0 if off, 1 is on)
checksum 0
# PE    MAC address             base hostname           # comment
0       00:02:B3:40:C6:57       smp0.giga.it.okayama-u.ac.jp
1       00:02:B4:40:C2:AC       smp1.giga.it.okayama-u.ac.jp

このように変更した結果 cluster-network-check の結果が以下のようになりました。

[root @ anzu sbin]# cluster-network-check -v -g smpc
smp0.giga.it.okayama-u.ac.jp has 2 cpu, network:ethernet shmem0 shmem1
        scored use ethernet
smp1.giga.it.okayama-u.ac.jp has 2 cpu, network:ethernet shmem0 shmem1
        scored use ethernet
2 hosts has 2 cpu
all hosts has  ethernet
scored use ethernet

問題のない結果に満足し、続いて rpmtest をすると以下のようなメッセージが出力されました。

[root @ anzu sbin]# ./rpmtest smp1 ethernet -reply&
[1] 31872
[root @ anzu sbin]# Ethernet PM context #0 information (unit 0)
 channel 0 descripter information
  rx_p=00000000, rx_c=00000000, rx_bp=00000000, rx_bc=00000000
  tx_p=00000000, tx_c=00000000, tx_bp=00000000, tx_bc=00000000

 channel 0 statistics information
  st_txmit=00000000, st_rexmit=00000000, st_xmit_ctl=00000000
  st_xmit_ack=00000000 st_xmit_lost=00000000, st_xmit_stop=00000000
  st_xmit_err=00000000, st_xmit_received=00000000, st_rcv_valid=00000000
  st_rcv_ackonly=00000000, st_rcv_igonore=00000000, st_rcv_lose=00000000
  st_rcv_ov=00000000,st_rcv_ov=00000000
  st_rcv_stop=00000000, st_rcv_go=00000000
pmAssocateNodes: Invalid argument(22)

[1]+  Done                    ./rpmtest smp1 ethernet -reply

ほとんど全ての値が 0 である出力でした。引数が不正ということですが、どう不正なのかが分かりません。
そこで、以前の指摘のあった PM_DEBUG を 5 にして rpmtest を実行すると全ての出力値が

0 (nil), 0 00000000, 00000000, 00000000

のようになっていました。

どうかよろしくお願いします。


-- 
岡山大学大学院自然科学研究科博士前期課程2年
Name:	Tetsuhisa Makino(牧野 哲久)
E-MAIL: makino @ giga.it.okayama-u.ac.jp



SCore-users-jp メーリングリストの案内