[SCore-users-jp] SMP クラスタ上へのインストールについて
Tetsuhisa MAKINO
makino @ giga.it.okayama-u.ac.jp
2003年 6月 2日 (月) 15:10:59 JST
牧野です。
まず、問題と思われる /opt/score/etc/pm-ethernet.conf は以下のようでした。
[root @ anzu sbin]# cat ../etc/pm-ethernet.conf
unit 0
# maxnsend 0 - 32
maxnsend 16
# backoff 1000 - 20000 (usec)
backoff 4800
# checksum (0 if off, 1 is on)
checksum 0
# PE MAC address base hostname # comment
どうやら、ノードの一覧がまったくないようなので、以下のように自分で記述しました。
MAC アドレスは /opt/score/etc/scorehosts.db が include していたファイルに
記述されていたものを使っています。(もちろん確認しました)
[root @ anzu sbin]# cat ../etc/pm-ethernet.conf
unit 0
# maxnsend 0 - 32
maxnsend 16
# backoff 1000 - 20000 (usec)
backoff 4800
# checksum (0 if off, 1 is on)
checksum 0
# PE MAC address base hostname # comment
0 00:02:B3:40:C6:57 smp0.giga.it.okayama-u.ac.jp
1 00:02:B4:40:C2:AC smp1.giga.it.okayama-u.ac.jp
このように変更した結果 cluster-network-check の結果が以下のようになりました。
[root @ anzu sbin]# cluster-network-check -v -g smpc
smp0.giga.it.okayama-u.ac.jp has 2 cpu, network:ethernet shmem0 shmem1
scored use ethernet
smp1.giga.it.okayama-u.ac.jp has 2 cpu, network:ethernet shmem0 shmem1
scored use ethernet
2 hosts has 2 cpu
all hosts has ethernet
scored use ethernet
問題のない結果に満足し、続いて rpmtest をすると以下のようなメッセージが出力されました。
[root @ anzu sbin]# ./rpmtest smp1 ethernet -reply&
[1] 31872
[root @ anzu sbin]# Ethernet PM context #0 information (unit 0)
channel 0 descripter information
rx_p=00000000, rx_c=00000000, rx_bp=00000000, rx_bc=00000000
tx_p=00000000, tx_c=00000000, tx_bp=00000000, tx_bc=00000000
channel 0 statistics information
st_txmit=00000000, st_rexmit=00000000, st_xmit_ctl=00000000
st_xmit_ack=00000000 st_xmit_lost=00000000, st_xmit_stop=00000000
st_xmit_err=00000000, st_xmit_received=00000000, st_rcv_valid=00000000
st_rcv_ackonly=00000000, st_rcv_igonore=00000000, st_rcv_lose=00000000
st_rcv_ov=00000000,st_rcv_ov=00000000
st_rcv_stop=00000000, st_rcv_go=00000000
pmAssocateNodes: Invalid argument(22)
[1]+ Done ./rpmtest smp1 ethernet -reply
ほとんど全ての値が 0 である出力でした。引数が不正ということですが、どう不正なのかが分かりません。
そこで、以前の指摘のあった PM_DEBUG を 5 にして rpmtest を実行すると全ての出力値が
0 (nil), 0 00000000, 00000000, 00000000
のようになっていました。
どうかよろしくお願いします。
--
岡山大学大学院自然科学研究科博士前期課程2年
Name: Tetsuhisa Makino(牧野 哲久)
E-MAIL: makino @ giga.it.okayama-u.ac.jp
SCore-users-jp メーリングリストの案内