[SCore-users-jp] ネットワークトランキング(PM/Ethernet) の設定
金城 尚志
e973220 @ eve.u-ryukyu.ac.jp
2002年 11月 13日 (水) 21:07:42 JST
琉球大の金城です。
亀山さん、ありがとうございます。
ご指摘の通りに、
if (!defined($group) && $#ARGV < -1) {
に変更することによって、うまく
# mkpmethernetconf -unit 0 test_kinjo > newfile
を成功することができました。
その後、先のメールと
「Network Trunking機構のシステム管理ガイド」を
参考にし設定をさせてもらいました。
そして、MPIのプログラミングを実行させたところ、
エラーメッセージが発生しました。
~~~~~~~~~~~~~~~~~
■■■■■■■■■■■■■■■■
SCore5.0.1のCD-ROMの中に
入っている、MPIのHELLOプログラミングを
コンパイルし、実行させてみたところ、
エラーメッセージが発生
■■■■■■■■■■■■■■■■
$ scrun ./hello
<0> SCore-D:WARNING Unable to open a network configuration file (5):
network='ethernet-x3', attribute='-trunk0:file'
<0> SCore-D:ERROR No PM device opened.
<2> SCore-D:WARNING Unable to open a network configuration file (5):
network='ethernet-x3', attribute='-trunk0:file'
<2> SCore-D:ERROR No PM device opened.
<1> SCore-D:WARNING Unable to open a network configuration file (5):
network='ethernet-x3', attribute='-trunk0:file'
<1> SCore-D:ERROR No PM device opened.
<3> SCore-D:WARNING Unable to open a network configuration file (5):
network='ethernet-x3', attribute='-trunk0:file'
<3> SCore-D:ERROR No PM device opened.
ホストコンピュータから、
msgb -group almond もできました。
scout -g almond でロックもできました。
なので、ホストサーバ−計算ホスト間の
通信は確立しているようです。。
また、当方の環境と問題を改めて報告させてもらいます。
■ ホストサーバ(scib134.sci.u-ryukyu.ac.jp ):1台
■ 計算ホスト(comp0, comp1, comp2, comp3) :4台
■ 計算ホストの一台(comp0)はオンボードNICを搭載
■ comp0 では eth[1-3]を使用(eth0を無視)
■ comp[1-3]では、eth[0-2]を使用
■ NIC三枚でのネットワークトランキングを実現したい
■ SCore5.2.0
どうかアドバイスを頂けないでしょうか、
よろしく御願いします。
以下に、非常に長い文章ですが、
当方の(設定の作業の)状況の説明を記述しておきます。
━━━━━━━━状況━━━━━━━━
■■■■■■■■■■■■■■■■
pm-ethernet-0.conf
pm-ethernet-1.conf
pm-ethernet-2.conf
を作成しました。
pm-ethernet-2.confがきれいに作られているかを
確認してみたところ、Macアドレスが適合しているので
OKでした。
他のpm-ethernet-1.conf , pm-ethernet-0.confも同様に
OKでした。
■■■■■■■■■■■■■■■■
# cat pm-ethernet-2.conf
unit 2
# maxnsend 0 - 32
maxnsend 16
# backoff 1000 - 20000 (usec)
backoff 4800
# checksum (0 if off, 1 is on)
checksum 0
# PE MAC address base hostname # comment
0 02:00:08:E3:4C:9B comp0 # on eth3
1 02:00:08:E3:6D:8B comp1 # on eth2
2 02:00:08:E3:57:9B comp2 # on eth2
3 02:00:08:E3:58:9B comp3 # on eth2
■■■■■■■■■■■■■■■■
次に、
/opt/score5.2.0/etc/scorehosts.dbを
Network Trunking機構(PM/Ethernet)のシステム管理者ガイド
http://www.pccluster.org/score/dist/score/html/ja/reference/pm/ether-trunkin
g.html
を参考に編集しました。
■■■■■■■■■■■■■■■■
$ cat scorehosts.db
/*
* SCore 5.0 scorehosts.db
* generated by PCCC EIT 5.2
*/
/* PM/Myrinet */
myrinet type=myrinet \
-firmware:file=/opt/score/share/lanai/lanai.mcp \
-config:file=/opt/score/etc/pm-myrinet.conf
/* PM/Myrinet */
myrinet2k type=myrinet2k \
-firmware:file=/opt/score/share/lanai/lanaiM2k.mcp \
-config:file=/opt/score/etc/pm-myrinet.conf
/* PM/Ethernet */
ethernet type=ethernet \
-config:file=/opt/score/etc/pm-ethernet.conf
ethernet-0 type=ethernet \
-config:file=/opt/score/etc/pm-ethernet-0.conf
ethernet-1 type=ethernet \
-config:file=/opt/score/etc/pm-ethernet-1.conf
ethernet-2 type=ethernet \
-config:file=/opt/score/etc/pm-ethernet-2.conf
ethernet-x2 type=ethernet \
-config:file=/opt/score/etc/pm-ethernet-1.conf \
-trunk0:file=/opt/score/etc/pm-ethernet-2.conf
ethernet-x3 type=ethernet \
-config:file=/opt/score/etc/pm-ethernet-2.conf
-trunk0:file=/opt/score/etc/pm-ethernet-1.conf
-trunk1:file=/opt/score/etc/pm-ethernet-0.conf
gigaethernet type=ethernet \
-config:file=/opt/score/etc/pm-ethernet.conf
/* PM/Agent */
udp type=agent -agent=pmaudp \
-config:file=/opt/score/etc/pm-udp.conf
/* RHiNET */
rhinet type=rhinet \
-firmware:file=/opt/score/share/rhinet/phu_top_0207a.hex \
-config:file=/opt/score/etc/pm-rhinet.conf
##
##
#include "/opt/score//etc/ndconf/0"
#include "/opt/score//etc/ndconf/1"
#include "/opt/score//etc/ndconf/2"
#include "/opt/score//etc/ndconf/3"
##
#define MSGBSERV msgbserv=(scib134.sci.u-ryukyu.ac.jp:8764)
comp0.sci.u-ryukyu.ac.jp NODE_0 \
network=ethernet,ethernet-0,ethernet-1,ethernet-2,ethernet-x2,ethernet-x3,
group=_scoreall_,almond smp=1 MSGBSERV
comp1.sci.u-ryukyu.ac.jp NODE_1 \
network=ethernet,ethernet-0,ethernet-1,ethernet-2,ethernet-x2,ethernet-x3,gr
oup=_scoreall_,almond smp=1 MSGBSERV
comp2.sci.u-ryukyu.ac.jp NODE_2 \
network=ethernet,ethernet-0,ethernet-1,ethernet-2,ethernet-x2,ethernet-x3,gr
oup=_scoreall_,almond smp=1 MSGBSERV
comp3.sci.u-ryukyu.ac.jp NODE_3 \
network=ethernet,ethernet-0,ethernet-1,ethernet-2,ethernet-x2,ethernet-x3,
group=_scoreall_,almond smp=1 MSGBSERV
■■■■■■■■■■■■■■■■
次にcompute hostの、
/etc/rc.d/init.d/pm_ethernetを編集します。
comp0において
■■■■■■■■■■■■■■■■
[root @ comp0 init.d]# cat pm_ethernet
#!/bin/sh
#
# pm_ethernet: Starts the PM Ethernet driver
#
# Version: @(#) /etc/rc.d/init.d/pm_ethernet 1.00
#
# Author: Shinji Sumimoto (Real World Computing Partnership)
# chkconfig: 345 90 18
# description: PM Ethernet driver
# probe: true
IF=eth0
UNIT=0
INTERRUPT_REAPING=on
# Source function library.
. /etc/rc.d/init.d/functions
# check module
module=`modprobe -l pm_ethernet_dev.o | grep -v Note:`
# See how we were called.
case "$1" in
start)
echo n "Starting PM/Ethernet: "
if [ x$module != x ]; then
modprobe pm_ethernet_dev
fi
# /sbin/etherpmctl $IF -pm on -ir $INTERRUPT_REAPING -unit $UNIT
/sbin/etherpmctl eth1 -pm on -ir $INTERRUPT_REAPING -unit 0
/sbin/etherpmctl eth2 -pm on -ir $INTERRUPT_REAPING -unit 1
/sbin/etherpmctl eth3 -pm on -ir $INTERRUPT_REAPING -unit 2
touch /var/lock/subsys/pm_ethernet
;;
stop)
echo -n "Stopping PM/Ethernet: "
# /sbin/etherpmctl $IF -pm off
/sbin/etherpmctl eth1 -pm off
/sbin/etherpmctl eth2 -pm off
/sbin/etherpmctl eth3 -pm off
if [ x$module != x ]; then
rmmod pm_ethernet_dev
fi
echo
rm -f /var/lock/subsys/pm_ethernet
;;
status)
if [ x$module != x ]; then
/sbin/lsmod
fi
;;
restart)
$0 stop
$0 start
;;
*)
echo "Usage: $0 {start|stop|status|restart}"
exit 1
esac
exit 0
■■■■■■■■■■■■■■■■
comp[1-3]においての
/etc/rc.d/init.d/pm_ethernet
■■■■■■■■■■■■■■■■
[root @ comp1 init.d]# cat pm_ethernet
#!/bin/sh
#
# pm_ethernet: Starts the PM Ethernet driver
#
# Version: @(#) /etc/rc.d/init.d/pm_ethernet 1.00
#
# Author: Shinji Sumimoto (Real World Computing Partnership)
# chkconfig: 345 90 18
# description: PM Ethernet driver
# probe: true
IF=eth0
UNIT=0
INTERRUPT_REAPING=on
# Source function library.
. /etc/rc.d/init.d/functions
# check module
module=`modprobe -l pm_ethernet_dev.o | grep -v Note:`
# See how we were called.
case "$1" in
start)
echo n "Starting PM/Ethernet: "
if [ x$module != x ]; then
modprobe pm_ethernet_dev
fi
/sbin/etherpmctl $IF -pm on -ir $INTERRUPT_REAPING -unit $UNIT
/sbin/etherpmctl eth1 -pm on -ir $INTERRUPT_REAPING -unit 1
/sbin/etherpmctl eth2 -pm on -ir $INTERRUPT_REAPING -unit 2
# /sbin/etherpmctl eth3 -pm on -ir $INTERRUPT_REAPING -unit 3
touch /var/lock/subsys/pm_ethernet
;;
stop)
echo -n "Stopping PM/Ethernet: "
/sbin/etherpmctl $IF -pm off
/sbin/etherpmctl eth1 -pm off
/sbin/etherpmctl eth2 -pm off
# /sbin/etherpmctl eth3 -pm off
if [ x$module != x ]; then
rmmod pm_ethernet_dev
fi
echo
rm -f /var/lock/subsys/pm_ethernet
;;
status)
if [ x$module != x ]; then
/sbin/lsmod
fi
;;
restart)
$0 stop
$0 start
;;
*)
echo "Usage: $0 {start|stop|status|restart}"
exit 1
esac
exit 0
■■■■■■■■■■■■■■■■
comp0において、手動で
ifconfig eth[1-3] up
comp[1-3]において 手動で
ifconfig eth[0-2] up
■■■■■■■■■■■■■■■■
■■■■■■■■■■■■■■■■
comp[0-4]において
# /etc/rc.d/init.d/pm_ethernet restartを実行。
すべてにおいてエラーメッセージなし。
■■■■■■■■■■■■■■■■
■■■■■■■■■■■■■■■■
/opt/score5.2.0//etc/scorehosts.dbを
亀山さんの先のメールのような記述を
してみました。
■■■■■■■■■■■■■■■■
[root @ scib134 etc]# cat scorehosts.db
/*
* SCore 5.0 scorehosts.db
* generated by PCCC EIT 5.2
*/
/* PM/Myrinet */
myrinet type=myrinet \
-firmware:file=/opt/score/share/lanai/lanai.mcp \
-config:file=/opt/score/etc/pm-myrinet.conf
/* PM/Myrinet */
myrinet2k type=myrinet2k \
-firmware:file=/opt/score/share/lanai/lanaiM2k.mcp \
-config:file=/opt/score/etc/pm-myrinet.conf
/* PM/Ethernet */
ethernet-x3 type=ethernet \
-config:file=/opt/score/etc/pm-ethernet-2.conf \
-trunk0:file=/opt/score/etc/pm-ethenret-1.conf \
-trunk1:file=/opt/score/etc/pm-ethernet-0.conf
gigaethernet type=ethernet \
-config:file=/opt/score/etc/pm-ethernet.conf
/* PM/Agent */
udp type=agent -agent=pmaudp \
-config:file=/opt/score/etc/pm-udp.conf
/* RHiNET */
rhinet type=rhinet \
-firmware:file=/opt/score/share/rhinet/phu_top_0207a.hex \
-config:file=/opt/score/etc/pm-rhinet.conf
##
##
#include "/opt/score//etc/ndconf/0"
#include "/opt/score//etc/ndconf/1"
#include "/opt/score//etc/ndconf/2"
#include "/opt/score//etc/ndconf/3"
##
#define MSGBSERV msgbserv=(scib134.sci.u-ryukyu.ac.jp:8764)
comp0.sci.u-ryukyu.ac.jp cpugen=i686 speed=500 \
network=ethernet-x3 group=_scoreall_,almond smp=1 MSGBSERV
comp1.sci.u-ryukyu.ac.jp cpugen=i686 speed=500 \
network=ethernet-x3 group=_scoreall_,almond smp=1 MSGBSERV
comp2.sci.u-ryukyu.ac.jp cpugen=i686 speed=500 \
network=ethernet-x3 group=_scoreall_,almond smp=1 MSGBSERV
comp3.sci.u-ryukyu.ac.jp cpugen=i686 speed=500 \
network=ethernet-x3 group=_scoreall_,almond smp=1 MSGBSERV
■■■■■■■■■■■■■■■■
# /etc/rc.d/init.d/scoreboard stop
# /etc/rc.d/init.d/scoreboard start
を実行。成功。
■■■■■■■■■■■■■■■■
[root @ scib134 etc]# /etc/rc.d/init.d/scoreboard start
Starting scoreboard services: [ OK ]
■■■■■■■■■■■■■■■■
SCore5.0.1のCD-ROMの中に
入っている、MPIのHELLOプログラミングを
コンパイルし、実行させてみたところ、
エラーメッセージが発生
■■■■■■■■■■■■■■■■
<0> SCore-D:WARNING Unable to open a network configuration file (5):
network='ethernet-x3', attribute='-trunk0:file'
<0> SCore-D:ERROR No PM device opened.
<2> SCore-D:WARNING Unable to open a network configuration file (5):
network='ethernet-x3', attribute='-trunk0:file'
<2> SCore-D:ERROR No PM device opened.
<1> SCore-D:WARNING Unable to open a network configuration file (5):
network='ethernet-x3', attribute='-trunk0:file'
<1> SCore-D:ERROR No PM device opened.
<3> SCore-D:WARNING Unable to open a network configuration file (5):
network='ethernet-x3', attribute='-trunk0:file'
<3> SCore-D:ERROR No PM device opened.
━┛━┛━┛━┛━┛━┛━┛━┛━┛
琉球大学理学部 物質地球科学科
金城 尚志 (キンジョウヒサシ)
━┛━┛━┛━┛━┛━┛━┛━┛━┛
SCore-users-jp メーリングリストの案内