From hartke @ phc.uni-kiel.de Thu May 9 03:24:25 2002 From: hartke @ phc.uni-kiel.de (Bernd Hartke) Date: Wed, 8 May 2002 20:24:25 +0200 (METDST) Subject: [SCore-users-jp] [SCore-users] non-SCore MPI programs on SCore? Message-ID: With all due apologies, here is a stupid beginner's question to all the experts out there: I have the executable of a commercial program, parallelized with MPI (or MPICH) - with the straight version, not with the SCore version of MPI. And I want to run this program on my linuxPC cluster, on which I have SCore pre-installed (including its own version of MPI). In all ways I have tried it so far, the system keeps complaining that this is not a SCore application. Unfortunately, I do not have the source codes for this program, and I will not get them, so recompiling it on my cluster (which would presumably generate a correctly executable program, through the use of the appropriate libraries - this is the impression I get from the SCore documentation pages) is not an option. Therefore: Is there a way to run such a program in SCore? Or do I have to throw away SCore (or operate around it in some way) to get this thing running on my cluster? Any small or large pieces of help are very welcome! Bernd Hartke --- Prof. Dr. Bernd Hartke e-mail: hartke @ phc.uni-kiel.de Theoretical Chemistry phone : +49-431-880-2753 Institute for Physical Chemistry fax : +49-431-880-1758 University of Kiel http://www.theochem.uni-stuttgart.de/~hartke Olshausenstrasse 40 24098 Kiel GERMANY _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From martin.konold @ erfrakon.de Thu May 9 19:11:44 2002 From: martin.konold @ erfrakon.de (Martin Konold) Date: Thu, 9 May 2002 12:11:44 +0200 Subject: [SCore-users-jp] Re: [SCore-users] non-SCore MPI programs on SCore? In-Reply-To: References: Message-ID: <200205091211.45130.martin.konold@erfrakon.de> -----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 On Wednesday 08 May 2002 08:24 pm, Bernd Hartke wrote: Hi, > (or MPICH) - with the straight version, not with the SCore version of MPI. > Therefore: Is there a way to run such a program in SCore? > Or do I have to throw away SCore (or operate around it in some way) to get > this thing running on my cluster? Your problem is rather common and there is of course a work around. Score is not exclusive. You may install in addition to SCore also a normal non optimized mpich (using TCP over ethernet or tcp over Myrinet) and run your application. In addition you should make sure that the nodes needed for your application will not be allocated by other SCore jobs. Regards, - --martin - -- Dipl.-Phys. Martin Konold e r f r a k o n Erlewein, Frank, Konold & Partner - Beratende Ingenieure und Physiker Germanenstrasse 15, 70563 Stuttgart, Germany email: martin.konold @ erfrakon.de -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.0.6 (GNU/Linux) Comment: For info see http://www.gnupg.org iD8DBQE82ktg2QhgvjzqtlMRAvC3AKCnexW9Z0uP6peb7IFiVN3auecimgCcDL09 WcBHOdz1J5q79x9zhoSkYKI= =/OcV -----END PGP SIGNATURE----- _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From chisaki @ cs.kumamoto-u.ac.jp Fri May 10 05:30:00 2002 From: chisaki @ cs.kumamoto-u.ac.jp (Yoshifumi CHISAKI) Date: Fri, 10 May 2002 05:30:00 +0900 Subject: [SCore-users-jp] [SCore-users] <0> SCore-D:ERROR No self host Message-ID: <20020509203001.30397@vivaldi.cs.kumamoto-u.ac.jp> 苣木です。 Redhat 7.2 + SCore 5.0.1 でシステムを再構築中です。 RPM(bininstall -compute or -server)ベースで, webpageに掲載されている順を追ってinstall,testを行ってきましたが, [chisaki @ parallel-a021 deploy]$ scstest -network ethernet No network record. SCSTEST: BURST on ethernet(chan=0,ctx=0,len=16) そして, [chisaki @ parallel-a021 mttl]$ scrun -nodes=1 ./hello <0> SCore-D:ERROR No self host (parallel-a014) ででも止まってしまいます。 1台1台設定していますので, a014だけ設定ミスがあると思われますが, 思いつくところはチェックしてみましたが, 原因を特定できませんでした。 上記のエラーの場合,何が悪いのでしょうか? 以下,参考になるかわかりませんが資料です。 よろしくお願いいたします。 [chisaki @ parallel-a021 deploy]$ scout hostname [parallel-a011]: parallel-a011.cogni.kumamoto-u.ac.jp [parallel-a012]: parallel-a012.cogni.kumamoto-u.ac.jp [parallel-a013]: parallel-a013.cogni.kumamoto-u.ac.jp [parallel-a014]: parallel-a014.cogni.kumamoto-u.ac.jp [parallel-a021]: parallel-a021.cogni.kumamoto-u.ac.jp [parallel-a022]: parallel-a022.cogni.kumamoto-u.ac.jp [parallel-a023]: parallel-a023.cogni.kumamoto-u.ac.jp [chisaki @ parallel-a021 deploy]$ [chisaki @ parallel-a021 etc]$ cat scorehosts.db /* PM/Ethernet */ ethernet type=ethernet \ -config:file=/opt/score/etc/pm-ethernet.conf /* PM/Agent/UDP */ udp type=agent -agent=pmaudp \ -config:file=/opt/score/etc/pm-udp.conf /* PM/SHMEM */ shmem0 type=shmem -node=0 shmem1 type=shmem -node=1 #define SEG10 msgbserv=(parallel-a021.cogni.kumamoto-u.ac.jp:8764) \ cpugen=pentium-iii speed=1600 smp=2 \ network=ethernet,udp,shmem0,shmem1 \ group=seg20 #define SEG20 msgbserv=(parallel-a021.cogni.kumamoto-u.ac.jp:8764) \ cpugen=pentium-iv speed=1600 smp=1 \ network=ethernet,udp \ group=seg20 parallel-a011.cogni.kumamoto-u.ac.jp SEG10 parallel-a012.cogni.kumamoto-u.ac.jp SEG10 parallel-a013.cogni.kumamoto-u.ac.jp SEG10 parallel-a014.cogni.kumamoto-u.ac.jp SEG10 parallel-a021.cogni.kumamoto-u.ac.jp SEG20 parallel-a022.cogni.kumamoto-u.ac.jp SEG20 parallel-a023.cogni.kumamoto-u.ac.jp SEG20 _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From hori @ swimmy-soft.com Fri May 10 09:59:40 2002 From: hori @ swimmy-soft.com (Atsushi HORI) Date: Fri, 10 May 2002 09:59:40 +0900 Subject: [SCore-users-jp] Re: [SCore-users] <0> SCore-D:ERROR No self host In-Reply-To: <20020509203001.30397@vivaldi.cs.kumamoto-u.ac.jp> References: <20020509203001.30397@vivaldi.cs.kumamoto-u.ac.jp> Message-ID: <3103869580.hori0000@mail.bestsystems.co.jp> 堀@スイミー・ソフトウェアです. #日本語なので CC を score-users-jp にしました. >[chisaki @ parallel-a021 deploy]$ scstest -network ethernet >No network record. >SCSTEST: BURST on ethernet(chan=0,ctx=0,len=16) > >そして, > >[chisaki @ parallel-a021 mttl]$ scrun -nodes=1 ./hello ><0> SCore-D:ERROR No self host (parallel-a014) > >ででも止まってしまいます。 多分,以下にある pm-ethernet.conf の内容に誤りがあるのでだと思われます. > -config:file=/opt/score/etc/pm-ethernet.conf From chisaki @ cs.kumamoto-u.ac.jp Fri May 10 13:25:53 2002 From: chisaki @ cs.kumamoto-u.ac.jp (Yoshifumi CHISAKI) Date: Fri, 10 May 2002 13:25:53 +0900 Subject: [SCore-users-jp] Re: [SCore-users] <0> SCore-D:ERROR No self host In-Reply-To: <3103869580.hori0000@mail.bestsystems.co.jp> References: <3103869580.hori0000@mail.bestsystems.co.jp> Message-ID: <20020510042554.9694@vivaldi.cs.kumamoto-u.ac.jp> 苣木です。 Atsushi HORI wrote to 02.5.10 9:59: >堀@スイミー・ソフトウェアです. > >#日本語なので CC を score-users-jp にしました. 申し訳ございません。 >>[chisaki @ parallel-a021 deploy]$ scstest -network ethernet >>No network record. >>SCSTEST: BURST on ethernet(chan=0,ctx=0,len=16) >> >>そして, >> >>[chisaki @ parallel-a021 mttl]$ scrun -nodes=1 ./hello >><0> SCore-D:ERROR No self host (parallel-a014) >> >>ででも止まってしまいます。 > >多分,以下にある pm-ethernet.conf の内容に誤りがあるのでだと思われます. > >> -config:file=/opt/score/etc/pm-ethernet.conf は, webapgeにある, Gigabit Ethernetの使用 # cd /opt/score/etc # /opt/score/deploy/mkpmethernetconf \ -speed 1000 pm-udp.conf > pm-ethernet.conf では,Usageが出てきました。 ですので, mkpmethernetconf -g seg20 -speed 1000 > pm-ethernet.conf で作成し, unit 0 # maxnsend 0 - 32 # maxnsend 0 # backoff 1000 - 20000 (usec) backoff 4800 # checksum (0 if off, 1 is on) checksum 0 # PE MAC address base hostname # comment 0 00:90:CC:30:D5:67 parallel-a011.cogni.kumamoto-u.ac.jp # ip=192.168.2.11 on eth0 1 00:90:CC:30:D5:45 parallel-a012.cogni.kumamoto-u.ac.jp # ip=192.168.2.12 on eth0 2 00:90:CC:30:D5:58 parallel-a013.cogni.kumamoto-u.ac.jp # ip=192.168.2.13 on eth0 3 00:90:CC:14:EC:8D parallel-a014.cogni.kumamoto-u.ac.jp # ip=192.168.2.14 on eth0 4 00:90:CC:30:D4:F1 parallel-a021.cogni.kumamoto-u.ac.jp # ip=192.168.2.21 on eth1 5 00:90:CC:30:D5:3E parallel-a022.cogni.kumamoto-u.ac.jp # ip=192.168.2.22 on eth0 6 00:90:CC:30:D5:44 parallel-a023.cogni.kumamoto-u.ac.jp # ip=192.168.2.23 on eth0 となっています。 このファイルは,各nodeと同じにしております。 #rcpでコピーし,diffで確認済み。 PE #4 はeth1で正しいです。他はeth0。 お手数おかけしますが,フォローいただけますと幸いです。 /chisaki From kameyama @ pccluster.org Fri May 10 13:44:00 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Fri, 10 May 2002 13:44:00 +0900 Subject: [SCore-users-jp] Re: [SCore-users] <0> SCore-D:ERROR No self host In-Reply-To: Your message of "Fri, 10 May 2002 13:25:53 JST." <20020510042554.9694@vivaldi.cs.kumamoto-u.ac.jp> Message-ID: <200205100444.g4A4i0v22332@yl-dhcp18.is.s.u-tokyo.ac.jp> 亀山です. In article <20020510042554.9694 @ vivaldi.cs.kumamoto-u.ac.jp> Yoshifumi CHISAKI wrotes: > PE #4 はeth1で正しいです。他はeth0。 とすると, eth0 がつながっていて, 別の hostname がついている可能性が ありますね. 現在の score では自分の hostname を決めるのに gethostname() の結果を gethostbyname() に渡して official name を決定します. scorehosts.db, pm-ethernet.conf などはその名前を登録する必要があります. (mkpmethernetconf は scoreboard のホスト名をそのまま使用します.) parallel-a014 は hostname で gethostbyname() を行うと official name として eth0 の hostname を返すということはないでしょうか? その場合, scorehosts.db にはその名前を使用してみてください. from Kameyama Toyohisa From s-sumi @ flab.fujitsu.co.jp Fri May 10 13:53:14 2002 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Fri, 10 May 2002 13:53:14 +0900 Subject: [SCore-users-jp] Re: [SCore-users] <0> SCore-D:ERROR No self host In-Reply-To: <20020510042554.9694@vivaldi.cs.kumamoto-u.ac.jp> References: <3103869580.hori0000@mail.bestsystems.co.jp> <20020510042554.9694@vivaldi.cs.kumamoto-u.ac.jp> Message-ID: <20020510135314K.s-sumi@flab.fujitsu.co.jp> 住元です。 rpmtestは動くのでしょうか? 動かないなら、-debug 1 (or setenv PM_DEBUG 1)を試して下さい。 % rpmtest parallel-a014 ethernet -debug 1 おそらく、このエラー結果で問題が絞れると思います。 あと parallel-a014のみeth1とのことですが、 /etc/rc.d/init.d/pm_ethernet の中の定義で eth1 をPM/Ethernetの unit 0 に割り当てるようになっています でしょうか? From: Yoshifumi CHISAKI Subject: Re: [SCore-users-jp] Re: [SCore-users] <0> SCore-D:ERROR No self host Date: Fri, 10 May 2002 13:25:53 +0900 Message-ID: <20020510042554.9694 @ vivaldi.cs.kumamoto-u.ac.jp> chisaki> 苣木です。 chisaki> chisaki> Atsushi HORI wrote to 02.5.10 9:59: chisaki> >堀@スイミー・ソフトウェアです. chisaki> > chisaki> >#日本語なので CC を score-users-jp にしました. chisaki> chisaki> 申し訳ございません。 chisaki> chisaki> >>[chisaki @ parallel-a021 deploy]$ scstest -network ethernet chisaki> >>No network record. chisaki> >>SCSTEST: BURST on ethernet(chan=0,ctx=0,len=16) chisaki> >> chisaki> >>そして, chisaki> >> chisaki> >>[chisaki @ parallel-a021 mttl]$ scrun -nodes=1 ./hello chisaki> >><0> SCore-D:ERROR No self host (parallel-a014) chisaki> >> chisaki> >>ででも止まってしまいます。 chisaki> > chisaki> >多分,以下にある pm-ethernet.conf の内容に誤りがあるのでだと思われます. chisaki> > chisaki> >> -config:file=/opt/score/etc/pm-ethernet.conf chisaki> chisaki> は, chisaki> chisaki> webapgeにある, chisaki> Gigabit Ethernetの使用 chisaki> # cd /opt/score/etc chisaki> # /opt/score/deploy/mkpmethernetconf \ chisaki> -speed 1000 pm-udp.conf > pm-ethernet.conf chisaki> chisaki> では,Usageが出てきました。 chisaki> chisaki> ですので, chisaki> mkpmethernetconf -g seg20 -speed 1000 > pm-ethernet.conf chisaki> chisaki> で作成し, chisaki> chisaki> unit 0 chisaki> # maxnsend 0 - 32 chisaki> # maxnsend 0 chisaki> # backoff 1000 - 20000 (usec) chisaki> backoff 4800 chisaki> # checksum (0 if off, 1 is on) chisaki> checksum 0 chisaki> # PE MAC address base hostname # comment chisaki> 0 00:90:CC:30:D5:67 parallel-a011.cogni.kumamoto-u.ac.jp # ip=192.168.2.11 on eth0 chisaki> 1 00:90:CC:30:D5:45 parallel-a012.cogni.kumamoto-u.ac.jp # ip=192.168.2.12 on eth0 chisaki> 2 00:90:CC:30:D5:58 parallel-a013.cogni.kumamoto-u.ac.jp # ip=192.168.2.13 on eth0 chisaki> 3 00:90:CC:14:EC:8D parallel-a014.cogni.kumamoto-u.ac.jp # ip=192.168.2.14 on eth0 chisaki> 4 00:90:CC:30:D4:F1 parallel-a021.cogni.kumamoto-u.ac.jp # ip=192.168.2.21 on eth1 chisaki> 5 00:90:CC:30:D5:3E parallel-a022.cogni.kumamoto-u.ac.jp # ip=192.168.2.22 on eth0 chisaki> 6 00:90:CC:30:D5:44 parallel-a023.cogni.kumamoto-u.ac.jp # ip=192.168.2.23 on eth0 chisaki> chisaki> となっています。 chisaki> このファイルは,各nodeと同じにしております。 chisaki> #rcpでコピーし,diffで確認済み。 chisaki> chisaki> PE #4 はeth1で正しいです。他はeth0。 chisaki> chisaki> お手数おかけしますが,フォローいただけますと幸いです。 chisaki> chisaki> /chisaki chisaki> _______________________________________________ chisaki> SCore-users-jp mailing list chisaki> SCore-users-jp @ pccluster.org chisaki> http://www.pccluster.org/mailman/listinfo/score-users-jp chisaki> chisaki> ------ Shinji Sumimoto, Fujitsu Labs From hori @ swimmy-soft.com Fri May 10 14:15:40 2002 From: hori @ swimmy-soft.com (Atsushi HORI) Date: Fri, 10 May 2002 14:15:40 +0900 Subject: [SCore-users-jp] Re: [SCore-users] <0> SCore-D:ERROR No selfhost In-Reply-To: <20020510042554.9694@vivaldi.cs.kumamoto-u.ac.jp> References: <3103869580.hori0000@mail.bestsystems.co.jp> Message-ID: <3103884940.hori0000@mail.bestsystems.co.jp> 堀@スイミー・ソフトウェアです. 亀山さんと住元さんから回答済みと思います.私は住元さんの線があやしいと 思います. >このファイルは,各nodeと同じにしております。 >#rcpでコピーし,diffで確認済み。 ところで,pm-ethernet.conf 等のネットワークの設定ファイルは scoreboard が勝手に各ノードにコピーしますので,rcp 等は不要です. From chisaki @ cs.kumamoto-u.ac.jp Fri May 10 15:30:54 2002 From: chisaki @ cs.kumamoto-u.ac.jp (Yoshifumi CHISAKI) Date: Fri, 10 May 2002 15:30:54 +0900 Subject: [SCore-users-jp] Re: [SCore-users] <0> SCore-D:ERROR No self host In-Reply-To: <20020510135314K.s-sumi@flab.fujitsu.co.jp> References: <20020510135314K.s-sumi@flab.fujitsu.co.jp> Message-ID: <20020510063058.10937@vivaldi.cs.kumamoto-u.ac.jp> 苣木です。 みなさん,ありがとうございます。 Shinji Sumimoto wrote to 02.5.10 13:53: >住元です。 > >rpmtestは動くのでしょうか? > >動かないなら、-debug 1 (or setenv PM_DEBUG 1)を試して下さい。 > >% rpmtest parallel-a014 ethernet -debug 1 serverであるparallel-a021において [chisaki @ parallel-a021 ~]$ rpmtest parallel-a014 ethernet -debug 1 8 2.00002e-11 [chisaki @ parallel-a021 ~]$ は動作します。 >おそらく、このエラー結果で問題が絞れると思います。 > >あと parallel-a014のみeth1とのことですが、 >/etc/rc.d/init.d/pm_ethernet a014が2 NICではなく, #4 (server and compute)である, parallel-a021が2 NICで eth0が外側と,eth1が並列用になっています。 #ナンバリングが悪かったですね。 #本件が一度落ち着いてから整理したいと思います。 >の中の定義で eth1 をPM/Ethernetの unit 0 に割り当てるようになっています >でしょうか? 2 NICである, a021においては,init.d/pm_ethernetは, IF=eth1 UNIT=0 としています。 P.S. rcp 不要の件,了解です。 では。 From s-sumi @ flab.fujitsu.co.jp Fri May 10 15:35:46 2002 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Fri, 10 May 2002 15:35:46 +0900 Subject: [SCore-users-jp] Re: [SCore-users] <0> SCore-D:ERROR No self host In-Reply-To: <20020510063058.10937@vivaldi.cs.kumamoto-u.ac.jp> References: <20020510135314K.s-sumi@flab.fujitsu.co.jp> <20020510063058.10937@vivaldi.cs.kumamoto-u.ac.jp> Message-ID: <20020510153546M.s-sumi@flab.fujitsu.co.jp> 住元です。 だとすると、残るは、pm-ethernet.confのMACアドレスの違いでしょうか? a021のノードで % rpmtest parallel-a021 ethernet -debug 1 は動きますか? 駄目なら、dmesgなどでエラーが出ると思います。 From: Yoshifumi CHISAKI Subject: Re: [SCore-users-jp] Re: [SCore-users] <0> SCore-D:ERROR No self host Date: Fri, 10 May 2002 15:30:54 +0900 Message-ID: <20020510063058.10937 @ vivaldi.cs.kumamoto-u.ac.jp> chisaki> 苣木です。 chisaki> chisaki> みなさん,ありがとうございます。 chisaki> chisaki> Shinji Sumimoto wrote to 02.5.10 13:53: chisaki> >住元です。 chisaki> > chisaki> >rpmtestは動くのでしょうか? chisaki> > chisaki> >動かないなら、-debug 1 (or setenv PM_DEBUG 1)を試して下さい。 chisaki> > chisaki> >% rpmtest parallel-a014 ethernet -debug 1 chisaki> chisaki> serverであるparallel-a021において chisaki> chisaki> [chisaki @ parallel-a021 ~]$ rpmtest parallel-a014 ethernet -debug 1 chisaki> 8 2.00002e-11 chisaki> [chisaki @ parallel-a021 ~]$ chisaki> chisaki> は動作します。 chisaki> chisaki> >おそらく、このエラー結果で問題が絞れると思います。 chisaki> > chisaki> >あと parallel-a014のみeth1とのことですが、 chisaki> >/etc/rc.d/init.d/pm_ethernet chisaki> chisaki> a014が2 NICではなく, chisaki> #4 (server and compute)である, chisaki> parallel-a021が2 NICで chisaki> eth0が外側と,eth1が並列用になっています。 chisaki> chisaki> #ナンバリングが悪かったですね。 chisaki> #本件が一度落ち着いてから整理したいと思います。 chisaki> chisaki> >の中の定義で eth1 をPM/Ethernetの unit 0 に割り当てるようになっています chisaki> >でしょうか? chisaki> chisaki> 2 NICである, chisaki> a021においては,init.d/pm_ethernetは, chisaki> IF=eth1 chisaki> UNIT=0 chisaki> としています。 chisaki> chisaki> P.S. rcp 不要の件,了解です。 chisaki> chisaki> では。 chisaki> ------ Shinji Sumimoto, Fujitsu Labs From kameyama @ pccluster.org Fri May 10 16:11:26 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Fri, 10 May 2002 16:11:26 +0900 Subject: [SCore-users-jp] Re: [SCore-users] <0> SCore-D:ERROR No self host In-Reply-To: Your message of "Fri, 10 May 2002 15:35:46 JST." <20020510153546M.s-sumi@flab.fujitsu.co.jp> Message-ID: <200205100711.g4A7BQv23327@yl-dhcp18.is.s.u-tokyo.ac.jp> 亀山です. In article <20020510153546M.s-sumi @ flab.fujitsu.co.jp> Shinji Sumimoto wrotes: > a021のノードで > > % rpmtest parallel-a021 ethernet -debug 1 > > は動きますか? どうせやるなら a021 と a014 の間で point-to-point test を行ったほうが良い かも... % rpmtest parallel-a021 ethernet -reply & % rpmtest parallel-a014 ethernet -dest 4 -ping -debug 1 は動きますか? (終了したら -reply のプロセスは kill してください.) エラーメッセージが No network record. No self host なので, 私は scorehosts.db 関連を疑っています. なんか scorehosts.db の SEG10, SEG20 の #define は 最後に \ が無いようですし... 試しに % scbinfo -t v -n parallel-a014.cogni.kumamoto-u.ac.jp -a network を実行してみてください. これは scoreboard に登録された a014 の network を表示するものです. scoreboard が正しければ, ethernet udp shmem0 shmem1 と表示されるはずです. これが正しければ (scout がうまくいくので. 正しそうな気もします.), やっぱり, ac014 の official name が気になります. これを調べるコマンドとしては /opt/score/bin/officialname があるのですが, 多分, compute host にはインストールされていないと思います. 一番速そうなのは, NFS している領域に binary をコピーして実行することだと 思います. home directory が NFS mount されていると仮定して... % cp /opt/score/bin/bin.i386-redhat7-linux2_4/officialname.exe ~ % scout -g seg20 % cd ~ % scout ./officialname.exe を実行したら, どうなるでしょうか? (正しければ, % scout hostname のときと同じ出力になるはずなのですが...) > chisaki> a014が2 NICではなく, > chisaki> #4 (server and compute)である, > chisaki> parallel-a021が2 NICで > chisaki> eth0が外側と,eth1が並列用になっています。 すみません, 勘違いしました. from Kameyama Toyohisa From ti980039 @ ds.cs.toyo.ac.jp Fri May 10 18:29:05 2002 From: ti980039 @ ds.cs.toyo.ac.jp (udagawa minoru) Date: Fri, 10 May 2002 18:29:05 +0900 Subject: [SCore-users-jp] =?iso-2022-jp?B?U0NvcmUbJEIlJCVzJTklSCE8JWskSyREJCQkRhsoQg==?= Message-ID: <000b01c1f805$232fbaa0$b4a8a8c0@Winalpha> お忙しいところ申し訳ありません。東洋大学の宇田川と申します。 早速ですが、以下の手順でSCoreをインストールしようとしました。 サーバ用マシンにRedhat7.2をインストールしたのち、SCore-cdromからScoreをイン ストールしました。 ノードをインストールしようとeitを立ち上げ、インストール用フロッピーを作成し ました。ノード用マシンにフロッピーを入れ、立ち上げましたが、サーバの方には、 ノードのMACアドレス、IPアドレスは認識されたのですが、ノードのインストールの 画面が立ち上がりません。ハードウェアは、クラスタ用にそろえたはずです。 マシンスペック CPU: celeron1.2GHz M/B: GIGABYTE GA-60XT MEM: pc100 256MB G/B: Aopen VANTA_LT PA3000LT-16 ETHER: INTEL eepro100 お忙しいとは思いますが、構築しなければ研究が進みませんので、何か対処法を教え てもらえれば幸いです。 **************************************************** 東洋大学大学院工学研究科情報工学専攻 分散システム研究室 宇田川 稔 E-mail: ti980039 @ ds.cs.toyo.ac.jp *************************************************** -------------- next part -------------- HTMLの添付ファイルを保管しました... URL: From kameyama @ pccluster.org Fri May 10 18:37:26 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Fri, 10 May 2002 18:37:26 +0900 Subject: [SCore-users-jp] =?ISO-2022-JP?B?U0NvcmUbJEIlJCVzJTkbKEI=?= =?ISO-2022-JP?B?GyRCJUghPCVrJEskRCQkJEYbKEI=?= In-Reply-To: Your message of "Fri, 10 May 2002 18:29:05 JST." <000b01c1f805$232fbaa0$b4a8a8c0@Winalpha> Message-ID: <200205100937.g4A9bQv23870@yl-dhcp18.is.s.u-tokyo.ac.jp> 亀山です. In article <000b01c1f805$232fbaa0$b4a8a8c0 @ Winalpha> "udagawa minoru" wrotes: > 早速ですが、以下の手順でSCoreをインストールしようとしました。 > サーバ用マシンにRedhat7.2をインストールしたのち、SCore-cdromからScoreをイン > ストールしました。 > ノードをインストールしようとeitを立ち上げ、インストール用フロッピーを作成し > ました。ノード用マシンにフロッピーを入れ、立ち上げましたが、サーバの方には、 > ノードのMACアドレス、IPアドレスは認識されたのですが、ノードのインストールの > 画面が立ち上がりません。ハードウェアは、クラスタ用にそろえたはずです。 > マシンスペック > CPU: celeron1.2GHz > M/B: GIGABYTE GA-60XT > MEM: pc100 256MB > G/B: Aopen VANTA_LT PA3000LT-16 > ETHER: INTEL eepro100 ノードの画面に何か出ていないでしょうか? また SCote の version は何を使用しているでしょうか? (5.0 でノードのほうの画面で GTK のエラーが出ているようでしたら 5.0.1 を使用すれば改善されるかも知れません.) from Kameyama Toyohisa From chisaki @ cs.kumamoto-u.ac.jp Fri May 10 20:35:14 2002 From: chisaki @ cs.kumamoto-u.ac.jp (Yoshifumi CHISAKI) Date: Fri, 10 May 2002 20:35:14 +0900 Subject: [SCore-users-jp] Re: [SCore-users] <0> SCore-D:ERROR No self host In-Reply-To: <200205100711.g4A7BQv23327@yl-dhcp18.is.s.u-tokyo.ac.jp> References: <200205100711.g4A7BQv23327@yl-dhcp18.is.s.u-tokyo.ac.jp> Message-ID: <20020510113515.31288@vivaldi.cs.kumamoto-u.ac.jp> 苣木です。 #非常勤で行っていた熊本県人吉市から熊本市へ戻るため移動しておりました。 #実をいうと非常勤先から休憩時間にリモートでテストしていました(^^; kameyama @ pccluster.org wrote to 02.5.10 16:11: >亀山です. > >In article <20020510153546M.s-sumi @ flab.fujitsu.co.jp> Shinji Sumimoto wrotes: >> a021のノードで >どうせやるなら a021 と a014 の間で point-to-point test を行ったほうが良い >かも... > > % rpmtest parallel-a021 ethernet -reply & > % rpmtest parallel-a014 ethernet -dest 4 -ping -debug 1 > >は動きますか? >(終了したら -reply のプロセスは kill してください.) 動作します。 >エラーメッセージが > No network record. > No self host >なので, 私は scorehosts.db 関連を疑っています. > >なんか scorehosts.db の SEG10, SEG20 の #define は >最後に \ が無いようですし... これは,貼り付けの際にミスをしたようです。 申し訳ありません。 >試しに > % scbinfo -t v -n parallel-a014.cogni.kumamoto-u.ac.jp -a network >を実行してみてください. >これは scoreboard に登録された a014 の network を表示するものです. >scoreboard が正しければ, > ethernet udp shmem0 shmem1 >と表示されるはずです. 表示されました。 >これが正しければ (scout がうまくいくので. 正しそうな気もします.), >やっぱり, ac014 の official name が気になります. >これを調べるコマンドとしては > /opt/score/bin/officialname >があるのですが, 多分, compute host にはインストールされていないと思います. >一番速そうなのは, NFS している領域に binary をコピーして実行することだと >思います. >home directory が NFS mount されていると仮定して... > % cp /opt/score/bin/bin.i386-redhat7-linux2_4/officialname.exe ~ > % scout -g seg20 > % cd ~ > % scout ./officialname.exe >を実行したら, どうなるでしょうか? >(正しければ, > % scout hostname >のときと同じ出力になるはずなのですが...) parallel-a013.cogni.kumamoto-u.ac.jp parallel-a014 parallel-a021.cogni.kumamoto-u.ac.jp となり,FQDNになっていませんでした。 で,原因ですが, a014:/etc/hostsが, 127.0.0.1 localhost.localdomain localhost 192.168.2.14 paralle-a014 parallel-a014.cogni.kumamoto-u.ac.jp となっていました。 これを, 127.0.0.1 localhost.localdomain localhost 192.168.2.14 parallel-a014.cogni.kumamoto-u.ac.jp parallel-a014 と修正して,無事に動作しました。 どうもありがとうございました。 今回の原因としては, RedHat 7.2をinstallする際に,driverが対応していないだろうという推測により package installの際にNICの設定をせずにinstallし, 後々,自分で手作業で設定したのがミスを引き起こしました。 /etc/sysconfig/networkファイルのみならず, /etc/hostsファイルもチェックする必要があるということでした。 また,最終確認としてscout hostnameではなく, ご指導いただいた, scout ./officialname.exe がベターのようです。 お世話になりました。(_O_) -> to all 明日から実験ができそうです。 /chisaki From nrcb @ streamline-computing.com Thu May 16 15:18:41 2002 From: nrcb @ streamline-computing.com (Nick Birkett) Date: Thu, 16 May 2002 07:18:41 +0100 Subject: [SCore-users-jp] [SCore-users] gigabit/trunking Message-ID: <200205160618.g4G6If312664@pecan.comlab.ox.ac.uk> Hi - we have been installing SCore primarily with Myrinet 2000. We would like to hear of any experiences of users with the following equipment: (1) Trunked ethernet using eepro100 fast ethernet cards ? (2) Gigagbit ? (3) Has anyone tried network trunking using gigabit (expenive for switches I know!!) i.e 2 gigabit cards per host as an alternative to Myrinet2000 ? As regards gigabit, the cheapest equipment is the eepro1000 copper base card. The kernel driver in the 2.4.18 SCORE-5.0.0 kernel is Intel 4.0.7 I think, so maybe ok with this. I know early versions of e1000 had lockup problems using copper card. Maybe the latest Intel version is better ( >= 4.1.7). I think Shinji Sumimoto did not recommend copper cards in the past, but maybe it is better with newer driver. Has anyone got an automatic tool for tuning the maxsend and backoff values for pm/ethernet and trunked network, I couldn't find one in the Score 5 documentation ? Thanks, Nick _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From s-sumi @ flab.fujitsu.co.jp Thu May 16 20:27:26 2002 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Thu, 16 May 2002 20:27:26 +0900 Subject: [SCore-users-jp] Re: [SCore-users] gigabit/trunking In-Reply-To: <200205160618.g4G6If312664@pecan.comlab.ox.ac.uk> References: <200205160618.g4G6If312664@pecan.comlab.ox.ac.uk> Message-ID: <20020516202726U.s-sumi@flab.fujitsu.co.jp> Hi, Nick. From: Nick Birkett Subject: [SCore-users] gigabit/trunking Date: Thu, 16 May 2002 07:18:41 +0100 Message-ID: <200205160618.g4G6If312664 @ pecan.comlab.ox.ac.uk> nrcb> Hi - we have been installing SCore primarily with Myrinet 2000. nrcb> nrcb> We would like to hear of any experiences of users with the following nrcb> equipment: nrcb> nrcb> (1) Trunked ethernet using eepro100 fast ethernet cards ? nrcb> (2) Gigagbit ? nrcb> (3) Has anyone tried network trunking using gigabit (expenive for switches I know!!) nrcb> i.e 2 gigabit cards per host as an alternative to Myrinet2000 ? If you use Network Trunking on Gigabit Ethernet, you should use Ethernet Switches and NICs which support JUMBO FRAME on 66MHz 64bit PCI in order to achieve high bandwidth because of lackness of PCI DMA bandwidth. On PCI-X or on multiple PCI buses, the performance may be increased, but I have not tested.. See: http://www.pccluster.org/score/dist/score/html/en/overview/pm-perf.html We have tested Syskonect 9843 NICs, 3Com 996B-T and Broadcom 5701 NICs using Network Trunking with JUMBO FRAMEs. We have also tested Intel PRO100T, PRO1000XT but not tested with JUMBO FRAMEs. nrcb> As regards gigabit, the cheapest equipment is the eepro1000 copper base card. nrcb> The kernel driver in the 2.4.18 SCORE-5.0.0 kernel is Intel 4.0.7 I think, so maybe ok with this. nrcb> I know early versions of e1000 had lockup problems using copper card. Maybe nrcb> the latest Intel version is better ( >= 4.1.7). I think Shinji Sumimoto did not nrcb> recommend copper cards in the past, but maybe it is better with newer driver. nrcb> nrcb> Has anyone got an automatic tool for tuning the maxsend and backoff values for pm/ethernet and trunked network, nrcb> I couldn't find one in the Score 5 documentation ? Sorry We do not have, but I think I wont to make it. The problem is that the optimal value is depend on number of nodes and NIC hardare and applications.. I think some application programs or communication benchmarks are required for tuning.. Shinji. nrcb> nrcb> Thanks, nrcb> nrcb> Nick nrcb> nrcb> _______________________________________________ nrcb> SCore-users mailing list nrcb> SCore-users @ pccluster.org nrcb> http://www.pccluster.org/mailman/listinfo/score-users nrcb> nrcb> ------ Shinji Sumimoto, Fujitsu Labs _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From chen @ mdl.ipc.pku.edu.cn Sat May 18 01:33:07 2002 From: chen @ mdl.ipc.pku.edu.cn (Chen Hao) Date: Sat, 18 May 2002 00:33:07 +0800 (CST) Subject: [SCore-users-jp] [SCore-users] Network Trunking Message-ID: I build a small cluster with score 5.0 in my lab, and I install two ethernet card(3c905B) in one node. But after I complete configuration following by the documents, I found there's no differences between 2 NICs trunking network and single network because there is always only one NIC works. what's the matter? _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From tkuroda @ nifs.ac.jp Sun May 19 00:39:13 2002 From: tkuroda @ nifs.ac.jp (Kuroda Tohru) Date: Sun, 19 May 2002 00:39:13 +0900 Subject: [SCore-users-jp] =?iso-2022-jp?B?RElTUExBWRskQiROPCtGMEBfRGobKEI=?= Message-ID: <000501c1fe82$2950cf90$66614b85@tadgw01hda1> メーリングリスト皆様 黒田と申します。 ( Redhat Linux 7.2上に、   SCore 5.0.1 をeit -nisonlyでインストールしました。   最近まで、5.0.0が入っていました。   SCoreのカスタマイズはしていません。  ) ドキュメント http://www.pccluster.org/score/dist/score/html/ja/howtouse/demo.html の、デモのMPC++ MTTLを用いたマンデルブロットを サーバーホストにローカルにログインした状態で 行おうとしたときに気になりましたことを ご質問させていただきたく存じます。 関連ドキュメント http://www.pccluster.org/score/dist/score/html/ja/howtouse/xwindow.html に関することになりますが、 この文書中には、環境変数DISPLAYの値が自動的に適切に設定される とありますが、私のシステムではうまく設定されておらず、値は " :0 " のままです。このため、デモをdemo.html にある記述だけでやろうとすると、 "can't open display :0.0 " とメッセージが出て、 ウィンドウは表示されません。 ( 他のemacsなどは、ウィンドウが表示できています。   また、msgb、monitorも表示できています。) 上記デモウィンドウを開くには、 手動で export DISPLAY=server:0 をやれば大丈夫ですが、 どこか、OS・システム設定のエラーを示唆しているようでもあり、 できれば自動でDISPLAYが設定されるようにしたいと思っております。 自動設定を可能にするために確認すべき点・変更すべき点等 ありますでしょうか。 また、DISPLAYが自動設定されるのはどのコマンドの時になりますか。 以上について、ご指摘・ご教授のほどお願い申しあげます。              黒田 From hori @ swimmy-soft.com Sun May 19 03:45:29 2002 From: hori @ swimmy-soft.com (Atsushi HORI) Date: Sun, 19 May 2002 03:45:29 +0900 Subject: [SCore-users-jp] =?ISO-2022-JP?B?RElTUExBWRskQiROPCtGMEBfRGobKEo=?= In-Reply-To: <000501c1fe82$2950cf90$66614b85@tadgw01hda1> References: <000501c1fe82$2950cf90$66614b85@tadgw01hda1> Message-ID: <3104624729.hori0000@mail.bestsystems.co.jp> 堀@スイミー・ソフトウェアと申します. >関連ドキュメント >http://www.pccluster.org/score/dist/score/html/ja/howtouse/xwindow.html > >に関することになりますが、 >この文書中には、環境変数DISPLAYの値が自動的に適切に設定される >とありますが、 まずはお詫びから.このページに記述されている X Window の機能は,今現在 使われておりません. しかし,期待されているような機能,つまりDISPLAY環境変数を自動で設定す る,という機能を実現することは,いずれにせよ,不可能なことですので,適 切に設定する必要があります. >上記デモウィンドウを開くには、 >手動で export DISPLAY=server:0 をやれば大丈夫ですが、 >どこか、OS・システム設定のエラーを示唆しているようでもあり、 >できれば自動でDISPLAYが設定されるようにしたいと思っております。 ということで,DISPLAY 環境変数を設定していただく必要があります. 補足 >関連ドキュメント >http://www.pccluster.org/score/dist/score/html/ja/howtouse/xwindow.html の機能は,firewall 等でクラスタのホストからクラスタの外に X Window の プロトコルが通らないような場合に,DISPLAY環境変数を scrun ホストに「自 動的に設定し直す」というものです.しかしながらこの機能は X authority と相性が悪く,問題が多かったので(デフォルトのコンフィグレーションでは )外してしまった,という経緯があります. From s-sumi @ bd6.so-net.ne.jp Sun May 19 09:54:57 2002 From: s-sumi @ bd6.so-net.ne.jp (Shinji Sumimoto) Date: Sun, 19 May 2002 09:54:57 +0900 Subject: [SCore-users-jp] Re: [SCore-users] Network Trunking In-Reply-To: References: Message-ID: <20020519095457S.s-sumi@bd6.so-net.ne.jp> Hi. Have you set the network option when you run your application? As described in the document (http://www.pccluster.org/score/dist/score/html/en/reference/pm/ether-trunking.html), you need to set network name, such as ethernet-x2, ethernet-x3, in order to use network trunking. This is also needed when you try to run your application program: For example, % scrun -nodes=4x1,network=ethernet-x2 ./a.out The scrun command option is described in http://www.pccluster.org/score/dist/score/html/en/man/man1/scrun.html. If you have already done, please let us know more information, such as your cluster hardware configuration, such as scorehoss.db, configuration file setting. Shinji. From: Chen Hao Subject: [SCore-users] Network Trunking Date: Sat, 18 May 2002 00:33:07 +0800 (CST) > I build a small cluster with score 5.0 in my lab, and I install two > ethernet card(3c905B) in one node. But after I complete configuration > following by the documents, I found there's no differences between 2 NICs > trunking network and single network because there is always only one NIC > works. what's the matter? > > _______________________________________________ > SCore-users mailing list > SCore-users @ pccluster.org > http://www.pccluster.org/mailman/listinfo/score-users > ----- Shinji Sumimoto E-Mail: s-sumi @ bd6.so-net.ne.jp _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From nakata @ bestsystems.co.jp Sun May 19 10:15:01 2002 From: nakata @ bestsystems.co.jp (Hisaho Nakata) Date: Sun, 19 May 2002 10:15:01 +0900 Subject: [SCore-users-jp] [Q} How to use sc_qsub ? Message-ID: <200205190115.AA00104@CRAFT.bestsystems.co.jp> 中田@ベストシステムズです。 PBSの設定で、/var/scored/pbs/server_priv/nodesファイルで --------------------------------------------------------------- node0.cluster b004a b008a pcc sore node1.cluster b004a b008a pcc sore node2.cluster b004a b008a pcc sore node3.cluster b004a b008a pcc sore node4.cluster b004b b008a pcc sore node5.cluster b004b b008a pcc sore node6.cluster b004b b008a pcc sore node7.cluster b004b b008a pcc sore node8.cluster b004c b008b pcc sore node9.cluster b004c b008b pcc sore node10.cluster b004c b008b pcc sore : : --------------------------------------------------------------- とした場合、 $ qsub -l nodes=4:score:b004b score.sh でプロパティーb004bのノードにPBSのジョブを投入することはできるのですが、sc_qsubの場合は このようなことはできるのでしょうか? ================================================================================ 中田 寿穂 (Hisaho Nakata) E-mail: nakata @ bestsystems.co.jp 株式会社 ベストシステムズ 〒110-0016 東京都台東区台東2-18-8 台東K-1ビル2,3F TEL: +81-3-5812-1350 FAX: +81-3-5812-1351 URL: http://www.bestsystems.co.jp/ ================================================================================ From nagano @ atrc.mhi.co.jp Sun May 19 18:57:43 2002 From: nagano @ atrc.mhi.co.jp (Ichiro Nagano) Date: Sun, 19 May 2002 18:57:43 +0900 Subject: [SCore-users] [SCore-users-jp] SCore for Red Hat 7.3J References: <000b01c1f805$232fbaa0$b4a8a8c0@Winalpha> Message-ID: <0c6401c1ff1b$a1c92b40$46130190@kibanad.artc.mhi.co.jp> Dear SCore users, I am a new user of SCore. Is SCore Version 5.0.1 suited to Red Hat 7.3 or 7.3J? Dose anyone test with it? Please inform me the suitability. Thanks for any help, Ichiro Nagano ******************************************************************** Advanced Technology Research Center, Mitsubishi Heavy Industries, Ltd. 8-1, Sachiura, 1-Chome, Kanazawa-ku, Yokohama, 236-8515, Japan Ichiro Nagano e-mail: TEL: + 81 (45) 771-1222 FAX: + 81 (45) 771-3879 _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Mon May 20 09:55:05 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Mon, 20 May 2002 09:55:05 +0900 Subject: [SCore-users-jp] [Q} How to use sc_qsub ? In-Reply-To: Your message of "Sun, 19 May 2002 10:15:01 JST." <200205190115.AA00104@CRAFT.bestsystems.co.jp> Message-ID: <200205200055.g4K0t5v04901@yl-dhcp18.is.s.u-tokyo.ac.jp> 亀山です. In article <200205190115.AA00104 @ CRAFT.bestsystems.co.jp> Hisaho Nakata wrotes: > PBSの設定で、/var/scored/pbs/server_priv/nodesファイルで > --------------------------------------------------------------- > node0.cluster b004a b008a pcc sore score -> score ですよね? > > $ qsub -l nodes=4:score:b004b score.sh > でプロパティーb004bのノードにPBSのジョブを投入することはできるのですが、sc_qs > ubの場合は > このようなことはできるのでしょうか? manual には -l option は指定できないと書かれていますが, コード上は -l option の nodes 以外は指定できるようですので, $ sc_qsub -l b004b -nodes=4 ... で動く可能性が高そうです. from Kameyama Toyohisa From chen @ mdl.ipc.pku.edu.cn Tue May 21 01:13:58 2002 From: chen @ mdl.ipc.pku.edu.cn (Chen Hao) Date: Tue, 21 May 2002 00:13:58 +0800 (CST) Subject: [SCore-users-jp] Re: [SCore-users] Network Trunking In-Reply-To: <20020519095457S.s-sumi@bd6.so-net.ne.jp> Message-ID: I have already set the right network option when I run your application. The hardware configuration of cluster is the following: cluster include 16 nodes, each node has two ethernet card(3C905B) and connect two 24-ports switch(two ethernet card in one node connect different switch). The scorehost.db file is in the attachment. On Sun, 19 May 2002, Shinji Sumimoto wrote: > Hi. > > Have you set the network option when you run your application? > > As described in the document > (http://www.pccluster.org/score/dist/score/html/en/reference/pm/ether-trunking.html), > you need to set network name, such as ethernet-x2, ethernet-x3, in > order to use network trunking. > > This is also needed when you try to run your application program: > > For example, > > % scrun -nodes=4x1,network=ethernet-x2 ./a.out > > The scrun command option is described in > http://www.pccluster.org/score/dist/score/html/en/man/man1/scrun.html. > > If you have already done, please let us know more information, such as > your cluster hardware configuration, such as scorehoss.db, > configuration file setting. > > Shinji. > > From: Chen Hao > Subject: [SCore-users] Network Trunking > Date: Sat, 18 May 2002 00:33:07 +0800 (CST) > > > I build a small cluster with score 5.0 in my lab, and I install two > > ethernet card(3c905B) in one node. But after I complete configuration > > following by the documents, I found there's no differences between 2 NICs > > trunking network and single network because there is always only one NIC > > works. what's the matter? > > > > _______________________________________________ > > SCore-users mailing list > > SCore-users @ pccluster.org > > http://www.pccluster.org/mailman/listinfo/score-users > > > ----- > Shinji Sumimoto E-Mail: s-sumi @ bd6.so-net.ne.jp > -------------- next part -------------- 文字コード指定の無い添付文書を保管しました... 名前: scorehosts.db URL: From nakata @ bestsystems.co.jp Tue May 21 06:48:31 2002 From: nakata @ bestsystems.co.jp (Hisaho Nakata) Date: Tue, 21 May 2002 06:48:31 +0900 Subject: [SCore-users-jp] [Q} How to use sc_qsub ? In-Reply-To: <200205200055.g4K0t5v04901@yl-dhcp18.is.s.u-tokyo.ac.jp> References: <200205200055.g4K0t5v04901@yl-dhcp18.is.s.u-tokyo.ac.jp> Message-ID: <200205202148.AA00113@CRAFT.bestsystems.co.jp> 中田@ベストシステムズです。 >亀山です. > >In article <200205190115.AA00104 @ CRAFT.bestsystems.co.jp> Hisaho Nakata wrotes: >> PBSの設定で、/var/scored/pbs/server_priv/nodesファイルで >> --------------------------------------------------------------- >> node0.cluster b004a b008a pcc sore > >score -> score ですよね? > >> >> $ qsub -l nodes=4:score:b004b score.sh >> でプロパティーb004bのノードにPBSのジョブを投入することはできるのですが、sc_qs >> ubの場合は >> このようなことはできるのでしょうか? > >manual には -l option は指定できないと書かれていますが, >コード上は -l option の nodes 以外は指定できるようですので, > $ sc_qsub -l b004b -nodes=4 ... >で動く可能性が高そうです. $ sc_qsub -l b004b -nodes=4 .... はだめでした。 とりあえず、ご報告までに。 ついでなのですが、PBS on SCoreでのPBSの設定に関してなのですが set queue b008 resources_max.walltime = 12:00:00 て使えないのでしょうか(PBSがジョブをSCore-Dに投げてしまうから)? scrun -cpulimit=6000でも回避できるのですが、ちょっと気になったもので。 ================================================================================ 中田 寿穂 (Hisaho Nakata) E-mail: nakata @ bestsystems.co.jp 株式会社 ベストシステムズ 〒110-0016 東京都台東区台東2-18-8 台東K-1ビル2,3F TEL: +81-3-5812-1350 FAX: +81-3-5812-1351 URL: http://www.bestsystems.co.jp/ ================================================================================ From s-sumi @ flab.fujitsu.co.jp Tue May 21 08:45:16 2002 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Tue, 21 May 2002 08:45:16 +0900 Subject: [SCore-users-jp] Re: [SCore-users] Network Trunking In-Reply-To: References: <20020519095457S.s-sumi@bd6.so-net.ne.jp> Message-ID: <20020521084516Q.s-sumi@flab.fujitsu.co.jp> Hi. Please change network definition from ======================================================= ethernet-x2 type=ethernet \ -config:file=/opt/score/etc/pm-ethernet-1.conf -trunk0:file=/opt/score/etc/pm-ethernet-0.conf ======================================================= to ======================================================= ethernet-x2 type=ethernet \ -config:file=/opt/score/etc/pm-ethernet-1.conf \ -trunk0:file=/opt/score/etc/pm-ethernet-0.conf ======================================================= Your definition only use /opt/score/etc/pm-ethernet-1.conf network. Shinji. From: Chen Hao Subject: Re: [SCore-users] Network Trunking Date: Tue, 21 May 2002 00:13:58 +0800 (CST) Message-ID: chen> I have already set the right network option when I run your chen> application. The hardware configuration of cluster is the following: chen> cluster include 16 nodes, each node has two ethernet card(3C905B) and chen> connect two 24-ports switch(two ethernet card in one node connect chen> different switch). chen> The scorehost.db file is in the attachment. chen> chen> On Sun, 19 May 2002, Shinji Sumimoto wrote: chen> chen> > Hi. chen> > chen> > Have you set the network option when you run your application? chen> > chen> > As described in the document chen> > (http://www.pccluster.org/score/dist/score/html/en/reference/pm/ether-trunking.html), chen> > you need to set network name, such as ethernet-x2, ethernet-x3, in chen> > order to use network trunking. chen> > chen> > This is also needed when you try to run your application program: chen> > chen> > For example, chen> > chen> > % scrun -nodes=4x1,network=ethernet-x2 ./a.out chen> > chen> > The scrun command option is described in chen> > http://www.pccluster.org/score/dist/score/html/en/man/man1/scrun.html. chen> > chen> > If you have already done, please let us know more information, such as chen> > your cluster hardware configuration, such as scorehoss.db, chen> > configuration file setting. chen> > chen> > Shinji. chen> > chen> > From: Chen Hao chen> > Subject: [SCore-users] Network Trunking chen> > Date: Sat, 18 May 2002 00:33:07 +0800 (CST) chen> > chen> > > I build a small cluster with score 5.0 in my lab, and I install two chen> > > ethernet card(3c905B) in one node. But after I complete configuration chen> > > following by the documents, I found there's no differences between 2 NICs chen> > > trunking network and single network because there is always only one NIC chen> > > works. what's the matter? chen> > > chen> > > _______________________________________________ chen> > > SCore-users mailing list chen> > > SCore-users @ pccluster.org chen> > > http://www.pccluster.org/mailman/listinfo/score-users chen> > > chen> > ----- chen> > Shinji Sumimoto E-Mail: s-sumi @ bd6.so-net.ne.jp chen> > ------ Shinji Sumimoto, Fujitsu Labs _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From chen @ mdl.ipc.pku.edu.cn Tue May 21 12:17:04 2002 From: chen @ mdl.ipc.pku.edu.cn (Chen Hao) Date: Tue, 21 May 2002 11:17:04 +0800 (CST) Subject: [SCore-users-jp] Re: [SCore-users] Network Trunking In-Reply-To: <20020521084516Q.s-sumi@flab.fujitsu.co.jp> Message-ID: Now it works. Thanks a lot. But when I use netpipe to bench the network bandwidth, I find that only when the transfered block size over 1024 bytes the network bandwidth has increased observably. Is this the bug of the design or other reason? On Tue, 21 May 2002, Shinji Sumimoto wrote: > Hi. > > Please change network definition > > from > ======================================================= > ethernet-x2 type=ethernet \ > -config:file=/opt/score/etc/pm-ethernet-1.conf > -trunk0:file=/opt/score/etc/pm-ethernet-0.conf > ======================================================= > > to > ======================================================= > ethernet-x2 type=ethernet \ > -config:file=/opt/score/etc/pm-ethernet-1.conf \ > -trunk0:file=/opt/score/etc/pm-ethernet-0.conf > ======================================================= > > Your definition only use /opt/score/etc/pm-ethernet-1.conf network. > > Shinji. > > From: Chen Hao > Subject: Re: [SCore-users] Network Trunking > Date: Tue, 21 May 2002 00:13:58 +0800 (CST) > Message-ID: > > chen> I have already set the right network option when I run your > chen> application. The hardware configuration of cluster is the following: > chen> cluster include 16 nodes, each node has two ethernet card(3C905B) and > chen> connect two 24-ports switch(two ethernet card in one node connect > chen> different switch). > chen> The scorehost.db file is in the attachment. > chen> > chen> On Sun, 19 May 2002, Shinji Sumimoto wrote: > chen> > chen> > Hi. > chen> > > chen> > Have you set the network option when you run your application? > chen> > > chen> > As described in the document > chen> > (http://www.pccluster.org/score/dist/score/html/en/reference/pm/ether-trunking.html), > chen> > you need to set network name, such as ethernet-x2, ethernet-x3, in > chen> > order to use network trunking. > chen> > > chen> > This is also needed when you try to run your application program: > chen> > > chen> > For example, > chen> > > chen> > % scrun -nodes=4x1,network=ethernet-x2 ./a.out > chen> > > chen> > The scrun command option is described in > chen> > http://www.pccluster.org/score/dist/score/html/en/man/man1/scrun.html. > chen> > > chen> > If you have already done, please let us know more information, such as > chen> > your cluster hardware configuration, such as scorehoss.db, > chen> > configuration file setting. > chen> > > chen> > Shinji. > chen> > > chen> > From: Chen Hao > chen> > Subject: [SCore-users] Network Trunking > chen> > Date: Sat, 18 May 2002 00:33:07 +0800 (CST) > chen> > > chen> > > I build a small cluster with score 5.0 in my lab, and I install two > chen> > > ethernet card(3c905B) in one node. But after I complete configuration > chen> > > following by the documents, I found there's no differences between 2 NICs > chen> > > trunking network and single network because there is always only one NIC > chen> > > works. what's the matter? > chen> > > > chen> > > _______________________________________________ > chen> > > SCore-users mailing list > chen> > > SCore-users @ pccluster.org > chen> > > http://www.pccluster.org/mailman/listinfo/score-users > chen> > > > chen> > ----- > chen> > Shinji Sumimoto E-Mail: s-sumi @ bd6.so-net.ne.jp > chen> > > ------ > Shinji Sumimoto, Fujitsu Labs > _______________________________________________ > SCore-users mailing list > SCore-users @ pccluster.org > http://www.pccluster.org/mailman/listinfo/score-users > _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Tue May 21 14:29:31 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Tue, 21 May 2002 14:29:31 +0900 Subject: [SCore-users-jp] [Q} How to use sc_qsub ? In-Reply-To: Your message of "Tue, 21 May 2002 06:48:31 JST." <200205202148.AA00113@CRAFT.bestsystems.co.jp> Message-ID: <200205210529.g4L5TVv12223@yl-dhcp18.is.s.u-tokyo.ac.jp> 亀山です. In article <200205202148.AA00113 @ CRAFT.bestsystems.co.jp> Hisaho Nakata wrotes: > >manual には -l option は指定できないと書かれていますが, > >コード上は -l option の nodes 以外は指定できるようですので, > > $ sc_qsub -l b004b -nodes=4 ... > >で動く可能性が高そうです. > > $ sc_qsub -l b004b -nodes=4 .... > はだめでした。 ダメなことを確認しました. 次のバージョンでは使えるようになると思います. > ついでなのですが、PBS on SCoreでのPBSの設定に関してなのですが > set queue b008 resources_max.walltime = 12:00:00 > て使えないのでしょうか(PBSがジョブをSCore-Dに投げてしまうから)? 一応, 使えるようですけど... ただ, 反応が悪そうです. (10 秒, 1 秒に設定したのに, 45 秒で効きました.) error log は以下のようになっています. <0:0> SCORE: 32 nodes (16x2) ready. =>> PBS: job killed: walltime 45 exceeded limit 1 SCORE: Killing ... FEP:ERROR SCore-D unexpectedly terminated. scrun ではなく, scored が kill されているような感じですけど... from Kameyama Toyohisa From s-sumi @ flab.fujitsu.co.jp Tue May 21 18:11:09 2002 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Tue, 21 May 2002 18:11:09 +0900 Subject: [SCore-users-jp] Re: [SCore-users] Network Trunking In-Reply-To: References: <20020521084516Q.s-sumi@flab.fujitsu.co.jp> Message-ID: <20020521181109Q.s-sumi@flab.fujitsu.co.jp> Hi. Have you tuned the parameters of pm-ethernet.conf? http://www.pccluster.org/score/dist/score/html/en/man/man5/pm-ether-conf.html If you use default value, please change and test performance. I think you should use the parameter around backoff 2400 maxnsend 24. I tested communication performace of Network Trunking on 3C905B using rpmtest. The results are showed page 85 in the paper: Shinji Sumimoto. A Study of High Performance Communication Using a Commodity Network of Parallel Computers. Ph.D Dissertation presented to Keio University, 2000. http://www.pccluster.org/score/dist/score/papers/sumimoto00.pdf In my evaluation, bandwidth performance of Network Trunking is increased over 400Byte messages. This depend on architecture of hardware and device driver. 3C905B is not so good performace as eepro100 and tulip. Shinji. From: Chen Hao Subject: [SCore-users-jp] Re: [SCore-users] Network Trunking Date: Tue, 21 May 2002 11:17:04 +0800 (CST) Message-ID: chen> Now it works. Thanks a lot. But when I use netpipe to bench the chen> network bandwidth, I find that only when the transfered block size chen> over 1024 bytes the network bandwidth has increased observably. chen> Is this the bug of the design or other reason? chen> chen> On Tue, 21 May 2002, Shinji Sumimoto wrote: chen> chen> > Hi. chen> > chen> > Please change network definition chen> > chen> > from chen> > ======================================================= chen> > ethernet-x2 type=ethernet \ chen> > -config:file=/opt/score/etc/pm-ethernet-1.conf chen> > -trunk0:file=/opt/score/etc/pm-ethernet-0.conf chen> > ======================================================= chen> > chen> > to chen> > ======================================================= chen> > ethernet-x2 type=ethernet \ chen> > -config:file=/opt/score/etc/pm-ethernet-1.conf \ chen> > -trunk0:file=/opt/score/etc/pm-ethernet-0.conf chen> > ======================================================= chen> > chen> > Your definition only use /opt/score/etc/pm-ethernet-1.conf network. chen> > chen> > Shinji. chen> > chen> > From: Chen Hao chen> > Subject: Re: [SCore-users] Network Trunking chen> > Date: Tue, 21 May 2002 00:13:58 +0800 (CST) chen> > Message-ID: chen> > chen> > chen> I have already set the right network option when I run your chen> > chen> application. The hardware configuration of cluster is the following: chen> > chen> cluster include 16 nodes, each node has two ethernet card(3C905B) and chen> > chen> connect two 24-ports switch(two ethernet card in one node connect chen> > chen> different switch). chen> > chen> The scorehost.db file is in the attachment. chen> > chen> chen> > chen> On Sun, 19 May 2002, Shinji Sumimoto wrote: chen> > chen> chen> > chen> > Hi. chen> > chen> > chen> > chen> > Have you set the network option when you run your application? chen> > chen> > chen> > chen> > As described in the document chen> > chen> > (http://www.pccluster.org/score/dist/score/html/en/reference/pm/ether-trunking.html), chen> > chen> > you need to set network name, such as ethernet-x2, ethernet-x3, in chen> > chen> > order to use network trunking. chen> > chen> > chen> > chen> > This is also needed when you try to run your application program: chen> > chen> > chen> > chen> > For example, chen> > chen> > chen> > chen> > % scrun -nodes=4x1,network=ethernet-x2 ./a.out chen> > chen> > chen> > chen> > The scrun command option is described in chen> > chen> > http://www.pccluster.org/score/dist/score/html/en/man/man1/scrun.html. chen> > chen> > chen> > chen> > If you have already done, please let us know more information, such as chen> > chen> > your cluster hardware configuration, such as scorehoss.db, chen> > chen> > configuration file setting. chen> > chen> > chen> > chen> > Shinji. chen> > chen> > chen> > chen> > From: Chen Hao chen> > chen> > Subject: [SCore-users] Network Trunking chen> > chen> > Date: Sat, 18 May 2002 00:33:07 +0800 (CST) chen> > chen> > chen> > chen> > > I build a small cluster with score 5.0 in my lab, and I install two chen> > chen> > > ethernet card(3c905B) in one node. But after I complete configuration chen> > chen> > > following by the documents, I found there's no differences between 2 NICs chen> > chen> > > trunking network and single network because there is always only one NIC chen> > chen> > > works. what's the matter? chen> > chen> > > chen> > chen> > > _______________________________________________ chen> > chen> > > SCore-users mailing list chen> > chen> > > SCore-users @ pccluster.org chen> > chen> > > http://www.pccluster.org/mailman/listinfo/score-users chen> > chen> > > chen> > chen> > ----- chen> > chen> > Shinji Sumimoto E-Mail: s-sumi @ bd6.so-net.ne.jp chen> > chen> > chen> > ------ chen> > Shinji Sumimoto, Fujitsu Labs chen> > _______________________________________________ chen> > SCore-users mailing list chen> > SCore-users @ pccluster.org chen> > http://www.pccluster.org/mailman/listinfo/score-users chen> > chen> chen> _______________________________________________ chen> SCore-users mailing list chen> SCore-users @ pccluster.org chen> http://www.pccluster.org/mailman/listinfo/score-users chen> _______________________________________________ chen> SCore-users-jp mailing list chen> SCore-users-jp @ pccluster.org chen> http://www.pccluster.org/mailman/listinfo/score-users-jp chen> ------ Shinji Sumimoto, Fujitsu Labs _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From yamanaka @ exassia.tmit.ac.jp Wed May 22 20:22:23 2002 From: yamanaka @ exassia.tmit.ac.jp (Yamanaka Kenshi) Date: Wed, 22 May 2002 20:22:23 +0900 Subject: [SCore-users-jp] NIC Message-ID: <20020522202223.7ce49b7d.yamanaka@exassia.tmit.ac.jp> お世話になっています。科技大@山中です。 NICについて質問があります。 以前、VIAのチップを搭載したCoregaのFastEther!! PCI-TXというカードを使って、 SCore4.2.1でシステムを作った時、計算ノード1がカーネルパニックでフリーズするという現象がありました。 マザーボードのチップセットはi810です。 この現象はどうにも解消できず、計算ノード1だけ、IntelのPRO/100 Sに交換しました。 その結果、計算を投入してノード1がカーネルパニックで止まるという現象はなくなりました。 問題は解消されたと思ったのですが、計算結果が返ってこなかったり、サーバーから他のノード1を除いた 他のノード(VIAのチップを使ったNICです)へ通信できなくなる(pingする通らなくなる)という現象がでました。 そこで、ネットワークが通らなくなる前に、dmesgで情報を見るとノード1以外のノードで、 eth0: Inconsistent Rx descriptor chain. というメッセージが大量に出ています。 いずれにしても今後NICはすべてIntel製のものに変えるつもりですが、これはどのような現象なのでしょうか? checksumはonにしています。 procの情報を見ても特にエラーなどは出ていませんでした。 よろしくお願いします。 *----------------------------* 都立科学技術大学 大学院 白鳥研究室 山中賢史 yamanaka @ exassia.tmit.ac.jp http://exassia.tmit.ac.jp *----------------------------* From s-sumi @ bd6.so-net.ne.jp Thu May 23 14:03:05 2002 From: s-sumi @ bd6.so-net.ne.jp (=?iso-2022-jp?b?cy1zdW1pIBskQiF3GyhCIGJkNi5zby1uZXQubmUuanA=?=) Date: Thu, 23 May 2002 14:03:05 +0900 Subject: [SCore-users-jp] NIC In-Reply-To: <20020522202223.7ce49b7d.yamanaka@exassia.tmit.ac.jp> References: <20020522202223.7ce49b7d.yamanaka@exassia.tmit.ac.jp> Message-ID: <20020523140305T.s-sumi@bd6.so-net.ne.jp> 山中様 住元です。 From: Yamanaka Kenshi Subject: [SCore-users-jp] NIC Date: Wed, 22 May 2002 20:22:23 +0900 > お世話になっています。科技大@山中です。 > NICについて質問があります。 > 以前、VIAのチップを搭載したCoregaのFastEther!! PCI-TXというカードを使って、 > SCore4.2.1でシステムを作った時、計算ノード1がカーネルパニックでフリーズするという現象がありました。 > マザーボードのチップセットはi810です。 > この現象はどうにも解消できず、計算ノード1だけ、IntelのPRO/100 Sに交換しました。 > その結果、計算を投入してノード1がカーネルパニックで止まるという現象はなくなりました。 > 問題は解消されたと思ったのですが、計算結果が返ってこなかったり、サーバーから他のノード1を除いた > 他のノード(VIAのチップを使ったNICです)へ通信できなくなる(pingする通らなくなる)という現象がでました。 > そこで、ネットワークが通らなくなる前に、dmesgで情報を見るとノード1以外のノードで、 > eth0: Inconsistent Rx descriptor chain. > というメッセージが大量に出ています。 > いずれにしても今後NICはすべてIntel製のものに変えるつもりですが、これはどのような現象なのでしょうか? > checksumはonにしています。 これは、VIA NICのデバイスドライバのメッセージで、受信のディスクリプタと それぞれのディスクリプタに対応するskbufの配列があるのですが、受信ディス クリプタの内容は正常なのに、それに対応するskbufのポインタがないという意 味のメッセージです。デバイスドライバ内部のエラーメッセージです。 ひとつ、確認したいのですが、SCore4.2.1ののvia-rhineのデバイスドライバの ソース(/usr/src/linux/drivers/net/via)の中でmax_interrupt_work の値はい くらになっているでしょう?もし、20くらいの小さな値でしたら、2000くらいの 大きな値にして試してもらえないでしょうか? 以上、宜しくお願いします。 > procの情報を見ても特にエラーなどは出ていませんでした。 > > よろしくお願いします。 > > *----------------------------* > 都立科学技術大学 大学院 > 白鳥研究室 > 山中賢史 > yamanaka @ exassia.tmit.ac.jp > http://exassia.tmit.ac.jp > *----------------------------* > _______________________________________________ > SCore-users-jp mailing list > SCore-users-jp @ pccluster.org > http://www.pccluster.org/mailman/listinfo/score-users-jp > ----- Shinji Sumimoto Fujitsu Labs From yamanaka @ exassia.tmit.ac.jp Thu May 23 15:31:47 2002 From: yamanaka @ exassia.tmit.ac.jp (Yamanaka Kenshi) Date: Thu, 23 May 2002 15:31:47 +0900 Subject: [SCore-users-jp] NIC In-Reply-To: <20020523140305T.s-sumi@bd6.so-net.ne.jp> References: <20020522202223.7ce49b7d.yamanaka@exassia.tmit.ac.jp> <20020523140305T.s-sumi@bd6.so-net.ne.jp> Message-ID: <20020523153147.524cb4cf.yamanaka@exassia.tmit.ac.jp> 山中です。住元様、ご返答有難うございます。 SCoreですが、今は5.0.1を使っています。 ノード1のNICを交換する時にSCore4.2.1から5.0.1へ上げましたので、 4.2.1で同様の現象があるかどうかは分かりません。 カーネルはkernel-2.4.18-2SCOREを使っていますので、それに含まれるviaのドライバーのソースでは、 max_interruptの値は2000になっていました。 ちなみに現在のmaxsendの値は16ですが、配列のサイズに問題があるようなら小さくした方がいいのですか? またpm-udpを試そうと思い実行しましたが、scrunをすると止まります。 SCore4.1からudpはサポート外と書かれていますが、これは使えなくなったという意味なのでしょうか? それともメンテナンスしないという意味なのでしょうか? udpのテストはちゃんと通っています。 よろしくお願いします。 *----------------------------* 都立科学技術大学 大学院 白鳥研究室 山中賢史 yamanaka @ exassia.tmit.ac.jp http://exassia.tmit.ac.jp *----------------------------* From kameyama @ pccluster.org Thu May 23 16:00:22 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Thu, 23 May 2002 16:00:22 +0900 Subject: [SCore-users-jp] Re: [SCore-users] SCore for Red Hat 7.3J In-Reply-To: Your message of "Sun, 19 May 2002 18:57:43 JST." <0c6401c1ff1b$a1c92b40$46130190@kibanad.artc.mhi.co.jp> Message-ID: <200205230700.g4N70Mv24823@yl-dhcp18.is.s.u-tokyo.ac.jp> In article <0c6401c1ff1b$a1c92b40$46130190 @ kibanad.artc.mhi.co.jp> "Ichiro Nagano" wrotes: > Is SCore Version 5.0.1 suited to Red Hat 7.3 or 7.3J? I installed SCore 5.0.1 on Red Hat 7.3. I installed compute host by EIT, then compute host is Red Hat 7.2 based. I tested PM, SCore and Omni on that environment. There was no probrem. from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From izutsu @ bestsystems.co.jp Mon May 27 14:11:48 2002 From: izutsu @ bestsystems.co.jp (Hirokazu Izutsu) Date: Mon, 27 May 2002 14:11:48 +0900 Subject: [SCore-users-jp] "Re:" is OK Message-ID: <001801c2053d$0108e7e0$5d00010a@sonet.ne.jp> ------------------ 井筒 浩一(Hirokazu Izutsu) E-Mail: izutsu @ bestsystems.co.jp http://www.bestsystems.co.jp 株式会社 ベストシステムズ 大阪事業所 〒553-0003 大阪市福島区福島6丁目8番10号 クリスビル 9階 M-18 TEL 06-4798-7480 FAX: (06)4798-7481 From klaas @ ccrl-nece.de Wed May 29 18:04:02 2002 From: klaas @ ccrl-nece.de (Jens Klaas) Date: Wed, 29 May 2002 11:04:02 +0200 (MESZ) Subject: [SCore-users-jp] [SCore-users] scheduleing database Message-ID: <200205290904.LAA21411@einstein.ccrl-nece.technopark.gmd.de> Hi list, I like to set a scheduler on-top of score. For that I like to know if there is any database where the scored stores the scheduled jobs or the free/assigned nodes. cu Jens ------------------------------------------------------------------------------ Jens Klaas NEC Europe Ltd. C&C Research Laboratories Rathausallee 10 D-53757 Sankt Augustin Phone: 02241/9252-0 02241/9252-72 Fax: 02241/9252-99 eMail: klaas @ ccrl-nece.de www.ccrl-nece.de/klaas ------------------------------------------------------------------------------ In sharks we trust. ------------------------------------------------------------------------------ -------------- next part -------------- テキスト形式以外の添付ファイルを保管しました... ファイル名: 無し 型: text/x-vcard サイズ: 238 バイト 説明: vCard URL: From hori @ swimmy-soft.com Wed May 29 18:14:13 2002 From: hori @ swimmy-soft.com (Atsushi HORI) Date: Wed, 29 May 2002 18:14:13 +0900 Subject: [SCore-users-jp] [SCore-users] Re: [score-info] scheduleing database In-Reply-To: <200205290858.KAA16204@einstein.ccrl-nece.technopark.gmd.de> References: <200205290858.KAA16204@einstein.ccrl-nece.technopark.gmd.de> Message-ID: <3105540853.hori0000@mail.bestsystems.co.jp> Hi. >we like to set a scheduler on-top of score. For that I like to know if >there is any database where the scored stores the scheduled jobs or the >free/assigned nodes. I am sorry there is no such database file to store scheduling information. However, if you have ever looked at the sctop command, the scheduling information is available. I recommend you to read the sctop command source file. # Please do not use the score-info mailing list. It is now obsolete. _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From yamanaka @ exassia.tmit.ac.jp Wed May 29 19:01:17 2002 From: yamanaka @ exassia.tmit.ac.jp (Yamanaka Kenshi) Date: Wed, 29 May 2002 19:01:17 +0900 Subject: [SCore-users-jp] NIC In-Reply-To: <3CEC9EB0.2080408@bd6.so-net.ne.jp> References: <20020522202223.7ce49b7d.yamanaka@exassia.tmit.ac.jp> <20020523140305T.s-sumi@bd6.so-net.ne.jp> <20020523150900.6a48f993.yamanaka@exassia.tmit.ac.jp> <3CEC8DE3.4000307@bd6.so-net.ne.jp> <20020523160546.4febe64a.yamanaka@exassia.tmit.ac.jp> <3CEC9EB0.2080408@bd6.so-net.ne.jp> Message-ID: <20020529190117.7eff0b15.yamanaka@exassia.tmit.ac.jp> 山中です。住元様、返事が遅れて申し訳ありません。 おっしゃる通りにRX_RING_SIZEを128にしてモジュールを再コンパイルしました。 しかし、相変わらず、 eth0: Inconsistent Rx descriptor chain. というメッセージが出ています。 一応プログラム自体は走っているのですが、これがドライバーのエラーと言うことですので、 ネットワークでのデータ転送に信頼性がなくなっていると言うことになるのでしょうか? また空きメモリが極端に少なくなると言うのは、 cat /proc/meminfo 又は、 free の結果でmem freeを見れば良いのでしょうか? だとすると、IntelのNICを挿したノードと極端に違いはないようです。 よろしくお願い致します。 *----------------------------* 都立科学技術大学 大学院 白鳥研究室 山中賢史 yamanaka @ exassia.tmit.ac.jp http://exassia.tmit.ac.jp *----------------------------*