From ishikawa @ is.s.u-tokyo.ac.jp Mon Apr 1 11:46:34 2002 From: ishikawa @ is.s.u-tokyo.ac.jp (Yutaka Ishikawa) Date: Mon, 01 Apr 2002 11:46:34 +0900 (JST) Subject: [SCore-users-jp] Re: [SCore-users-jp] =?iso-2022-jp?B?U0NvcmU1LjAuMBskQiUkJXMlOSVIITwlazw6R1QbKEI=?= In-Reply-To: <200203290959.SAA19638@wrcmail10.wrc.melco.co.jp> References: <200203290959.SAA19638@wrcmail10.wrc.melco.co.jp> Message-ID: <20020401.114634.596524933.ishikawa@is.s.u-tokyo.ac.jp> 山本様、 すみません。今、やっと思い出しました。以下のメッセージが出る場合って、 Anaconda動かないんです。それで、以前、こうなった時に備えて、anacodnaがエ ラーで落ちた時はanacondaを再起動させてました。それで、動いたんですけど、 最近は、このような症状も出ないようだったので削ってしまっています。 これがどうして生じるのかRed Hat 7.2のanacondaの作りを全部追っていなくて、 不明のままです。 > このときの計算ノードのメッセージは > ... > Anaconda > Gdk-ERROR ** : BadAccess > serial 47 error_code 10 request_code 147 minor_code 3 > Gdk-ERROR ** : BadAccess > serial 48 error_code 10 request_code 147 minor_code 3 > です。 それで、 Alt + F2 するとshellが出てくると思うので、そこで、 # export DISPLAY=:0.0 # export PATH=/usr/bin:/bin:/sbin:/usr/sbin:/usr/X11R6/bin # export LD_LIBRARY_PATH=/lib:/usr/lib:/usr/X11R6/lib # /usr/bin/anaconda -m nfs:/mnt/source2 --kickstart /compconf/ --lang en_US としてみて下さい。は、EITのログに出ているマックアドレスを使っ て下さい。 もし、/usr/bin/anacondaが見つからないようでしたら、すみませんが、 # df して、その内容を送って下さい。 石川 From Yamamoto.Takaya @ wrc.melco.co.jp Mon Apr 1 19:58:55 2002 From: Yamamoto.Takaya @ wrc.melco.co.jp (Yamamoto Takaya) Date: Mon, 1 Apr 2002 19:58:55 +0900 (JST) Subject: [SCore-users-jp] Re: [SCore-users-jp]SCore5.0.0 =?ISO-2022-JP?B?GyRCJSQlcyU5JUghPCVrPDpHVBsoSg==?= Message-ID: <200204011058.TAA21958@wrcmail10.wrc.melco.co.jp> 石川様 三菱電機 山本です。 下記の方法により、SCore5.0.0のインストールが完了しました。 ありがとうございました。 以上 At 11:46 午前 2002/04/01 +0900, you wrote: > 山本様、 > > すみません。今、やっと思い出しました。以下のメッセージが出る場合って、 > Anaconda動かないんです。それで、以前、こうなった時に備えて、anacodnaがエ > ラーで落ちた時はanacondaを再起動させてました。それで、動いたんですけど、 > 最近は、このような症状も出ないようだったので削ってしまっています。 > これがどうして生じるのかRed Hat 7.2のanacondaの作りを全部追っていなくて、 > 不明のままです。 > > > このときの計算ノードのメッセージは > > ... > > Anaconda > > Gdk-ERROR ** : BadAccess > > serial 47 error_code 10 request_code 147 minor_code 3 > > Gdk-ERROR ** : BadAccess > > serial 48 error_code 10 request_code 147 minor_code 3 > > です。 > > それで、 Alt + F2 するとshellが出てくると思うので、そこで、 > # export DISPLAY=:0.0 > # export PATH=/usr/bin:/bin:/sbin:/usr/sbin:/usr/X11R6/bin > # export LD_LIBRARY_PATH=/lib:/usr/lib:/usr/X11R6/lib > # /usr/bin/anaconda -m nfs:/mnt/source2 --kickstart /compconf/ --lang en_US > > としてみて下さい。は、EITのログに出ているマックアドレスを使っ > て下さい。 > > もし、/usr/bin/anacondaが見つからないようでしたら、すみませんが、 > # df > > して、その内容を送って下さい。 > > 石川 > From ishikawa @ is.s.u-tokyo.ac.jp Mon Apr 1 21:08:40 2002 From: ishikawa @ is.s.u-tokyo.ac.jp (Yutaka Ishikawa) Date: Mon, 01 Apr 2002 21:08:40 +0900 (JST) Subject: [SCore-users-jp] Re: [SCore-users-jp]SCore5.0.0 =?iso-2022-jp?B?GyRCJSQlcyU5JUghPCVrPDpHVBsoQg==?= In-Reply-To: <200204011058.TAA21958@wrcmail10.wrc.melco.co.jp> References: <200204011058.TAA21958@wrcmail10.wrc.melco.co.jp> Message-ID: <20020401.210840.730552869.ishikawa@is.s.u-tokyo.ac.jp> 山本様、 From: Yamamoto Takaya Subject: Re: [SCore-users-jp]SCore5.0.0 インストール失敗 > 下記の方法により、SCore5.0.0のインストールが完了しました。 修正版を作ったら、それを使ってすみませんが再度試してみて頂けますか? この手の問題、他でも起こるかも知れないので、対処しておきたいと思っています。 石川 > At 11:46 午前 2002/04/01 +0900, you wrote: > > 山本様、 > > > > すみません。今、やっと思い出しました。以下のメッセージが出る場合って、 > > Anaconda動かないんです。それで、以前、こうなった時に備えて、anacodnaがエ > > ラーで落ちた時はanacondaを再起動させてました。それで、動いたんですけど、 > > 最近は、このような症状も出ないようだったので削ってしまっています。 > > これがどうして生じるのかRed Hat 7.2のanacondaの作りを全部追っていなくて、 > > 不明のままです。 > > > > > このときの計算ノードのメッセージは > > > ... > > > Anaconda > > > Gdk-ERROR ** : BadAccess > > > serial 47 error_code 10 request_code 147 minor_code 3 > > > Gdk-ERROR ** : BadAccess > > > serial 48 error_code 10 request_code 147 minor_code 3 > > > です。 > > > > それで、 Alt + F2 するとshellが出てくると思うので、そこで、 > > # export DISPLAY=:0.0 > > # export PATH=/usr/bin:/bin:/sbin:/usr/sbin:/usr/X11R6/bin > > # export LD_LIBRARY_PATH=/lib:/usr/lib:/usr/X11R6/lib > > # /usr/bin/anaconda -m nfs:/mnt/source2 --kickstart /compconf/ > --lang en_US > > > > としてみて下さい。は、EITのログに出ているマックアドレスを使っ > > て下さい。 > > > > もし、/usr/bin/anacondaが見つからないようでしたら、すみませんが、 > > # df > > > > して、その内容を送って下さい。 > > > > 石川 > > > From shmz @ crl.hitachi.co.jp Mon Apr 1 23:57:09 2002 From: shmz @ crl.hitachi.co.jp (Masaaki Shimizu) Date: Mon, 01 Apr 2002 23:57:09 +0900 Subject: [SCore-users-jp] Re: [SCore-users-jp]SCore5.0.0 =?ISO-2022-JP?B?GyRCJSQlcyU5JUghPCVrPDpHVBsoSg==?= In-Reply-To: Your message of "Mon, 01 Apr 2002 21:08:40 +0900 (JST)" <20020401.210840.730552869.ishikawa@is.s.u-tokyo.ac.jp> References: <20020401.210840.730552869.ishikawa@is.s.u-tokyo.ac.jp> Message-ID: <200204011512.AAA01325@aquarius.crl.hitachi.co.jp> 石川様 日立の清水です。お世話になっております。 実は本日、当方でDELLのデスクトップPCを使ってSCore環境を構築していたところ まったく同じ現象がでました。石川さんの書かれた方法によりなんとか進めたのですが 8台だったので結構難儀でした。よろしければ修正版をためさせていただけないでしょうか? //shimizu Yutaka> 山本様、 Yutaka> Yutaka> From: Yamamoto Takaya Yutaka> Subject: Re: [SCore-users-jp]SCore5.0.0 インストール失敗 Yutaka> > 下記の方法により、SCore5.0.0のインストールが完了しました。 Yutaka> Yutaka> 修正版を作ったら、それを使ってすみませんが再度試してみて頂けますか? Yutaka> この手の問題、他でも起こるかも知れないので、対処しておきたいと思っています。 Yutaka> Yutaka> 石川 Yutaka> Yutaka> > At 11:46 午前 2002/04/01 +0900, you wrote: Yutaka> > > 山本様、 Yutaka> > > Yutaka> > > すみません。今、やっと思い出しました。以下のメッセージが出る場合って、 Yutaka> > > Anaconda動かないんです。それで、以前、こうなった時に備えて、anacodnaがエ Yutaka> > > ラーで落ちた時はanacondaを再起動させてました。それで、動いたんですけど、 Yutaka> > > 最近は、このような症状も出ないようだったので削ってしまっています。 Yutaka> > > これがどうして生じるのかRed Hat 7.2のanacondaの作りを全部追っていなくて、 Yutaka> > > 不明のままです。 Yutaka> > > Yutaka> > > > このときの計算ノードのメッセージは Yutaka> > > > ... Yutaka> > > > Anaconda Yutaka> > > > Gdk-ERROR ** : BadAccess Yutaka> > > > serial 47 error_code 10 request_code 147 minor_code 3 Yutaka> > > > Gdk-ERROR ** : BadAccess Yutaka> > > > serial 48 error_code 10 request_code 147 minor_code 3 Yutaka> > > > です。 Yutaka> > > Yutaka> > > それで、 Alt + F2 するとshellが出てくると思うので、そこで、 Yutaka> > > # export DISPLAY=:0.0 Yutaka> > > # export PATH=/usr/bin:/bin:/sbin:/usr/sbin:/usr/X11R6/bin Yutaka> > > # export LD_LIBRARY_PATH=/lib:/usr/lib:/usr/X11R6/lib Yutaka> > > # /usr/bin/anaconda -m nfs:/mnt/source2 --kickstart /compconf/ Yutaka> > --lang en_US Yutaka> > > Yutaka> > > としてみて下さい。は、EITのログに出ているマックアドレスを使っ Yutaka> > > て下さい。 Yutaka> > > Yutaka> > > もし、/usr/bin/anacondaが見つからないようでしたら、すみませんが、 Yutaka> > > # df Yutaka> > > Yutaka> > > して、その内容を送って下さい。 Yutaka> > > Yutaka> > > 石川 Yutaka> > > Yutaka> > Yutaka> _______________________________________________ Yutaka> SCore-users-jp mailing list Yutaka> SCore-users-jp @ pccluster.org Yutaka> http://www.pccluster.org/mailman/listinfo/score-users-jp Yutaka> From nrcb @ streamline-computing.com Wed Apr 3 06:44:04 2002 From: nrcb @ streamline-computing.com (Nick Birkett) Date: Tue, 2 Apr 2002 22:44:04 +0100 Subject: [SCore-users-jp] [SCore-users] building mpich Message-ID: <02040222440402.06427@pecan.comlab.ox.ac.uk> Dear Score users. I am trying out Score 5. This seems to work fine and I am re-building mpich to use the pgi compilers. In previous versions of SCore I could compile mpich separately and didn't get errors (./Configure; Make; make install) Here is my /opt/score/etc/compilers/site file: [root @ cserver score-src]# cat /opt/score/etc/compilers/site pgi pgcc - pgf77 pgf90 I have untarred the score sources: score, mpi, and build. These are located under /opt/score/score-src I after ./configure make I get the following error right at the end (after score and all the mpich's have compiled) - listing of script file : installed MPICH in /opt/score/mpi/mpich-1.2.0/i386-redhat7-linux2_4_pgi^M /opt/score/mpi/mpich-1.2.0/i386-redhat7-linux2_4_pgi/sbin/mpiuninstall may be used to remove the installation.^M make[3]: Leaving directory `/usr/src/score-src/runtime/mpi/mpich-1.2.0/build.i386-redhat7-linux2_4_pgi'^M ./doc_install //opt/score/doc/mpi^M mkdir: cannot create directory `//opt/score/doc/mpi/man': File exists^M mkdir: cannot create directory `//opt/score/doc/mpi/slog': File exists^M mkdir: cannot create directory `//opt/score/doc/mpi/jumpshot': File exists^M + /opt/score/libexec/install -c -m 0755 mpi_make /opt/score/bin^M + set +x^M set +x; \^M if [ -z "" ]; then \^M exit 0; \^M fi; \^M if [ -z "" ]; then \^M echo '$(INSTALL_BINDIR3) is not set, installation skipped'; \^M exit 0; \^M fi; \^M [ -d ] || \^M ( set -x;/opt/score/libexec/mkdirhier ); \^M set -x; \^M /opt/score/libexec/install -c -m 0755 ^M make[2]: Leaving directory `/usr/src/score-src/runtime/mpi/mpich-1.2.0'^M make[1]: Leaving directory `/usr/src/score-src/runtime/mpi'^M make: *** [all] Error 1^M ^[]0;root @ cserver:/opt/score/score-src^G[root @ cserver score-src]# exit^M exit^M Is this Error a problem or can I assume everything essential is installed ? Thanks, Nick _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From suzuki @ cad.ts.fujitsu.co.jp Wed Apr 3 13:44:34 2002 From: suzuki @ cad.ts.fujitsu.co.jp (=?iso-2022-jp?B?GyRCTmtMWiEhTjQ0bhsoQg==?=) Date: Wed, 3 Apr 2002 13:44:34 +0900 Subject: [SCore-users-jp] append Message-ID: From kameyama @ pccluster.org Wed Apr 3 20:26:18 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Wed, 03 Apr 2002 20:26:18 +0900 Subject: [SCore-users-jp] Re: [SCore-users] building mpich In-Reply-To: Your message of "Tue, 02 Apr 2002 22:44:04 JST." <02040222440402.06427@pecan.comlab.ox.ac.uk> Message-ID: <200204031126.g33BQIk19234@yl-dhcp18.is.s.u-tokyo.ac.jp> In article <02040222440402.06427 @ pecan.comlab.ox.ac.uk> Nick Birkett wrotes: > set -x; \^M > /opt/score/libexec/install -c -m 0755 ^M > make[2]: Leaving directory `/usr/src/score-src/runtime/mpi/mpich-1.2.0'^M > make[1]: Leaving directory `/usr/src/score-src/runtime/mpi'^M > make: *** [all] Error 1^M > ^[]0;root @ cserver:/opt/score/score-src^G[root @ cserver score-src]# exit^M > exit^M Sorry, this is a bug for SCore build system. You may ignore this error (make and istall for all packages is finished) Or please apply following patch. from Kameyama Toyohisa ---------------------------------------cut here--------------------------------- Index: score-src/adm/build/all_pkgmake =================================================================== RCS file: /develop/cvsroot/score-src/adm/build/all_pkgmake,v retrieving revision 1.10 retrieving revision 1.10.2.1 diff -u -r1.10 -r1.10.2.1 --- score-src/adm/build/all_pkgmake 26 Feb 2002 10:14:37 -0000 1.10 +++ score-src/adm/build/all_pkgmake 3 Apr 2002 11:14:12 -0000 1.10.2.1 @@ -39,7 +39,7 @@ pkgutil="$builddir/sc_pkgutil -srcdir=$srcdir" pkgmk=$builddir/pkgmake -trap '[ x"$pid" = x ] || kill $pid;rm -rf $pkg_stat_dir;exit 1' 0 1 2 15 +trap '[ x"$pid" = x ] || kill $pid;rm -rf $pkg_stat_dir;exit 1' 1 2 15 allpackages=`$pkgutil list` if [ ! -d $logdir ]; then mkdir $logdir ---------------------------------------cut here--------------------------------- _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From OWeihe @ deltacomputer.de Fri Apr 5 00:16:47 2002 From: OWeihe @ deltacomputer.de (Oliver Weihe) Date: Thu, 4 Apr 2002 17:16:47 +0200 Subject: [SCore-users-jp] [SCore-users] building mpich 2 Message-ID: Dear SCore users, I installed SCore 5.0.0 on an intel-system running with Redhat 7.2. Everything seems to work fine. Then I tried to recompile mpich because I want to use the pgi compilers (15-day trial version). First I untarred the sources "score", "mpi" and "build" to /opt/score5.0.0/score-src. Then I patched these files with the Patch which Kameyama Toyohisa posted here ( http://www.pccluster.org/pipermail/score-users/2002-April/000040.html ). After that I set up my /opt/score5.0.0/etc/compilers/site file. It looks like this: ----------------------------------- gnu /usr/bin/gcc /usr/bin/g++ /usr/bin/g77 - pgi /opt/pgi/linux86/bin/pgcc /opt/pgi/linux86/bin/pgCC /opt/pgi/linux86/ bin/pgf77 /opt/pgi/linux86/bin/pf90 ----------------------------------- After ./configure and make ( in /opt/score5.0.0/score-src ) I looked at the output-files located at /opt/score5.0.0/score-src/out.master/ at the end of mpi.build I saw this: ---------------------------------- if [ -n "-I" ] ; then \ /opt/score/bin/scoref77 -I. -compiler=pgi -O -c /opt/score5.0.0/score-src/runtime/mpi/mpich-1.2.0/src/src/env/initfcmn.f ; \ else \ if [ ! -s initfcmn.f ] ; then cp /opt/score5.0.0/score-src/runtime/mpi/mpich-1.2.0/src/src/env/initfcmn.f . ; fi ; \ /opt/score/bin/scoref77 -compiler=pgi -O -c initfcmn.f ; \ fi NOTE: your evaluation license will expire in 8 days, 5.56 hours. Waiting for 5 seconds... For a permanent license, please read the order acknowledgement that you received. Connect to https://www.pgroup.com/License with the username and password in the order acknowledgement. Name: ***** User: ***** Email: ***** Hostid: PGI=***** PGFTN-S-0034-Syntax error at or near ) (./../../include/mpif.h: 184) PGFTN-S-0034-Syntax error at or near ) (./../../include/mpif.h: 185) 0 inform, 0 warnings, 2 severes, 0 fatal for mpir_init_fcm make[5]: *** [initfcmn.o] Fehler 2 Exit status from make was 2 make[4]: *** [mpilib] Fehler 1 make[3]: *** [mpi] Fehler 2 make[3]: Verlassen des Verzeichnisses Verzeichnis ?/opt/score5.0.0/score-src/runtime/mpi/mpich-1.2.0/build.i386-redhat7-lin ux2_4_pgi? make[2]: Verlassen des Verzeichnisses Verzeichnis ?/opt/score5.0.0/score-src/runtime/mpi/mpich-1.2.0? make[1]: Verlassen des Verzeichnisses Verzeichnis ?/opt/score5.0.0/score-src/runtime/mpi? ---------------------------------- /opt/score5.0.0/score-src/runtime/mpi/mpich-1.2.0/build.i386-redhat7-linu x2_4_pgi/include/mpif.h looks like this: ---------------------------------- 184: PARAMETER (MPI_ADDRESS_KIND=) 185: PARAMETER (MPI_OFFSET_KIND=) ---------------------------------- but /opt/score5.0.0/score-src/runtime/mpi/mpich-1.2.0/build.i386-redhat7-linu x2_4/include/mpif.h and /opt/score5.0.0/score-src/runtime/mpi/mpich-1.2.0/build.i386-redhat7-linu x2_4_gnu1ul/include/mpif.h looks like this: ---------------------------------- 184: PARAMETER (MPI_ADDRESS_KIND=4) 185: PARAMETER (MPI_OFFSET_KIND=4) ---------------------------------- after I edit this two lines in /opt/score5.0.0/score-src/runtime/mpi/mpich-1.2.0/src/include/mpif.h.in from 184: PARAMETER (MPI_ADDRESS_KIND=@ADDRESS_KIND@) 185: PARAMETER (MPI_OFFSET_KIND=@OFFSET_KIND@) to 184: PARAMETER (MPI_ADDRESS_KIND=4) 185: PARAMETER (MPI_OFFSET_KIND=4) the I could compile and use mpich without any problems. Is this a problem in SCore on only on my system ? Oliver Weihe _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Fri Apr 5 09:42:51 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Fri, 05 Apr 2002 09:42:51 +0900 Subject: [SCore-users-jp] Re: [SCore-users] building mpich 2 In-Reply-To: Your message of "Thu, 04 Apr 2002 17:16:47 JST." Message-ID: <200204050042.g350gpk29203@yl-dhcp18.is.s.u-tokyo.ac.jp> In article Oliver Weihe wrotes: > After that I set up my /opt/score5.0.0/etc/compilers/site file. It looks > like this: > ----------------------------------- > gnu /usr/bin/gcc /usr/bin/g++ /usr/bin/g77 > - > pgi /opt/pgi/linux86/bin/pgcc /opt/pgi/linux86/bin/pgCC /opt/pg > i/linux86/bin/pgf77 /opt/pgi/linux86/bin/pf90 > ----------------------------------- PGI Fortran90 compiler is /opt/pgi/linux86/bin/pgf90. Please check PGI Fortran 90 compiler path. from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From OWeihe @ deltacomputer.de Fri Apr 5 18:05:34 2002 From: OWeihe @ deltacomputer.de (Oliver Weihe) Date: Fri, 5 Apr 2002 11:05:34 +0200 Subject: [SCore-users-jp] Re: [SCore-users] building mpich 2 Message-ID: thanks... after I´ve corrected my typing error in /opt/score5.0.0/etc/compilers/site the compilation works as it should do. Oliver Weihe _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From komatsu @ sfk-nga.co.jp Mon Apr 8 12:21:44 2002 From: komatsu @ sfk-nga.co.jp (=?iso-2022-jp?B?GyRCPi4+PhsoQg==?=) Date: Mon, 8 Apr 2002 12:21:44 +0900 Subject: [SCore-users-jp] =?iso-2022-jp?B?GyRCI2EjbCNsI28jYxsoQl8bJEIjcCM0GyhCXxskQiNtI3MjZxsoQiA=?= =?iso-2022-jp?B?GyRCI2UjciNyI28jchsoQg==?= Message-ID: <000001c1deac$82390280$1901a8c0@LEO_ME.sfk-nga.co.jp> システムファイブ(株)の小松と申します。 HPL (High-Performance Linpack benchmark)を実行して 演算性能を測定しております。 ◆ テスト環境: ・ Red Hat Linux6.2J ・ MPICH−1.2.3 ・ GNUコンパイラ ◆ configureスクリプトのオプション --with-arch=Linux --with-device=ch_p4 --with-comm=shared -fc=g77 -cc=gcc -opt=-O -prefix=/usr/local/bin 質問1:Ns=2000と5000は正常に動作しましたが Ns=8000にすると次のエラがでて終了しました。 p1_1356: (428.365815) xx _shmalloc: returning NULL; requested 2400528 bytes p1_1356: (428.366039) p4_shmalloc returning NULL; request = 2400528 bytes You can increase the amount of memory by setting the environment variables P4_GLOBMEMSIZE (in bytes) p1_1356: p4_error: alloc_p4_msg failed: 0 指摘の環境変数:P4_GLOBMEMSIZEの変更方法がわかりませんので 教えて下さい。 質問2:同じベンチマークテストをSCore4.0でも行いましたが上記のような エラーは でませんでした。 SCoreではMPICHに何かPATCHをあててあるのでしょうか。 以上、宜しくお願い致します。 From nrcb @ streamline-computing.com Mon Apr 8 20:17:57 2002 From: nrcb @ streamline-computing.com (Nick Birkett) Date: Mon, 8 Apr 2002 12:17:57 +0100 Subject: [SCore-users-jp] [SCore-users] Omni/SCASH benchmarks Message-ID: <200204081117.g38BHvV01696@zeralda.streamline.com> Hi I am trying to test Omni/scash under Myrinet 2k. Does Omni /scash support SMP nodes yet ? I have downloaded the OpenMP Nas benchmarks for C : NPB2.3-omp-C.tgz and used this in the config/make.def #--------------------------------------------------------------------------- # This is the C compiler used for OpenMP programs #--------------------------------------------------------------------------- CC = omcc -omniconfig=scash # This links C programs; usually the same as ${CC} CLINK = omcc -omniconfig=scash -lm and make the examples like this: make lu CLASS=A ========================================= = NAS Parallel Benchmarks 2.3 = = OpenMP C Versions = ========================================= cd LU; make CLASS=A make[1]: Entering directory `/home/nrcb/benchmarks/NPB2.3-omp-C/LU' make[2]: Entering directory `/home/nrcb/benchmarks/NPB2.3-omp-C/sys' make[2]: Nothing to be done for `all'. make[2]: Leaving directory `/home/nrcb/benchmarks/NPB2.3-omp-C/sys' ../sys/setparams lu A omcc -omniconfig=scash -c -I../common -O3 lu.c Compiling 'lu.c'... omcc -omniconfig=scash -lm -o ../bin/lu.A lu.o ../common/c_print_results.o ../common/c_timers.o ../common/c_wtime.o make[1]: Leaving directory `/home/nrcb/benchmarks/NPB2.3-omp-C/LU' [nrcb @ cserver NPB2.3-omp-C]$ cd bin/ [nrcb @ cserver bin]$ scrun -nodes=2x1 ./lu.A SCore-D 5.0.0 connected (jid=10). <0:0> SCORE: 2 nodes (2x1) ready. fatal(id=0):_ompsm_scash_fatal: shared arg stack overflow NAS Parallel Benchmarks 2.3 OpenMP C version - LU Benchmark Size: 64x 64x 64 Iterations: 250 The code crashed and exited here. Anybody seen this problem ? Thanks, Nick _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From hori @ swimmy-soft.com Mon Apr 8 19:51:48 2002 From: hori @ swimmy-soft.com (Atsushi HORI) Date: Mon, 8 Apr 2002 19:51:48 +0900 Subject: [SCore-users-jp] =?ISO-2022-JP?B?GyRCI2EjbCNsI28jYxsoSl8bJEIjcCM0GyhKXxskQiNtI3MjZxsoSiA=?==?ISO-2022-JP?B?GyRCI2UjciNyI28jchsoSg==?= In-Reply-To: <000001c1deac$82390280$1901a8c0@LEO_ME.sfk-nga.co.jp> References: <000001c1deac$82390280$1901a8c0@LEO_ME.sfk-nga.co.jp> Message-ID: <3101140308.hori0002@mail.bestsystems.co.jp> 堀@スイミー・ソフトウェアです. > 質問1:Ns=2000と5000は正常に動作しましたが > Ns=8000にすると次のエラがでて終了しました。 > > p1_1356: (428.365815) xx _shmalloc: returning NULL; requested 2400528 >bytes > p1_1356: (428.366039) p4_shmalloc returning NULL; request = 2400528 >bytes > You can increase the amount of memory by setting the environment >variables > P4_GLOBMEMSIZE (in bytes) > p1_1356: p4_error: alloc_p4_msg failed: 0 これは SCore の問題ではないのですが… > 指摘の環境変数:P4_GLOBMEMSIZEの変更方法がわかりませんので > 教えて下さい。 export P4_GLOBMEMSIZE=XXXX としてください. >質問2:同じベンチマークテストをSCore4.0でも行いましたが上記のような >エラーは > でませんでした。 これは MPICH の P4 デバイスでの問題であり,SCore の MPICH は score と いう MPICH のデバイスになっているため起きないのです. From kameyama @ pccluster.org Tue Apr 9 09:10:28 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Tue, 09 Apr 2002 09:10:28 +0900 Subject: [SCore-users-jp] Re: [SCore-users] Omni/SCASH benchmarks In-Reply-To: Your message of "Mon, 08 Apr 2002 12:17:57 JST." <200204081117.g38BHvV01696@zeralda.streamline.com> Message-ID: <200204090010.g390AS007211@yl-dhcp18.is.s.u-tokyo.ac.jp> In article <200204081117.g38BHvV01696 @ zeralda.streamline.com> Nick Birkett wrotes: > Does Omni /scash support SMP nodes yet ? Yes, Omni/Scash support SMP node. > fatal(id=0):_ompsm_scash_fatal: shared arg stack overflow In /opt/omni/doc/omni-scash-status.html, there is following discription:
OMNI_SCASH_ARGS_SIZE
Specifies the argument memory size of each thread. The size is in bytes as default. You can specifies in the unit of kilo using "k" and the unit of mega using "m". For example, "1k" means 1024 bytes. If program output "shared arg stack overflow" message, should be set larger size to OMNI_SCASH_ARGS_SIZE. OMNI_SCASH_ARGS_SIZE is 4K byte as default. Please set environment variable OMNI_SCASH_ARGS_SIZE and OMNI_SCASH_ARGS_SIZE. from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From Enomoto.Hiroshi @ wrc.melco.co.jp Wed Apr 10 14:30:51 2002 From: Enomoto.Hiroshi @ wrc.melco.co.jp (Hiroshi Enomoto) Date: Wed, 10 Apr 2002 14:30:51 +0900 Subject: [SCore-users-jp] =?iso-2022-jp?B?TXlyaW5ldCAbJEIlRiU5JUgkTjw6R1QbKEI=?= References: <200203290959.SAA19638@wrcmail10.wrc.melco.co.jp> Message-ID: <00a001c1e050$e0d84580$c0cc8c0a@ENOMOTO> 三菱電機の榎本です。 SCore5.0.0をインストールした後、rpmtest を用いてMyrinetの テストをしたところ、Point-to-Pointテストで、プロセスをうまく 終了することができません。 以下、そのときの結果です。 マシン名はscott00〜scott03の4台構成で、scott00とscott01の間で 通信しています。 1つ目のウィンドウの表示 [root @ scott00 sbin]# ./rpmtest scott01 myrinet2k -reply                                   ←結果表示後、Ctrl−Cを入力 [1] chan=0, crc=0, unknown=0, nres=0 [1] recv: recv=0, ack=0, nack=0, write=0, wack=0, read=0, rreply=0, discard=0 [1] recv: put_addr=53440, get_addr=53440 [1] recv: error=0(0), data=0:0(0) 1:0(0) 2:0(0) 3:0(0) 4:0(0) 5:0(0) 6:0(0) 7:0(0) [1] send: send=0, ack=0, nack=0, write=0, wack=0, read=0, rreply=0, resend=0,0 [1] send: request=0, disable=0, deactivated=0, last_write=(0, 0), last_read=(0, 0) [1] send: putp=160, getp=160, relp=160 [1] send: error=0(0), data=0:0(0) 1:0(0) 2:0(0) 3:0(0) 4:0(0) 5:0(0) 6:0(0) 7:0(0) ※この表示が出てすぐ、scott01が落ちる 2つ目のウィンドウの表示 [root @ scott00 sbin]# ./rpmtest scott00 myrinet2k -dest 1 -ping 8 1.41022e-05 [root @ scott00 sbin]# 2つ目のウィンドウに結果が出た後、1つ目のウィンドウでCtrl−Cを入力して 終了しようとしますが、Ctrl-Cが入力されるとすぐにscott01 が落ちてしまいます。 何故、Ctrl-Cで落ちてしまうのでしょうか? 以上よろしくお願いします。 ============================================= 三菱電機株式会社 先端技術総合研究所   電力システム技術部 配電システムグループ         榎本 博 TEL: 06-6497-7635 FAX : 06-6497-7727 E-mail: Enomoto.Hiroshi @ wrc.melco.co.jp ============================================= From kameyama @ pccluster.org Wed Apr 10 15:16:42 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Wed, 10 Apr 2002 15:16:42 +0900 Subject: [SCore-users-jp] Myrinet =?ISO-2022-JP?B?GyRCJUYlOSVIGyhC?= =?ISO-2022-JP?B?GyRCJE48OkdUGyhC?= In-Reply-To: Your message of "Wed, 10 Apr 2002 14:30:51 JST." <00a001c1e050$e0d84580$c0cc8c0a@ENOMOTO> Message-ID: <200204100616.g3A6GgB07745@yl-dhcp18.is.s.u-tokyo.ac.jp> 亀山です. In article <00a001c1e050$e0d84580$c0cc8c0a @ ENOMOTO> "Hiroshi Enomoto" wrotes: > マシン名はscott00〜scott03の4台構成で、scott00とscott01の間で > 通信しています。 scot00 はサーバと計算ホストの兼用なわけですね. 念のため, myrinet card と switch は何を使用しているでしょうか? > 1つ目のウィンドウの表示 > > [root @ scott00 sbin]# ./rpmtest scott01 myrinet2k -reply >                                   ←結果表 > 示後、Ctrl−Cを入力 (中略) > ※この表示が出てすぐ、scott01が落ちる scot01 が reboot してしまうのでしょうか? それとも何も言わない状態になってしまうのでしょうか? そのとき, scott01 のコンソールにはなにか表示されていないでしょうか? from Kameyama Toyohisa From s-sumi @ flab.fujitsu.co.jp Wed Apr 10 15:42:16 2002 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Wed, 10 Apr 2002 15:42:16 +0900 Subject: [SCore-users-jp] Myrinet =?iso-2022-jp?B?GyRCJUYlOSVIJE48OkdUGyhC?= In-Reply-To: <200204100616.g3A6GgB07745@yl-dhcp18.is.s.u-tokyo.ac.jp> References: <00a001c1e050$e0d84580$c0cc8c0a@ENOMOTO> <200204100616.g3A6GgB07745@yl-dhcp18.is.s.u-tokyo.ac.jp> Message-ID: <20020410154216A.s-sumi@flab.fujitsu.co.jp> 住元です。 scott01だけでなく、scott02,03も同じ状況でしょうか? あと、サーバと計算ホ ストのチップセットとメーカ、ディスクはIDEでしょうか? Date: Wed, 10 Apr 2002 15:16:42 +0900 Message-ID: <200204100616.g3A6GgB07745 @ yl-dhcp18.is.s.u-tokyo.ac.jp> kameyama> In article <00a001c1e050$e0d84580$c0cc8c0a @ ENOMOTO> "Hiroshi Enomoto" wrotes: kameyama> > マシン名はscott00〜scott03の4台構成で、scott00とscott01の間で kameyama> > 通信しています。 kameyama> kameyama> scot00 はサーバと計算ホストの兼用なわけですね. kameyama> 念のため, myrinet card と switch は何を使用しているでしょうか? kameyama> kameyama> > 1つ目のウィンドウの表示 kameyama> > kameyama> > [root @ scott00 sbin]# ./rpmtest scott01 myrinet2k -reply kameyama> >                                   ←結果表 kameyama> > 示後、Ctrl−Cを入力 kameyama> (中略) kameyama> > ※この表示が出てすぐ、scott01が落ちる kameyama> kameyama> scot01 が reboot してしまうのでしょうか? kameyama> それとも何も言わない状態になってしまうのでしょうか? kameyama> そのとき, scott01 のコンソールにはなにか表示されていないでしょうか? kameyama> kameyama> from Kameyama Toyohisa kameyama> _______________________________________________ kameyama> SCore-users-jp mailing list kameyama> SCore-users-jp @ pccluster.org kameyama> http://www.pccluster.org/mailman/listinfo/score-users-jp kameyama> ------ Shinji Sumimoto, Fujitsu Labs From Enomoto.Hiroshi @ wrc.melco.co.jp Wed Apr 10 16:12:27 2002 From: Enomoto.Hiroshi @ wrc.melco.co.jp (Hiroshi Enomoto) Date: Wed, 10 Apr 2002 16:12:27 +0900 Subject: [SCore-users-jp] =?iso-2022-jp?B?UmU6IFtTQ29yZS11c2Vycy1qcF0gTXlyaW5ldCAbJEIlRiU5JUgbKEI=?= =?iso-2022-jp?B?GyRCJE48OkdUGyhC?= References: <00a001c1e050$e0d84580$c0cc8c0a@ENOMOTO> <200204100616.g3A6GgB07745@yl-dhcp18.is.s.u-tokyo.ac.jp> <20020410154216A.s-sumi@flab.fujitsu.co.jp> Message-ID: <00d501c1e05f$12546400$c0cc8c0a@ENOMOTO> 住元様、亀山様。 三菱電機 榎本です。 使用したPCのH/Wは全て以下の構成になっています。 H/W構成: マザーボード:P4T-E(ASUS) Intel 850, Socket 748, Rambus Memory CPU:Pentium IV 2.2G ネットワークカード:FNW-9803-T 10M/100M PCIバス LANアダプタ           (プラネックスコミュニケーションズ株式会社) Myrinet:M3F-PCI64C-2, M3F-SW8M scott01はうんともすんとも言わず、そのまま固まってしまいます。 コンソールに何も表示されません。 これはscott00 <-> scott01 の通信ですが、 scott00<->scott02 or scott03 でも同じ現象になります。 以上よろしくお願いします。 ----- Original Message ----- From: "Shinji Sumimoto" To: Cc: ; Sent: Wednesday, April 10, 2002 3:42 PM Subject: Re: [SCore-users-jp] Myrinet テストの失敗 > 住元です。 > > scott01だけでなく、scott02,03も同じ状況でしょうか? あと、サーバと計算ホ > ストのチップセットとメーカ、ディスクはIDEでしょうか? > > Date: Wed, 10 Apr 2002 15:16:42 +0900 > Message-ID: <200204100616.g3A6GgB07745 @ yl-dhcp18.is.s.u-tokyo.ac.jp> > kameyama> In article <00a001c1e050$e0d84580$c0cc8c0a @ ENOMOTO> "Hiroshi Enomoto" wrotes: > kameyama> > マシン名はscott00〜scott03の4台構成で、scott00とscott01の間で > kameyama> > 通信しています。 > kameyama> > kameyama> scot00 はサーバと計算ホストの兼用なわけですね. > kameyama> 念のため, myrinet card と switch は何を使用しているでしょうか? > kameyama> > kameyama> > 1つ目のウィンドウの表示 > kameyama> > > kameyama> > [root @ scott00 sbin]# ./rpmtest scott01 myrinet2k -reply > kameyama> >                                   ←結果表 > kameyama> > 示後、Ctrl−Cを入力 > kameyama> (中略) > kameyama> > ※この表示が出てすぐ、scott01が落ちる > kameyama> > kameyama> scot01 が reboot してしまうのでしょうか? > kameyama> それとも何も言わない状態になってしまうのでしょうか? > kameyama> そのとき, scott01 のコンソールにはなにか表示されていないでしょうか? > kameyama> > kameyama> from Kameyama Toyohisa > kameyama> _______________________________________________ > kameyama> SCore-users-jp mailing list > kameyama> SCore-users-jp @ pccluster.org > kameyama> http://www.pccluster.org/mailman/listinfo/score-users-jp > kameyama> > ------ > Shinji Sumimoto, Fujitsu Labs > _______________________________________________ > SCore-users-jp mailing list > SCore-users-jp @ pccluster.org > http://www.pccluster.org/mailman/listinfo/score-users-jp ============================================= 三菱電機株式会社 先端技術総合研究所   電力システム技術部 配電システムグループ         榎本 博 TEL: 06-6497-7635 FAX : 06-6497-7727 E-mail: Enomoto.Hiroshi @ wrc.melco.co.jp =============================================> From s-sumi @ flab.fujitsu.co.jp Wed Apr 10 16:24:12 2002 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Wed, 10 Apr 2002 16:24:12 +0900 Subject: [SCore-users-jp] Re: [SCore-users-jp] Myrinet =?iso-2022-jp?B?GyRCJUYlOSVIJE48OkdUGyhC?= In-Reply-To: <00d501c1e05f$12546400$c0cc8c0a@ENOMOTO> References: <200204100616.g3A6GgB07745@yl-dhcp18.is.s.u-tokyo.ac.jp> <20020410154216A.s-sumi@flab.fujitsu.co.jp> <00d501c1e05f$12546400$c0cc8c0a@ENOMOTO> Message-ID: <20020410162412V.s-sumi@flab.fujitsu.co.jp> 住元です。 基本的に Pen4 + 850の組合せは問題なく動作しています。 Myrinetおよび Ethernet NICのPCIバスの搭載位置はどうなっていますでしょう か? 搭載位置を変更すると(例えば、一番離して搭載する)何か状況に変化は でますでしょうか? From: "Hiroshi Enomoto" Subject: [SCore-users-jp] Re: [SCore-users-jp] Myrinet テストの失敗 Date: Wed, 10 Apr 2002 16:12:27 +0900 Message-ID: <00d501c1e05f$12546400$c0cc8c0a @ ENOMOTO> Enomoto.Hiroshi> 住元様、亀山様。 Enomoto.Hiroshi> Enomoto.Hiroshi> 三菱電機 榎本です。 Enomoto.Hiroshi> 使用したPCのH/Wは全て以下の構成になっています。 Enomoto.Hiroshi> Enomoto.Hiroshi> H/W構成: Enomoto.Hiroshi> Enomoto.Hiroshi> マザーボード:P4T-E(ASUS) Enomoto.Hiroshi> Intel 850, Socket 748, Rambus Memory Enomoto.Hiroshi> Enomoto.Hiroshi> CPU:Pentium IV 2.2G Enomoto.Hiroshi> Enomoto.Hiroshi> ネットワークカード:FNW-9803-T Enomoto.Hiroshi> 10M/100M PCIバス LANアダプタ Enomoto.Hiroshi>           (プラネックスコミュニケーションズ株式会社) Enomoto.Hiroshi> Enomoto.Hiroshi> Myrinet:M3F-PCI64C-2, M3F-SW8M Enomoto.Hiroshi> Enomoto.Hiroshi> scott01はうんともすんとも言わず、そのまま固まってしまいます。 Enomoto.Hiroshi> コンソールに何も表示されません。 Enomoto.Hiroshi> これはscott00 <-> scott01 の通信ですが、 Enomoto.Hiroshi> scott00<->scott02 or scott03 でも同じ現象になります。 Enomoto.Hiroshi> Enomoto.Hiroshi> 以上よろしくお願いします。 Enomoto.Hiroshi> Enomoto.Hiroshi> ----- Original Message ----- Enomoto.Hiroshi> From: "Shinji Sumimoto" Enomoto.Hiroshi> To: Enomoto.Hiroshi> Cc: ; Enomoto.Hiroshi> Sent: Wednesday, April 10, 2002 3:42 PM Enomoto.Hiroshi> Subject: Re: [SCore-users-jp] Myrinet テストの失敗 Enomoto.Hiroshi> Enomoto.Hiroshi> Enomoto.Hiroshi> > 住元です。 Enomoto.Hiroshi> > Enomoto.Hiroshi> > scott01だけでなく、scott02,03も同じ状況でしょうか? あと、サーバと計算ホ Enomoto.Hiroshi> > ストのチップセットとメーカ、ディスクはIDEでしょうか? Enomoto.Hiroshi> > Enomoto.Hiroshi> > Date: Wed, 10 Apr 2002 15:16:42 +0900 Enomoto.Hiroshi> > Message-ID: <200204100616.g3A6GgB07745 @ yl-dhcp18.is.s.u-tokyo.ac.jp> Enomoto.Hiroshi> > kameyama> In article <00a001c1e050$e0d84580$c0cc8c0a @ ENOMOTO> "Hiroshi Enomoto" wrotes: Enomoto.Hiroshi> > kameyama> > マシン名はscott00〜scott03の4台構成で、scott00とscott01の間で Enomoto.Hiroshi> > kameyama> > 通信しています。 Enomoto.Hiroshi> > kameyama> Enomoto.Hiroshi> > kameyama> scot00 はサーバと計算ホストの兼用なわけですね. Enomoto.Hiroshi> > kameyama> 念のため, myrinet card と switch は何を使用しているでしょうか? Enomoto.Hiroshi> > kameyama> Enomoto.Hiroshi> > kameyama> > 1つ目のウィンドウの表示 Enomoto.Hiroshi> > kameyama> > Enomoto.Hiroshi> > kameyama> > [root @ scott00 sbin]# ./rpmtest scott01 myrinet2k -reply Enomoto.Hiroshi> > kameyama> >                                   ←結果表 Enomoto.Hiroshi> > kameyama> > 示後、Ctrl−Cを入力 Enomoto.Hiroshi> > kameyama> (中略) Enomoto.Hiroshi> > kameyama> > ※この表示が出てすぐ、scott01が落ちる Enomoto.Hiroshi> > kameyama> Enomoto.Hiroshi> > kameyama> scot01 が reboot してしまうのでしょうか? Enomoto.Hiroshi> > kameyama> それとも何も言わない状態になってしまうのでしょうか? Enomoto.Hiroshi> > kameyama> そのとき, scott01 のコンソールにはなにか表示されていないでしょうか? Enomoto.Hiroshi> > kameyama> Enomoto.Hiroshi> > kameyama> from Kameyama Toyohisa Enomoto.Hiroshi> > kameyama> _______________________________________________ Enomoto.Hiroshi> > kameyama> SCore-users-jp mailing list Enomoto.Hiroshi> > kameyama> SCore-users-jp @ pccluster.org Enomoto.Hiroshi> > kameyama> http://www.pccluster.org/mailman/listinfo/score-users-jp Enomoto.Hiroshi> > kameyama> Enomoto.Hiroshi> > ------ Enomoto.Hiroshi> > Shinji Sumimoto, Fujitsu Labs Enomoto.Hiroshi> > _______________________________________________ Enomoto.Hiroshi> > SCore-users-jp mailing list Enomoto.Hiroshi> > SCore-users-jp @ pccluster.org Enomoto.Hiroshi> > http://www.pccluster.org/mailman/listinfo/score-users-jp Enomoto.Hiroshi> Enomoto.Hiroshi> Enomoto.Hiroshi> ============================================= Enomoto.Hiroshi> 三菱電機株式会社 先端技術総合研究所 Enomoto.Hiroshi>   電力システム技術部 配電システムグループ Enomoto.Hiroshi>         榎本 博 Enomoto.Hiroshi> TEL: 06-6497-7635 Enomoto.Hiroshi> FAX : 06-6497-7727 Enomoto.Hiroshi> E-mail: Enomoto.Hiroshi @ wrc.melco.co.jp Enomoto.Hiroshi> =============================================> Enomoto.Hiroshi> Enomoto.Hiroshi> _______________________________________________ Enomoto.Hiroshi> SCore-users-jp mailing list Enomoto.Hiroshi> SCore-users-jp @ pccluster.org Enomoto.Hiroshi> http://www.pccluster.org/mailman/listinfo/score-users-jp Enomoto.Hiroshi> ------ Shinji Sumimoto, Fujitsu Labs From Hiroshi.Harada @ jp.compaq.com Wed Apr 10 20:46:48 2002 From: Hiroshi.Harada @ jp.compaq.com (Harada, Hiroshi (TSG)) Date: Wed, 10 Apr 2002 20:46:48 +0900 Subject: [SCore-users-jp] =?iso-2022-jp?B?UkU6IFtTQ29yZS11c2Vycy1qcF0gUmU6IFtTQ29yZS11c2Vycy0=?= =?iso-2022-jp?B?anBdIE15cmluZXQgGyRCJUYlOSVIJE48OkdUGyhC?= Message-ID: 三菱電機 榎本様: はじめまして、原田といいます。 確認済みだとは思いますが、IRQの設定はどうなってますでしょうか。 以前、MyrinetのIRQが他のデバイスと同じ値に設定されてしまった事が あるのですが、、その時もMyrinetを使うとノード計算機がウンスンになって しまった(多分IOバスがロックされていると思います)事があります。 原田 浩 COMPAQ COMPUTER From kouchi @ fasol.fujitsu.com Wed Apr 10 22:54:48 2002 From: kouchi @ fasol.fujitsu.com (Hiroyuki KOUCHI) Date: Wed, 10 Apr 2002 22:54:48 +0900 Subject: [SCore-users-jp] =?ISO-2022-JP?B?c2NvdXQbJEI8OkdUGyhC?= Message-ID: <200204101354.AA00913@hiroyuki.fasol.fujitsu.com> メーリングリスト一同様 久しぶりに投稿致します。幸地です。 手元にあまったマシンが手に入ったので、計算ノードを 2台から4台に増やすことしました。手に入った計算ノードの CPUスペックは、違うのもでした。かまわず、scoutを実行する とエラーで帰ってきました。この現象は、バグなのでしょうか? なお、以下に示す現象は、4.2.1と5.0.0の両方で発生しました。 また、CPUがおなじもの(pentium MMX 200MHz × 2)であれば発生しませんでした。 serverノード(server) pentium 166MHz 計算ノード (node2),(node3) pentium MMX 200MHz × 2 (node1) AMD 166MHz (node0) celeron 450MHz # SCOUT: Spawning node2SCOUT(node3): CONNECT(server:1063)=111 failed SCOUT: Session done. よろしくお願い致します。 -------------------------------------------------- Hiroyuki KOUCHI Systems Engnieering Dept. II Solutions Systems Business Div. FUJITSU ADVANCED SOLUTIONS LIMITED 1-2-4,Shinkoyahu, Kanagawa-ku, Yokohama, TEL:+81 45-438-2105 FAX:+81 45-438-2318 URL http://www.fasol.fujitsu.com E-mail: kouchi @ fasol.fujitsu.com -------------------------------------------------- From hori @ swimmy-soft.com Thu Apr 11 09:52:35 2002 From: hori @ swimmy-soft.com (Atsushi HORI) Date: Thu, 11 Apr 2002 09:52:35 +0900 Subject: [SCore-users-jp] =?ISO-2022-JP?B?c2NvdXQbJEI8OkdUGyhK?= In-Reply-To: <200204101354.AA00913@hiroyuki.fasol.fujitsu.com> References: <200204101354.AA00913@hiroyuki.fasol.fujitsu.com> Message-ID: <3101363555.hori0002@mail.bestsystems.co.jp> 堀@スイミー・ソフトウェアです. ># SCOUT: Spawning node2SCOUT(node3): CONNECT(server:1063)=111 failed >SCOUT: Session done. 多分,これは追加したホストから server ホストが Linux のネットワーク的 に見えていないのだと思います.追加したマシンの Linux ネットワークの設 定を確認してください. From ishikawa @ is.s.u-tokyo.ac.jp Thu Apr 11 10:20:24 2002 From: ishikawa @ is.s.u-tokyo.ac.jp (Yutaka Ishikawa) Date: Thu, 11 Apr 2002 10:20:24 +0900 (JST) Subject: [SCore-users-jp] =?iso-2022-jp?B?c2NvdXQbJEI8OkdUGyhC?= In-Reply-To: <3101363555.hori0002@mail.bestsystems.co.jp> References: <200204101354.AA00913@hiroyuki.fasol.fujitsu.com> <3101363555.hori0002@mail.bestsystems.co.jp> Message-ID: <20020411.102024.607961138.ishikawa@is.s.u-tokyo.ac.jp> 堀さんの回答に補足です。 以下のエラーですが、多分、 node3からserverと言う名前でホスト名を引いてもIPアドレスが解決されないから だと思われます。 SCore 4のどこかのバージョンからSCore 5.0.0までは、実は、 ホスト名は、FQDNおよびホスト名の2つを登録しないと下記状態に陥る と言うバグがあり、パッチを出しました。 ようするに、/etc/hostsあるいはNIS上に 192.X.X.X server.pccluster.org server と言った感じでエントリを作成して下さい。 この話、一応、ワークショップの時に話したので、既に対応しているとすると、 また、別問題があることになるのだが…… 石川 ----------------------------------------------------------------------------- From: Atsushi HORI Subject: Re: [SCore-users-jp] scout失敗 Date: Thu, 11 Apr 2002 09:52:35 +0900 > 堀@スイミー・ソフトウェアです. > > ># SCOUT: Spawning node2SCOUT(node3): CONNECT(server:1063)=111 failed > >SCOUT: Session done. > > 多分,これは追加したホストから server ホストが Linux のネットワーク的 > に見えていないのだと思います.追加したマシンの Linux ネットワークの設 > 定を確認してください. From s-sumi @ flab.fujitsu.co.jp Thu Apr 11 10:47:44 2002 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Thu, 11 Apr 2002 10:47:44 +0900 Subject: [SCore-users-jp] Re: [SCore-users-jp] Myrinet =?iso-2022-jp?B?GyRCJUYlOSVIJE48OkdUGyhC?= In-Reply-To: <20020410162412V.s-sumi@flab.fujitsu.co.jp> References: <20020410154216A.s-sumi@flab.fujitsu.co.jp> <00d501c1e05f$12546400$c0cc8c0a@ENOMOTO> <20020410162412V.s-sumi@flab.fujitsu.co.jp> Message-ID: <20020411104744E.s-sumi@flab.fujitsu.co.jp> 榎本様 住元です。 お使いのMyrinetがPCI64Cということで、パラメータの確認をしたいので、お手 数ですが、以下のコマンド実行の結果を頂けないでしょうか? [root @ scott00 sbin]# ./rpmtest scott01 myrinet2k -reply -debug 4 From: Shinji Sumimoto Subject: Re: [SCore-users-jp] Re: [SCore-users-jp] Myrinet テストの失敗 Date: Wed, 10 Apr 2002 16:24:12 +0900 Message-ID: <20020410162412V.s-sumi @ flab.fujitsu.co.jp> s-sumi> 基本的に Pen4 + 850の組合せは問題なく動作しています。 s-sumi> s-sumi> Myrinetおよび Ethernet NICのPCIバスの搭載位置はどうなっていますでしょう s-sumi> か? 搭載位置を変更すると(例えば、一番離して搭載する)何か状況に変化は s-sumi> でますでしょうか? s-sumi> s-sumi> From: "Hiroshi Enomoto" s-sumi> Subject: [SCore-users-jp] Re: [SCore-users-jp] Myrinet テストの失敗 s-sumi> Date: Wed, 10 Apr 2002 16:12:27 +0900 s-sumi> Message-ID: <00d501c1e05f$12546400$c0cc8c0a @ ENOMOTO> s-sumi> Enomoto.Hiroshi> 住元様、亀山様。 s-sumi> Enomoto.Hiroshi> s-sumi> Enomoto.Hiroshi> 三菱電機 榎本です。 s-sumi> Enomoto.Hiroshi> 使用したPCのH/Wは全て以下の構成になっています。 s-sumi> Enomoto.Hiroshi> s-sumi> Enomoto.Hiroshi> H/W構成: s-sumi> Enomoto.Hiroshi> s-sumi> Enomoto.Hiroshi> マザーボード:P4T-E(ASUS) s-sumi> Enomoto.Hiroshi> Intel 850, Socket 748, Rambus Memory s-sumi> Enomoto.Hiroshi> s-sumi> Enomoto.Hiroshi> CPU:Pentium IV 2.2G s-sumi> Enomoto.Hiroshi> s-sumi> Enomoto.Hiroshi> ネットワークカード:FNW-9803-T s-sumi> Enomoto.Hiroshi> 10M/100M PCIバス LANアダプタ s-sumi> Enomoto.Hiroshi>           (プラネックスコミュニケーションズ株式会社) s-sumi> Enomoto.Hiroshi> s-sumi> Enomoto.Hiroshi> Myrinet:M3F-PCI64C-2, M3F-SW8M s-sumi> Enomoto.Hiroshi> s-sumi> Enomoto.Hiroshi> scott01はうんともすんとも言わず、そのまま固まってしまいます。 s-sumi> Enomoto.Hiroshi> コンソールに何も表示されません。 s-sumi> Enomoto.Hiroshi> これはscott00 <-> scott01 の通信ですが、 s-sumi> Enomoto.Hiroshi> scott00<->scott02 or scott03 でも同じ現象になります。 s-sumi> Enomoto.Hiroshi> s-sumi> Enomoto.Hiroshi> 以上よろしくお願いします。 s-sumi> Enomoto.Hiroshi> s-sumi> Enomoto.Hiroshi> ----- Original Message ----- s-sumi> Enomoto.Hiroshi> From: "Shinji Sumimoto" s-sumi> Enomoto.Hiroshi> To: s-sumi> Enomoto.Hiroshi> Cc: ; s-sumi> Enomoto.Hiroshi> Sent: Wednesday, April 10, 2002 3:42 PM s-sumi> Enomoto.Hiroshi> Subject: Re: [SCore-users-jp] Myrinet テストの失敗 s-sumi> Enomoto.Hiroshi> s-sumi> Enomoto.Hiroshi> s-sumi> Enomoto.Hiroshi> > 住元です。 s-sumi> Enomoto.Hiroshi> > s-sumi> Enomoto.Hiroshi> > scott01だけでなく、scott02,03も同じ状況でしょうか? あと、サーバと計算ホ s-sumi> Enomoto.Hiroshi> > ストのチップセットとメーカ、ディスクはIDEでしょうか? s-sumi> Enomoto.Hiroshi> > s-sumi> Enomoto.Hiroshi> > Date: Wed, 10 Apr 2002 15:16:42 +0900 s-sumi> Enomoto.Hiroshi> > Message-ID: <200204100616.g3A6GgB07745 @ yl-dhcp18.is.s.u-tokyo.ac.jp> s-sumi> Enomoto.Hiroshi> > kameyama> In article <00a001c1e050$e0d84580$c0cc8c0a @ ENOMOTO> "Hiroshi Enomoto" wrotes: s-sumi> Enomoto.Hiroshi> > kameyama> > マシン名はscott00〜scott03の4台構成で、scott00とscott01の間で s-sumi> Enomoto.Hiroshi> > kameyama> > 通信しています。 s-sumi> Enomoto.Hiroshi> > kameyama> s-sumi> Enomoto.Hiroshi> > kameyama> scot00 はサーバと計算ホストの兼用なわけですね. s-sumi> Enomoto.Hiroshi> > kameyama> 念のため, myrinet card と switch は何を使用しているでしょうか? s-sumi> Enomoto.Hiroshi> > kameyama> s-sumi> Enomoto.Hiroshi> > kameyama> > 1つ目のウィンドウの表示 s-sumi> Enomoto.Hiroshi> > kameyama> > s-sumi> Enomoto.Hiroshi> > kameyama> > [root @ scott00 sbin]# ./rpmtest scott01 myrinet2k -reply s-sumi> Enomoto.Hiroshi> > kameyama> >                                   ←結果表 s-sumi> Enomoto.Hiroshi> > kameyama> > 示後、Ctrl−Cを入力 s-sumi> Enomoto.Hiroshi> > kameyama> (中略) s-sumi> Enomoto.Hiroshi> > kameyama> > ※この表示が出てすぐ、scott01が落ちる s-sumi> Enomoto.Hiroshi> > kameyama> s-sumi> Enomoto.Hiroshi> > kameyama> scot01 が reboot してしまうのでしょうか? s-sumi> Enomoto.Hiroshi> > kameyama> それとも何も言わない状態になってしまうのでしょうか? s-sumi> Enomoto.Hiroshi> > kameyama> そのとき, scott01 のコンソールにはなにか表示されていないでしょうか? s-sumi> Enomoto.Hiroshi> > kameyama> s-sumi> Enomoto.Hiroshi> > kameyama> from Kameyama Toyohisa s-sumi> Enomoto.Hiroshi> > kameyama> _______________________________________________ s-sumi> Enomoto.Hiroshi> > kameyama> SCore-users-jp mailing list s-sumi> Enomoto.Hiroshi> > kameyama> SCore-users-jp @ pccluster.org s-sumi> Enomoto.Hiroshi> > kameyama> http://www.pccluster.org/mailman/listinfo/score-users-jp s-sumi> Enomoto.Hiroshi> > kameyama> s-sumi> Enomoto.Hiroshi> > ------ s-sumi> Enomoto.Hiroshi> > Shinji Sumimoto, Fujitsu Labs s-sumi> Enomoto.Hiroshi> > _______________________________________________ s-sumi> Enomoto.Hiroshi> > SCore-users-jp mailing list s-sumi> Enomoto.Hiroshi> > SCore-users-jp @ pccluster.org s-sumi> Enomoto.Hiroshi> > http://www.pccluster.org/mailman/listinfo/score-users-jp s-sumi> Enomoto.Hiroshi> s-sumi> Enomoto.Hiroshi> s-sumi> Enomoto.Hiroshi> ============================================= s-sumi> Enomoto.Hiroshi> 三菱電機株式会社 先端技術総合研究所 s-sumi> Enomoto.Hiroshi>   電力システム技術部 配電システムグループ s-sumi> Enomoto.Hiroshi>         榎本 博 s-sumi> Enomoto.Hiroshi> TEL: 06-6497-7635 s-sumi> Enomoto.Hiroshi> FAX : 06-6497-7727 s-sumi> Enomoto.Hiroshi> E-mail: Enomoto.Hiroshi @ wrc.melco.co.jp s-sumi> Enomoto.Hiroshi> =============================================> s-sumi> Enomoto.Hiroshi> s-sumi> Enomoto.Hiroshi> _______________________________________________ s-sumi> Enomoto.Hiroshi> SCore-users-jp mailing list s-sumi> Enomoto.Hiroshi> SCore-users-jp @ pccluster.org s-sumi> Enomoto.Hiroshi> http://www.pccluster.org/mailman/listinfo/score-users-jp s-sumi> Enomoto.Hiroshi> s-sumi> ------ s-sumi> Shinji Sumimoto, Fujitsu Labs s-sumi> _______________________________________________ s-sumi> SCore-users-jp mailing list s-sumi> SCore-users-jp @ pccluster.org s-sumi> http://www.pccluster.org/mailman/listinfo/score-users-jp s-sumi> ------ Shinji Sumimoto, Fujitsu Labs From kouchi @ fasol.fujitsu.com Thu Apr 11 12:57:44 2002 From: kouchi @ fasol.fujitsu.com (Hiroyuki KOUCHI) Date: Thu, 11 Apr 2002 12:57:44 +0900 Subject: [SCore-users-jp] =?ISO-2022-JP?B?c2NvdXQbJEI8OkdUGyhC?= In-Reply-To: <20020411.102024.607961138.ishikawa@is.s.u-tokyo.ac.jp> References: <20020411.102024.607961138.ishikawa@is.s.u-tokyo.ac.jp> Message-ID: <200204110357.AA00914@hiroyuki.fasol.fujitsu.com> 石川様 堀様 早速のご回答ありがとうございました。幸地です。 早速試してみたところ、scoutの実行と、デモプログラムの起動に 成功しました。 ということは、確認ですが、SCoreではCPUのアーキテクチャによらずに 動作すると言うことでよろしいですか? >堀さんの回答に補足です。 > >以下のエラーですが、多分、 >node3からserverと言う名前でホスト名を引いてもIPアドレスが解決されないから >だと思われます。 >SCore 4のどこかのバージョンからSCore 5.0.0までは、実は、 > ホスト名は、FQDNおよびホスト名の2つを登録しないと下記状態に陥る >と言うバグがあり、パッチを出しました。 >ようするに、/etc/hostsあるいはNIS上に > 192.X.X.X server.pccluster.org server >と言った感じでエントリを作成して下さい。 > >この話、一応、ワークショップの時に話したので、既に対応しているとすると、 >また、別問題があることになるのだが…… > >石川 >----------------------------------------------------------------------------- >From: Atsushi HORI >Subject: Re: [SCore-users-jp] scout失敗 >Date: Thu, 11 Apr 2002 09:52:35 +0900 > >> 堀@スイミー・ソフトウェアです. >> >> ># SCOUT: Spawning node2SCOUT(node3): CONNECT(server:1063)=111 failed >> >SCOUT: Session done. >> >> 多分,これは追加したホストから server ホストが Linux のネットワーク的 >> に見えていないのだと思います.追加したマシンの Linux ネットワークの設 >> 定を確認してください. > -------------------------------------------------- Hiroyuki KOUCHI Systems Engnieering Dept. II Solutions Systems Business Div. FUJITSU ADVANCED SOLUTIONS LIMITED 1-2-4,Shinkoyahu, Kanagawa-ku, Yokohama, TEL:+81 45-438-2105 FAX:+81 45-438-2318 URL http://www.fasol.fujitsu.com E-mail: kouchi @ fasol.fujitsu.com -------------------------------------------------- From ishikawa @ is.s.u-tokyo.ac.jp Thu Apr 11 13:36:52 2002 From: ishikawa @ is.s.u-tokyo.ac.jp (Yutaka Ishikawa) Date: Thu, 11 Apr 2002 13:36:52 +0900 (JST) Subject: [SCore-users-jp] =?iso-2022-jp?B?c2NvdXQbJEI8OkdUGyhC?= In-Reply-To: <200204110357.AA00914@hiroyuki.fasol.fujitsu.com> References: <20020411.102024.607961138.ishikawa@is.s.u-tokyo.ac.jp> <200204110357.AA00914@hiroyuki.fasol.fujitsu.com> Message-ID: <20020411.133652.276752805.ishikawa@is.s.u-tokyo.ac.jp> KOUCHI様、 「CPUのアーキテクチャによらず」と言う言葉だけで質問されると、 x86系およびalpha系で、かつ、きちんとSCoreを設定していれば、 動きます。 と言う回答になります。 が、KOUCHIさんのもともとの質問は、x86系の中でも異なるプロセッサタイプ だったかと思います。これに関しては、 EITを使う限りは、同一プロセッサ、同一性能のホストがつながっている として/opt/score/etc/scorehosts.dbに登録している と言うのが回答になります。 SCore自体は、性能の違い、プロセッサの違いをみて、複数のクラスタとして 管理するようになっています。 現状のドキュメントにもどこかに書いてあったと思うのだが…… SCore-Dの詳細については、開発した堀さんに聞くのが一番早いかと思います。 なお、SCore本が8月までには出版される予定です。この本の中で、この手の話も 書いてあります。 石川 From: Hiroyuki KOUCHI Subject: Re: [SCore-users-jp] scout失敗 Date: Thu, 11 Apr 2002 12:57:44 +0900 > 石川様 堀様 > > 早速のご回答ありがとうございました。幸地です。 > > 早速試してみたところ、scoutの実行と、デモプログラムの起動に > 成功しました。 > > ということは、確認ですが、SCoreではCPUのアーキテクチャによらずに > 動作すると言うことでよろしいですか? > > > >堀さんの回答に補足です。 > > > >以下のエラーですが、多分、 > >node3からserverと言う名前でホスト名を引いてもIPアドレスが解決されないから > >だと思われます。 > >SCore 4のどこかのバージョンからSCore 5.0.0までは、実は、 > > ホスト名は、FQDNおよびホスト名の2つを登録しないと下記状態に陥る > >と言うバグがあり、パッチを出しました。 > >ようするに、/etc/hostsあるいはNIS上に > > 192.X.X.X server.pccluster.org server > >と言った感じでエントリを作成して下さい。 > > > >この話、一応、ワークショップの時に話したので、既に対応しているとすると、 > >また、別問題があることになるのだが…… > > > >石川 > >----------------------------------------------------------------------------- > >From: Atsushi HORI > >Subject: Re: [SCore-users-jp] scout失敗 > >Date: Thu, 11 Apr 2002 09:52:35 +0900 > > > >> 堀@スイミー・ソフトウェアです. > >> > >> ># SCOUT: Spawning node2SCOUT(node3): CONNECT(server:1063)=111 failed > >> >SCOUT: Session done. > >> > >> 多分,これは追加したホストから server ホストが Linux のネットワーク的 > >> に見えていないのだと思います.追加したマシンの Linux ネットワークの設 > >> 定を確認してください. > > > > > -------------------------------------------------- > Hiroyuki KOUCHI > > Systems Engnieering Dept. II > Solutions Systems Business Div. > > FUJITSU ADVANCED SOLUTIONS LIMITED > > 1-2-4,Shinkoyahu, Kanagawa-ku, Yokohama, > TEL:+81 45-438-2105 FAX:+81 45-438-2318 > URL http://www.fasol.fujitsu.com > > E-mail: kouchi @ fasol.fujitsu.com > -------------------------------------------------- > > > > _______________________________________________ > SCore-users-jp mailing list > SCore-users-jp @ pccluster.org > http://www.pccluster.org/mailman/listinfo/score-users-jp From Enomoto.Hiroshi @ wrc.melco.co.jp Thu Apr 11 14:14:48 2002 From: Enomoto.Hiroshi @ wrc.melco.co.jp (Hiroshi Enomoto) Date: Thu, 11 Apr 2002 14:14:48 +0900 Subject: [SCore-users-jp] =?iso-2022-jp?B?UmU6IFtTQ29yZS11c2Vycy1qcF0gUmU6IFtTQ29yZS11c2Vycy0=?= =?iso-2022-jp?B?anBdIE15cmluZXQgGyRCJUYlOSVIJE48OkdUGyhC?= References: <20020410154216A.s-sumi@flab.fujitsu.co.jp> <00d501c1e05f$12546400$c0cc8c0a@ENOMOTO> <20020410162412V.s-sumi@flab.fujitsu.co.jp> <20020411104744E.s-sumi@flab.fujitsu.co.jp> Message-ID: <018a01c1e117$cd8000a0$c0cc8c0a@ENOMOTO> 住元様 三菱電機 榎本です。 下記コマンドの実行結果を送ります。何かここから得られる情報があれば、 お願いします。 ---------------------------------------------------------------- page_size=4096, page_mask=fff, page_shift=12 LANai(0): fd=512, size=2097152, sts=0xf LANai(0): clockval=032072a0, cpu_version=0902 LANai(0): board_id=00:60:dd:7f:3e:97 LANai(0): sram_size=00200000 LANai(0): fpga_version="Thu Dec 9 16:13:40 1999" LANai(0): more_version="" LANai(0): delay_line_value=0000, board_type=0003, bus_type=0002 LANai(0): product_code=0073, serial_number=00019005 LANai(0): board_label="M3F-PCI64C-2-102405" LANai(0): max_lanai_speed=202 LANai(0): future_use=ffff ffff ffff ffff ffff ffff ffff LANai(0): size of myriUnitCommon=2000[200+1024+(6968)] [1] routing: [1] 0: 00000000000081, 7 [1] 1: 00000000000080, 7 [1] 2: 000000000000bf, 7 [1] 3: 000000000000be, 7 LANai(0): set to clockmpx=4 (calculated=6) [1] 23 contexts [1] Ctx(0x83d1cc8): sys=0x40192000, usr=0x401a6000, shared=0x401ac000 [1] Ctx(0x83d1cc8): comm=0x40157000, reg=0x40159000 [0] size of SharedContext=20000[2176+6016+57344+65536] [0] Ctx(0x83d1cc8): phys_addr=ff60000, send=0x401ae000, recv=0x401bc000 [0] size of LANaiContext=14000[308+50816+(6220)+28+16384+(8164)] [0] CPU Clock=2209.61MHz, LANai Clock=133.779MHz ------------------------------------------------------------------ ところで、 Myrinet 及びEthernetNICの位置を変えたところ、計算ホストがブート できず途中で止まってしまう現象が見つかりました。(サーバーは大丈夫です) ・全PCで、NICの位置は合わせなければいけない? ・インストール時の位置から変えてはいけない? などの疑問が浮かびます。これがMyrinetのテストと関係しているのかは わからないですが、とりあえず色々位置を変えて、ブートできなくなるパターン を調べようと思います。 以上 ----- Original Message ----- From: "Shinji Sumimoto" To: Cc: ; ; Sent: Thursday, April 11, 2002 10:47 AM Subject: Re: [SCore-users-jp] Re: [SCore-users-jp] Myrinet テストの失敗 > 榎本様 > > 住元です。 > > お使いのMyrinetがPCI64Cということで、パラメータの確認をしたいので、お手 > 数ですが、以下のコマンド実行の結果を頂けないでしょうか? > > [root @ scott00 sbin]# ./rpmtest scott01 myrinet2k -reply -debug 4 > > From: Shinji Sumimoto > Subject: Re: [SCore-users-jp] Re: [SCore-users-jp] Myrinet テストの失敗 > Date: Wed, 10 Apr 2002 16:24:12 +0900 > Message-ID: <20020410162412V.s-sumi @ flab.fujitsu.co.jp> > s-sumi> 基本的に Pen4 + 850の組合せは問題なく動作しています。 > s-sumi> > s-sumi> Myrinetおよび Ethernet NICのPCIバスの搭載位置はどうなっていますでしょう > s-sumi> か? 搭載位置を変更すると(例えば、一番離して搭載する)何か状況に変化は > s-sumi> でますでしょうか? > s-sumi> ============================================= 三菱電機株式会社 先端技術総合研究所   電力システム技術部 配電システムグループ         榎本 博 TEL: 06-6497-7635 FAX : 06-6497-7727 E-mail: Enomoto.Hiroshi @ wrc.melco.co.jp ============================================= From kouchi @ fasol.fujitsu.com Thu Apr 11 14:23:33 2002 From: kouchi @ fasol.fujitsu.com (Hiroyuki KOUCHI) Date: Thu, 11 Apr 2002 14:23:33 +0900 Subject: [SCore-users-jp] =?ISO-2022-JP?B?c2NvdXQbJEI8OkdUGyhC?= In-Reply-To: <20020411.133652.276752805.ishikawa@is.s.u-tokyo.ac.jp> References: <20020411.133652.276752805.ishikawa@is.s.u-tokyo.ac.jp> Message-ID: <200204110523.AA00915@hiroyuki.fasol.fujitsu.com> 石川様 早速のレスありがとうございます。幸地です。 言葉足らずですいませんでした。 >x86系の中でも異なるプロセッサタイプ 確かにこちらのほうです。 >SCore自体は、性能の違い、プロセッサの違いをみて、複数のクラスタとして >管理するようになっています。 ご確認していただきありがとうございます。 > >なお、SCore本が8月までには出版される予定です。この本の中で、この手の話も >書いてあります。 楽しみに待っています。 >石川 >From: Hiroyuki KOUCHI >Subject: Re: [SCore-users-jp] scout失敗 >Date: Thu, 11 Apr 2002 12:57:44 +0900 > >> 石川様 堀様 >> >> 早速のご回答ありがとうございました。幸地です。 >> >> 早速試してみたところ、scoutの実行と、デモプログラムの起動に >> 成功しました。 >> >> ということは、確認ですが、SCoreではCPUのアーキテクチャによらずに >> 動作すると言うことでよろしいですか? >> >> >> >堀さんの回答に補足です。 >> > >> >以下のエラーですが、多分、 >> >node3からserverと言う名前でホスト名を引いてもIPアドレスが解決されないから >> >だと思われます。 >> >SCore 4のどこかのバージョンからSCore 5.0.0までは、実は、 >> > ホスト名は、FQDNおよびホスト名の2つを登録しないと下記状態に陥る >> >と言うバグがあり、パッチを出しました。 >> >ようするに、/etc/hostsあるいはNIS上に >> > 192.X.X.X server.pccluster.org server >> >と言った感じでエントリを作成して下さい。 >> > >> >この話、一応、ワークショップの時に話したので、既に対応しているとすると、 >> >また、別問題があることになるのだが…… >> > >> >石川 >> >----------------------------------------------------------------------------- >> >From: Atsushi HORI >> >Subject: Re: [SCore-users-jp] scout失敗 >> >Date: Thu, 11 Apr 2002 09:52:35 +0900 >> > >> >> 堀@スイミー・ソフトウェアです. >> >> >> >> ># SCOUT: Spawning node2SCOUT(node3): CONNECT(server:1063)=111 failed >> >> >SCOUT: Session done. >> >> >> >> 多分,これは追加したホストから server ホストが Linux のネットワーク的 >> >> に見えていないのだと思います.追加したマシンの Linux ネットワークの設 >> >> 定を確認してください. >> > >> >> >> -------------------------------------------------- >> Hiroyuki KOUCHI >> >> Systems Engnieering Dept. II >> Solutions Systems Business Div. >> >> FUJITSU ADVANCED SOLUTIONS LIMITED >> >> 1-2-4,Shinkoyahu, Kanagawa-ku, Yokohama, >> TEL:+81 45-438-2105 FAX:+81 45-438-2318 >> URL http://www.fasol.fujitsu.com >> >> E-mail: kouchi @ fasol.fujitsu.com >> -------------------------------------------------- >> >> >> >> _______________________________________________ >> SCore-users-jp mailing list >> SCore-users-jp @ pccluster.org >> http://www.pccluster.org/mailman/listinfo/score-users-jp >_______________________________________________ >SCore-users-jp mailing list >SCore-users-jp @ pccluster.org >http://www.pccluster.org/mailman/listinfo/score-users-jp > -------------------------------------------------- Hiroyuki KOUCHI Systems Engnieering Dept. II Solutions Systems Business Div. FUJITSU ADVANCED SOLUTIONS LIMITED 1-2-4,Shinkoyahu, Kanagawa-ku, Yokohama, TEL:+81 45-438-2105 FAX:+81 45-438-2318 URL http://www.fasol.fujitsu.com E-mail: kouchi @ fasol.fujitsu.com -------------------------------------------------- From s-sumi @ flab.fujitsu.co.jp Thu Apr 11 15:21:50 2002 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Thu, 11 Apr 2002 15:21:50 +0900 Subject: [SCore-users-jp] Re: [SCore-users-jp] Re: [SCore-users-jp] Myrinet =?iso-2022-jp?B?GyRCJUYlOSVIJE48OkdUGyhC?= In-Reply-To: <018a01c1e117$cd8000a0$c0cc8c0a@ENOMOTO> References: <20020410162412V.s-sumi@flab.fujitsu.co.jp> <20020411104744E.s-sumi@flab.fujitsu.co.jp> <018a01c1e117$cd8000a0$c0cc8c0a@ENOMOTO> Message-ID: <20020411152150V.s-sumi@flab.fujitsu.co.jp> 榎本様 住元です。 情報ありがとうございます。頂いた情報から、Myrinet自体は正常に初期化され ていることがわかりました。 ただ、現状のPM/MyrinetはPCI64Bまでの稼働を想定したため、Myrinet上のCPUの 動作周波数がPCI 33MHzの場合は133MHzまでに制限されています。これについて は、別途対応します。 From: "Hiroshi Enomoto" Subject: [SCore-users-jp] Re: [SCore-users-jp] Re: [SCore-users-jp] Myrinet テストの失敗 Date: Thu, 11 Apr 2002 14:14:48 +0900 .Hiroshi> 下記コマンドの実行結果を送ります。何かここから得られる情報があれば、 .Hiroshi> お願いします。 .Hiroshi> ---------------------------------------------------------------- .Hiroshi> page_size=4096, page_mask=fff, page_shift=12 .Hiroshi> LANai(0): fd=512, size=2097152, sts=0xf .Hiroshi> LANai(0): clockval=032072a0, cpu_version=0902 .Hiroshi> LANai(0): board_id=00:60:dd:7f:3e:97 .Hiroshi> LANai(0): sram_size=00200000 .Hiroshi> LANai(0): fpga_version="Thu Dec 9 16:13:40 1999" .Hiroshi> LANai(0): more_version="" .Hiroshi> LANai(0): delay_line_value=0000, board_type=0003, bus_type=0002 .Hiroshi> LANai(0): product_code=0073, serial_number=00019005 .Hiroshi> LANai(0): board_label="M3F-PCI64C-2-102405" .Hiroshi> LANai(0): max_lanai_speed=202 .Hiroshi> LANai(0): future_use=ffff ffff ffff ffff ffff ffff ffff .Hiroshi> LANai(0): size of myriUnitCommon=2000[200+1024+(6968)] .Hiroshi> [1] routing: .Hiroshi> [1] 0: 00000000000081, 7 .Hiroshi> [1] 1: 00000000000080, 7 .Hiroshi> [1] 2: 000000000000bf, 7 .Hiroshi> [1] 3: 000000000000be, 7 .Hiroshi> .Hiroshi> LANai(0): set to clockmpx=4 (calculated=6) .Hiroshi> [1] 23 contexts .Hiroshi> [1] Ctx(0x83d1cc8): sys=0x40192000, usr=0x401a6000, shared=0x401ac000 .Hiroshi> [1] Ctx(0x83d1cc8): comm=0x40157000, reg=0x40159000 .Hiroshi> [0] size of SharedContext=20000[2176+6016+57344+65536] .Hiroshi> [0] Ctx(0x83d1cc8): phys_addr=ff60000, send=0x401ae000, recv=0x401bc000 .Hiroshi> [0] size of LANaiContext=14000[308+50816+(6220)+28+16384+(8164)] .Hiroshi> [0] CPU Clock=2209.61MHz, LANai Clock=133.779MHz .Hiroshi> .Hiroshi> --------------------------------------------------------------- さて、以下の現象ですが、マザーボード(+chipset)とMyrinetのハード的な相 性の問題と考えられます。通常は、榎本さんが指摘されているような問題は発生 しません。しかしながら、時おりチップセットとマザーボードの組合せにより、 ご指摘の問題が発生する場合があります。 .Hiroshi> ところで、 .Hiroshi> Myrinet 及びEthernetNICの位置を変えたところ、計算ホストがブート .Hiroshi> できず途中で止まってしまう現象が見つかりました。(サーバーは大丈夫です) .Hiroshi> .Hiroshi> ・全PCで、NICの位置は合わせなければいけない? .Hiroshi> ・インストール時の位置から変えてはいけない? .Hiroshi> .Hiroshi> などの疑問が浮かびます。これがMyrinetのテストと関係しているのかは .Hiroshi> わからないですが、とりあえず色々位置を変えて、ブートできなくなるパターン .Hiroshi> を調べようと思います。 これは、サーバではノードと同じスロット搭載位置でもブートするということで しょうか? 止まる位置はどの場所でしょうか?よろしければ、止まる直前のコ ンソールの出力をお教え願いたいのですが、、 もし、同じ構成でサーバのみ稼働する場合は、ノードとサーバで何かハードウェ ア構成(nicの種類など)が違うと言うことはありますでしょうか? 以上、宜しくお願いします。 ------ Shinji Sumimoto, Fujitsu Labs From ganesan-ml @ ganekun.com Fri Apr 12 02:57:30 2002 From: ganesan-ml @ ganekun.com (-g3-) Date: Fri, 12 Apr 2002 02:57:30 +0900 Subject: [SCore-users-jp] Linux User =?ISO-2022-JP?B?MxskQjduOWYkciRiJEgkSyQ3JEYlJCVzGyhC?= =?ISO-2022-JP?B?GyRCJTklSCE8JWskOSRrJEghIhsoQkdkay1FUlJPUg==?= **: BadAccess =?ISO-2022-JP?B?GyRCJEMkRiRKJGsbKEI=?= Message-ID: <200204111757.g3BHvaS26877@pccluster.org> こんにちは、 浜松のガネと申します。 先日発売されたLinuxUser3月号をもとにして、Clusteringの実験をおこなって いるのです。 フロッピを作成するところまでは順調ですが、フロッピを作成したあと、 計算マシンに入れて起動すると、以下のようなエラーがでてきるのです。 (冊子の説明では、図8−図9になるって書いてあるのです) 図6で(MacアドレスとIPアドレスをサーバマシンで表示される画面で は一応、マシンの情報が現れるのです。) だれかアドバイスできますか? Anaconda Gdk-ERROR **: BadAccess serial 47 error_code 10 request_code 147 minor_code 0 Gdk-ERROR **: BadAccess serial 48 error_code 10 request_code 147 minor_code 0 ガネ -- g-3 mailto:ganesan-ml @ ganekun.com From ganesan-ml @ ganekun.com Fri Apr 12 03:10:04 2002 From: ganesan-ml @ ganekun.com (-g3-) Date: Fri, 12 Apr 2002 03:10:04 +0900 Subject: [SCore-users-jp] Linux User =?ISO-2022-JP?B?MxskQjduOWYkciRiJEgkSyQ3JEYlJCVzJTklSCE8JWskOSRrJEghIhsoQg==?= Gdk-ERROR **: BadAccess =?ISO-2022-JP?B?GyRCJEMkRiRKJGsbKEI=?= In-Reply-To: <200204111757.g3BHvaS26877@pccluster.org> References: <200204111757.g3BHvaS26877@pccluster.org> Message-ID: <200204111820.g3BIKJS26984@pccluster.org> こんにちは、 先ほどのメールを補足します。 マシンの構成はすべて、違います。(ネットワークカード、AGPなど) マシンは、すべて、REDHAT7.2をインストールしています。 サーバはFULLインストール IPは 192.168.0.80 サーバ 192.168.0.81-3 計算ホスト よろしくお願いします >こんにちは、 >浜松のガネと申します。 > >先日発売されたLinuxUser3月号をもとにして、Clusteringの実験をおこなって >いるのです。 > >フロッピを作成するところまでは順調ですが、フロッピを作成したあと、 >計算マシンに入れて起動すると、以下のようなエラーがでてきるのです。 >(冊子の説明では、図8−図9になるって書いてあるのです) >図6で(MacアドレスとIPアドレスをサーバマシンで表示される画面で >は一応、マシンの情報が現れるのです。) > >だれかアドバイスできますか? > >Anaconda >Gdk-ERROR **: BadAccess > serial 47 error_code 10 request_code 147 minor_code 0 >Gdk-ERROR **: BadAccess > serial 48 error_code 10 request_code 147 minor_code 0 > >ガネ > > >-- >g-3 mailto:ganesan-ml @ ganekun.com >_______________________________________________ >SCore-users-jp mailing list >SCore-users-jp @ pccluster.org >http://www.pccluster.org/mailman/listinfo/score-users-jp -- g-3 mailto:ganesan-ml @ ganekun.com From ishikawa @ is.s.u-tokyo.ac.jp Fri Apr 12 06:33:34 2002 From: ishikawa @ is.s.u-tokyo.ac.jp (Yutaka Ishikawa) Date: Fri, 12 Apr 2002 06:33:34 +0900 (JST) Subject: [SCore-users-jp] Linux User =?iso-2022-jp?B?MxskQjduOWYkciRiJEgkSyQ3JEYbKEI=?= =?iso-2022-jp?B?GyRCJSQlcyU5JUghPCVrJDkkayRIISIbKEI=?= Gdk-ERROR **: BadAccess =?iso-2022-jp?B?GyRCJEMkRiRKJGsbKEI=?= In-Reply-To: <200204111820.g3BIKJS26984@pccluster.org> References: <200204111757.g3BHvaS26877@pccluster.org> <200204111820.g3BIKJS26984@pccluster.org> Message-ID: <20020412.063334.730554699.ishikawa@is.s.u-tokyo.ac.jp> SCore5.0.0リリース後、マシンによって下記障害が生じることが判明しています。 コンソーシアム内部では、既に対応するパッチを作ったのですが、最終確認が 済んでいないので、まだ、公開しておりません。 お急ぎの場合は、以下を試してみて下さい。 インストールしている計算ホスト上で、Alt + F2 するとshellが出てくると思う ので、そこで、 # export DISPLAY=:0.0 # export PATH=/usr/bin:/bin:/sbin:/usr/sbin:/usr/X11R6/bin # export LD_LIBRARY_PATH=/lib:/usr/lib:/usr/X11R6/lib # /usr/bin/anaconda -m nfs:/mnt/source2 --kickstart /compconf/ --lang en_US としてみて下さい。なお、そちらの環境では、 は、192.168.0.80 ですね。は、EITのログに出ているマックアドレスを使って下さい。 石川 From: -g3- Subject: Re: [SCore-users-jp] Linux User 3月号をもとにしてインストールすると、 Gdk-ERROR **: BadAccess ってなる Date: Fri, 12 Apr 2002 03:10:04 +0900 > こんにちは、 > 先ほどのメールを補足します。 > > マシンの構成はすべて、違います。(ネットワークカード、AGPなど) > > マシンは、すべて、REDHAT7.2をインストールしています。 > サーバはFULLインストール > > IPは > 192.168.0.80 サーバ > 192.168.0.81-3 計算ホスト > > よろしくお願いします > > >こんにちは、 > >浜松のガネと申します。 > > > >先日発売されたLinuxUser3月号をもとにして、Clusteringの実験をおこなって > >いるのです。 > > > >フロッピを作成するところまでは順調ですが、フロッピを作成したあと、 > >計算マシンに入れて起動すると、以下のようなエラーがでてきるのです。 > >(冊子の説明では、図8−図9になるって書いてあるのです) > >図6で(MacアドレスとIPアドレスをサーバマシンで表示される画面で > >は一応、マシンの情報が現れるのです。) > > > >だれかアドバイスできますか? > > > >Anaconda > >Gdk-ERROR **: BadAccess > > serial 47 error_code 10 request_code 147 minor_code 0 > >Gdk-ERROR **: BadAccess > > serial 48 error_code 10 request_code 147 minor_code 0 > > > >ガネ > > > > > >-- > >g-3 mailto:ganesan-ml @ ganekun.com > >_______________________________________________ > >SCore-users-jp mailing list > >SCore-users-jp @ pccluster.org > >http://www.pccluster.org/mailman/listinfo/score-users-jp > > -- > g-3 mailto:ganesan-ml @ ganekun.com > _______________________________________________ > SCore-users-jp mailing list > SCore-users-jp @ pccluster.org > http://www.pccluster.org/mailman/listinfo/score-users-jp From Enomoto.Hiroshi @ wrc.melco.co.jp Fri Apr 12 14:37:39 2002 From: Enomoto.Hiroshi @ wrc.melco.co.jp (Hiroshi Enomoto) Date: Fri, 12 Apr 2002 14:37:39 +0900 Subject: [SCore-users-jp] =?iso-2022-jp?B?GyRCPEJAUyROJCIkaxsoQkgvVxskQjk9QC4kcjY1JCgkRjI8GyhC?= =?iso-2022-jp?B?GyRCJDUkJBsoQg==?= References: <20020410162412V.s-sumi@flab.fujitsu.co.jp> <20020411104744E.s-sumi@flab.fujitsu.co.jp> <018a01c1e117$cd8000a0$c0cc8c0a@ENOMOTO> <20020411152150V.s-sumi@flab.fujitsu.co.jp> Message-ID: <006b01c1e1e4$28e31b90$c0cc8c0a@ENOMOTO> 住元様 三菱電機 榎本です。 > さて、以下の現象ですが、マザーボード(+chipset)とMyrinetのハード的な相 > 性の問題と考えられます。通常は、榎本さんが指摘されているような問題は発生 > しません。しかしながら、時おりチップセットとマザーボードの組合せにより、 > ご指摘の問題が発生する場合があります。 とりあえずサーバー、計算ホストのEthernetNICの位置を変えて インストールし直すなど、色々試してみましたが、かなり不安定なようで、 ・昨日発生した、EthernetNICの位置変更後のブート失敗の現象が、  今日は見られなくなった。 ・EIT で Server Setup 実行後、EITが終了しない場合がある。 ・ブート時のanacondaエラーも、出たり出なかったりする といった感じです。 まだMyrinetNICの位置変更は試してませんが、rpmtest が正常終了できない 問題は、常に起こっています。 H/Wの相性の問題となると、最悪買い直すことも考えなければなりません。 参考にしたいので、Myrinet2000の稼動実績のあるH/W構成を 教えていただきたいのですが。 以上よろしくお願いします。 ============================================= 三菱電機株式会社 先端技術総合研究所   電力システム技術部 配電システムグループ         榎本 博 TEL: 06-6497-7635 FAX : 06-6497-7727 E-mail: Enomoto.Hiroshi @ wrc.melco.co.jp ============================================= From s-sumi @ flab.fujitsu.co.jp Fri Apr 12 15:51:46 2002 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Fri, 12 Apr 2002 15:51:46 +0900 Subject: [SCore-users-jp] Re: =?iso-2022-jp?B?GyRCPEJAUyROJCIkaxsoQkgvVw==?= =?iso-2022-jp?B?GyRCOT1ALiRyNjUkKCRGMjwkNSQkGyhC?= In-Reply-To: <006b01c1e1e4$28e31b90$c0cc8c0a@ENOMOTO> References: <018a01c1e117$cd8000a0$c0cc8c0a@ENOMOTO> <20020411152150V.s-sumi@flab.fujitsu.co.jp> <006b01c1e1e4$28e31b90$c0cc8c0a@ENOMOTO> Message-ID: <20020412155146R.s-sumi@flab.fujitsu.co.jp> 住元です。 一つ確認したいことがあります。 serverマシンでEthernet NICを外してスタンドアロンで立ち上げたあと、 rpmtestでserverマシン上でloopback通信を行なった場合はどうなりますでしょ うか? % rpmtest server myrinet2k -ping あと、稼働マシンの実績ですが、P4マシンであれば、新情報時代に構築した4ノー ドのクラスタは問題なく動作しています。このマザーボードは何でしたでしょう か? >亀山さん おそらく、中を開けてプリント基板を見れば型名がわかると思います。 From: "Hiroshi Enomoto" Subject: 実績のあるH/W構成を教えて下さい Date: Fri, 12 Apr 2002 14:37:39 +0900 Message-ID: <006b01c1e1e4$28e31b90$c0cc8c0a @ ENOMOTO> Enomoto.Hiroshi> 住元様 Enomoto.Hiroshi> Enomoto.Hiroshi> 三菱電機 榎本です。 Enomoto.Hiroshi> Enomoto.Hiroshi> > さて、以下の現象ですが、マザーボード(+chipset)とMyrinetのハード的な相 Enomoto.Hiroshi> > 性の問題と考えられます。通常は、榎本さんが指摘されているような問題は発生 Enomoto.Hiroshi> > しません。しかしながら、時おりチップセットとマザーボードの組合せにより、 Enomoto.Hiroshi> > ご指摘の問題が発生する場合があります。 Enomoto.Hiroshi> Enomoto.Hiroshi> とりあえずサーバー、計算ホストのEthernetNICの位置を変えて Enomoto.Hiroshi> インストールし直すなど、色々試してみましたが、かなり不安定なようで、 Enomoto.Hiroshi> Enomoto.Hiroshi> ・昨日発生した、EthernetNICの位置変更後のブート失敗の現象が、 Enomoto.Hiroshi>  今日は見られなくなった。 Enomoto.Hiroshi> ・EIT で Server Setup 実行後、EITが終了しない場合がある。 Enomoto.Hiroshi> ・ブート時のanacondaエラーも、出たり出なかったりする Enomoto.Hiroshi> Enomoto.Hiroshi> といった感じです。 Enomoto.Hiroshi> まだMyrinetNICの位置変更は試してませんが、rpmtest が正常終了できない Enomoto.Hiroshi> 問題は、常に起こっています。 Enomoto.Hiroshi> Enomoto.Hiroshi> H/Wの相性の問題となると、最悪買い直すことも考えなければなりません。 Enomoto.Hiroshi> 参考にしたいので、Myrinet2000の稼動実績のあるH/W構成を Enomoto.Hiroshi> 教えていただきたいのですが。 Enomoto.Hiroshi> Enomoto.Hiroshi> 以上よろしくお願いします。 Enomoto.Hiroshi> Enomoto.Hiroshi> ============================================= Enomoto.Hiroshi> 三菱電機株式会社 先端技術総合研究所 Enomoto.Hiroshi>   電力システム技術部 配電システムグループ Enomoto.Hiroshi>         榎本 博 Enomoto.Hiroshi> TEL: 06-6497-7635 Enomoto.Hiroshi> FAX : 06-6497-7727 Enomoto.Hiroshi> E-mail: Enomoto.Hiroshi @ wrc.melco.co.jp Enomoto.Hiroshi> ============================================= Enomoto.Hiroshi> Enomoto.Hiroshi> ------ Shinji Sumimoto, Fujitsu Labs From kameyama @ pccluster.org Fri Apr 12 17:39:57 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Fri, 12 Apr 2002 17:39:57 +0900 Subject: [SCore-users-jp] Re: =?ISO-2022-JP?B?GyRCPEJAUyROJCIbKEI=?= =?ISO-2022-JP?B?GyRCJGsbKEJIL1cbJEI5PUAuJHI2NSQoJEYyPCQ1JCQbKEI=?= In-Reply-To: Your message of "Fri, 12 Apr 2002 15:51:46 JST." <20020412155146R.s-sumi@flab.fujitsu.co.jp> Message-ID: <200204120839.g3C8dvv09167@yl-dhcp18.is.s.u-tokyo.ac.jp> 亀山です. In article <20020412155146R.s-sumi @ flab.fujitsu.co.jp> Shinji Sumimoto wrotes: > あと、稼働マシンの実績ですが、P4マシンであれば、新情報時代に構築した4ノー > ドのクラスタは問題なく動作しています。このマザーボードは何でしたでしょう > か? >亀山さん たしか, 2 node でしか動かしていなかったような... 多分, ECS p4ita (http://www.ecs.com.tw/products/p4ita.htm) MSI MS-6339 (http://www.msi.com.tw/products/mainboard/mainboard.php?model=MS-6339) です. 最近やったのは, それぞれ 1 台ずつの 2 node で SCore 4.2.1 が動くのは 確認したと思います. (ただし, カードは Lanai 9 (Myriinet 2000) ですが, スイッチの関係で Myrinet 1280 mode です.) from Kameyama Toyohisa From kouchi @ fasol.fujitsu.com Sat Apr 13 18:56:38 2002 From: kouchi @ fasol.fujitsu.com (Hiroyuki KOUCHI) Date: Sat, 13 Apr 2002 18:56:38 +0900 Subject: [SCore-users-jp] =?ISO-2022-JP?B?U0NPT1AbJEIkSyREJCQkRhsoQg==?= Message-ID: <200204130956.AA00919@hiroyuki.fasol.fujitsu.com> メーリングリスト一同様 いつも情報提供していただきありがとうございます。幸地です。 SCOOPについて質問させてください。よろしくお願い致します。 SCoreのドキュメントには、SCOOPについての内容が示されていますが、 EITによるSCore5のインストール終了後には、SCOOPがインストールされてませんでした。 また、ソースにも、FTPサイトにも存在しません。 SCOOPは、どこにいけば手に入るのでしょうか -------------------------------------------------- Hiroyuki KOUCHI Systems Engnieering Dept. II Solutions Systems Business Div. FUJITSU ADVANCED SOLUTIONS LIMITED 1-2-4,Shinkoyahu, Kanagawa-ku, Yokohama, TEL:+81 45-438-2105 FAX:+81 45-438-2318 URL http://www.fasol.fujitsu.com E-mail: kouchi @ fasol.fujitsu.com -------------------------------------------------- From tueda @ sc5.so-net.ne.jp Sat Apr 13 19:40:20 2002 From: tueda @ sc5.so-net.ne.jp (tueda@sc5) Date: Sat, 13 Apr 2002 19:40:20 +0900 Subject: [SCore-users-jp] SCore =?ISO-2022-JP?B?Y2x1c3RlchskQiRLSSxNVyRKJU8hPCVJJSYbKEI=?= =?ISO-2022-JP?B?GyRCJSclIjk9QC4kSyREJCQkRhsoQg==?= Message-ID: <20020413193944.8431.TUEDA@sc5.so-net.ne.jp> SCoreのメーリングリストの方々、始めまして。 SCore clusterを作るのに必要なハードウェア構成について。 ドキュメントでは、   「全てのhostは同質であるために、同じアーキティクチャを備え、    同じバージョンのオペレーティングシステムを使用する必要があります」 となっていますが、これはつまり    全てのcompute hostは同一のアーキテクチャでなければならないが    cluster serverはそれらと別のアーキテクチャでも良い と解釈して良いのでしょうか? ドキュメントの「Compute Hostの設定」の「ソースからのSCoreシステムのインストール」の所で 「 1.サーバからのバイナリのインストール」とあって サーバからバイナリィをコピーしてもアーキテクチャが違うので動かない(?)ようなのですが。 # rcp -rp server:/opt/score/deploy/\* /opt/score/deploy/ # rcp -rp server:/opt/score/install/\* /opt/score/install/ # ./setup -score_comp -pbs_common # /etc/rc.d/init.d/pm_ethernet start n Starting PM/Ethernet: /etc/rc.d/init.d/pm_ethernet: /sbin/etherpmctl: cannot execute binary file ソースから何とかしたいが、setupが何をやっているのかわからない。 複雑なインストールをやっているので、ここまで来る過程で間違えている 可能性も非常に高いです。 それなのでcompute hostとcluster serverが異なるアーキテクチャでも 良いかどうかだけ確認させてください。 -- tueda From s-sumi @ bd6.so-net.ne.jp Sat Apr 13 23:20:01 2002 From: s-sumi @ bd6.so-net.ne.jp (Shinji Sumimoto) Date: Sat, 13 Apr 2002 23:20:01 +0900 Subject: [SCore-users-jp] SCore =?iso-2022-jp?B?Y2x1c3RlchskQiRLSSxNVyRKGyhC?= =?iso-2022-jp?B?GyRCJU8hPCVJJSYlJyUiOT1ALiRLJEQkJCRGGyhC?= In-Reply-To: <20020413193944.8431.TUEDA@sc5.so-net.ne.jp> References: <20020413193944.8431.TUEDA@sc5.so-net.ne.jp> Message-ID: <20020413232001C.s-sumi@bd6.so-net.ne.jp> 住元です。 ここで、おっしゃっているアーキテクチャの意味がはっきりしませんが、同じバ イナリが動くようなアーキテクチャの違い(例えば、x86 archでのP5, P6, Athlon)であれば問題なく動きます。計算ノードは通常は同じ構成(プロセッサ とCPU Clock)が望ましいですが、違っても動かないわけではありません。 また、serverに関しては、例えば、serverはalphaプロセッサ、計算ノードは x86 archといったように、違っても動作はします。ただ、この実行環境の構築は すべてソースからコンパイルする必要があります。 具体的にどのような環境で実行されたいのでしょうか? EIT、rpm、ソースからのインストール方法については、以下に情報がありますの で、参考にして下さい。 http://www.pccluster.org/score/dist/score/html/ja/installation/index.html From: "tueda @ sc5" Subject: [SCore-users-jp] SCore clusterに必要なハードウェア構成について Date: Sat, 13 Apr 2002 19:40:20 +0900 > SCore clusterを作るのに必要なハードウェア構成について。 > > ドキュメントでは、 >   「全てのhostは同質であるために、同じアーキティクチャを備え、 >    同じバージョンのオペレーティングシステムを使用する必要があります」 > となっていますが、これはつまり >    全てのcompute hostは同一のアーキテクチャでなければならないが >    cluster serverはそれらと別のアーキテクチャでも良い > と解釈して良いのでしょうか? > > ドキュメントの「Compute Hostの設定」の「ソースからのSCoreシステムのインストール」の所で > 「 1.サーバからのバイナリのインストール」とあって > サーバからバイナリィをコピーしてもアーキテクチャが違うので動かない(?)ようなのですが。 > > # rcp -rp server:/opt/score/deploy/\* /opt/score/deploy/ > # rcp -rp server:/opt/score/install/\* /opt/score/install/ > # ./setup -score_comp -pbs_common > # /etc/rc.d/init.d/pm_ethernet start > n Starting PM/Ethernet: > /etc/rc.d/init.d/pm_ethernet: /sbin/etherpmctl: cannot execute binary file 単に、/sbin/etherpmctl がないだけのように思われます。 EITなどでのインストールがうまく行かなかったのでしょうか? > ソースから何とかしたいが、setupが何をやっているのかわからない。 > 複雑なインストールをやっているので、ここまで来る過程で間違えている > 可能性も非常に高いです。 > それなのでcompute hostとcluster serverが異なるアーキテクチャでも > 良いかどうかだけ確認させてください。 ----- 住元 真司 E-Mail: s-sumi @ bd6.so-net.ne.jp From s-sumi @ bd6.so-net.ne.jp Sat Apr 13 23:25:25 2002 From: s-sumi @ bd6.so-net.ne.jp (Shinji Sumimoto) Date: Sat, 13 Apr 2002 23:25:25 +0900 Subject: [SCore-users-jp] =?iso-2022-jp?B?U0NPT1AbJEIkSyREJCQkRhsoQg==?= In-Reply-To: <200204130956.AA00919@hiroyuki.fasol.fujitsu.com> References: <200204130956.AA00919@hiroyuki.fasol.fujitsu.com> Message-ID: <20020413232525M.s-sumi@bd6.so-net.ne.jp> 住元です。 From: Hiroyuki KOUCHI Subject: [SCore-users-jp] SCOOPについて Date: Sat, 13 Apr 2002 18:56:38 +0900 > メーリングリスト一同様 > > いつも情報提供していただきありがとうございます。幸地です。 > > SCOOPについて質問させてください。よろしくお願い致します。 > > SCoreのドキュメントには、SCOOPについての内容が示されていますが、 > EITによるSCore5のインストール終了後には、SCOOPがインストールされてませんでした。 > また、ソースにも、FTPサイトにも存在しません。 > > SCOOPは、どこにいけば手に入るのでしょうか SCOOPは、SCore 4.2からun-supported になったためソースからも外されてしまっ た可能性があります。SCoreの古いバージョン(4.2.1)にはバイナリは入ってい ませんが、ソースは入っていたと思います。ソースからのインストール方法は多 少ちがいますので、ドキュメントを参照して下さい。 ----- 住元 真司 E-Mail: s-sumi @ bd6.so-net.ne.jp From tueda @ sc5.so-net.ne.jp Mon Apr 15 10:22:15 2002 From: tueda @ sc5.so-net.ne.jp (tueda@sc5) Date: Mon, 15 Apr 2002 10:22:15 +0900 Subject: [SCore-users-jp] SCore =?ISO-2022-JP?B?Y2x1c3RlchskQiRLSSxNVyRKJU8hPCVJJSYbKEI=?= =?ISO-2022-JP?B?GyRCJSclIjk9QC4kSyREJCQkRhsoQg==?= In-Reply-To: <20020413232001C.s-sumi@bd6.so-net.ne.jp> References: <20020413193944.8431.TUEDA@sc5.so-net.ne.jp> <20020413232001C.s-sumi@bd6.so-net.ne.jp> Message-ID: <20020415102141.739D.TUEDA@sc5.so-net.ne.jp> tuedaです。 > また、serverに関しては、例えば、serverはalphaプロセッサ、計算ノードは > x86 archといったように、違っても動作はします。ただ、この実行環境の構築は > すべてソースからコンパイルする必要があります。 > > 具体的にどのような環境で実行されたいのでしょうか? アーキテクチャ=i386とかsparcです。 ドキュメントで「ソースからの SCore システムのインストール」とあるわりに いきなり「1.サーバからのバイナリのインストール 」となっているので 実はcluster serverとcompute hostのアーキテクチャも統一しないと いけないのかと不安になっただけです。 これで安心して先に進めます。ありがとうございました。 /opt/score/install/setupが何をやっているのか良く分かりませんが、 /opt/score/deployと/opt/score/installをソースから作れば 何とかなるでしょう。 できるかどうか判らないので、余り期待されても困るのですが。 具体的な環境はcluster serverがi386でcompute hostがmips(!)です。 compute hostは"PlayStaion 2"(for linux)といった方がわかり易いか。 (当然ソースは適時書き換えてます。rdtscが無いのが悩みの種) -- tueda From kameyama @ pccluster.org Mon Apr 15 10:37:27 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Mon, 15 Apr 2002 10:37:27 +0900 Subject: [SCore-users-jp] SCore =?ISO-2022-JP?B?Y2x1c3RlchskQiRLGyhC?= =?ISO-2022-JP?B?GyRCSSxNVyRKJU8hPCVJJSYlJyUiOT1ALiRLJEQkJCRGGyhC?= In-Reply-To: Your message of "Sat, 13 Apr 2002 23:20:01 JST." <20020413232001C.s-sumi@bd6.so-net.ne.jp> Message-ID: <200204150137.g3F1bRv02258@yl-dhcp18.is.s.u-tokyo.ac.jp> 亀山です. In article <20020413232001C.s-sumi @ bd6.so-net.ne.jp> Shinji Sumimoto wrotes: > ここで、おっしゃっているアーキテクチャの意味がはっきりしませんが、同じバ > イナリが動くようなアーキテクチャの違い(例えば、x86 archでのP5, P6, > Athlon)であれば問題なく動きます。計算ノードは通常は同じ構成(プロセッサ > とCPU Clock)が望ましいですが、違っても動かないわけではありません。 > > また、serverに関しては、例えば、serverはalphaプロセッサ、計算ノードは > x86 archといったように、違っても動作はします。ただ、この実行環境の構築は > すべてソースからコンパイルする必要があります。 また, install 方法の説明は server 及び compute host が同一であることを 仮定していますので, install の仕方が異なる, scrun で binary type の 指定を行う必要がある, 当然, コンパイルなどもそこでは行えない, という問題があります. ちなみに, 現在 SCore がサポートしているアーキテクチャは i386 のみです. alpha は以前サポートしていたので, 動く可能性はありますが, そのほかのプロセッサに関しては全く動かしていません. 多分, kernel の変更を行う必要があると思います. > > 「 1.サーバからのバイナリのインストール」とあって > > サーバからバイナリィをコピーしてもアーキテクチャが違うので動かない(?)よ > うなのですが。 > > > > # rcp -rp server:/opt/score/deploy/\* /opt/score/deploy/ > > # rcp -rp server:/opt/score/install/\* /opt/score/install/ > > # ./setup -score_comp -pbs_common > > # /etc/rc.d/init.d/pm_ethernet start > > n Starting PM/Ethernet: > > /etc/rc.d/init.d/pm_ethernet: /sbin/etherpmctl: cannot execute binary file server と compute host のアーキテクチャが異なっている場合は, compute host と同じアーキテクチャで SCore をコンパイルして, そこからバイナリをコピーする必要があります. > > ソースから何とかしたいが、setupが何をやっているのかわからない。 setup は /opt/score/install にある, 起動時に必要な コマンドやスクリプトをコピーします. (/opt/score が NFS mount している場合, mount する前に etherpmctl などの コマンドを動かすことを想定しています.) このあたりは distribution によって変更する必要があるかも知れません. from Kameyama Toyohisa From Enomoto.Hiroshi @ wrc.melco.co.jp Mon Apr 15 14:27:29 2002 From: Enomoto.Hiroshi @ wrc.melco.co.jp (Hiroshi Enomoto) Date: Mon, 15 Apr 2002 14:27:29 +0900 Subject: [SCore-users-jp] =?iso-2022-jp?B?UmU6IFJlOiAbJEI8QkBTJE4kIiRrGyhCSC9XGyRCOT1ALhsoQg==?= =?iso-2022-jp?B?GyRCJHI2NSQoJEYyPCQ1JCQbKEI=?= References: <200204120839.g3C8dvv09167@yl-dhcp18.is.s.u-tokyo.ac.jp> Message-ID: <00fe01c1e43e$3c726600$c0cc8c0a@ENOMOTO> 三菱電機 榎本です。 亀山様。 情報ありがとうございます。購入の際参考にしたいと思います。 > たしか, 2 node でしか動かしていなかったような... > > 多分, > ECS p4ita (http://www.ecs.com.tw/products/p4ita.htm) > MSI MS-6339 (http://www.msi.com.tw/products/mainboard/mainboard.php?model=MS-6339) > です. > > 最近やったのは, それぞれ 1 台ずつの 2 node で SCore 4.2.1 が動くのは > 確認したと思います. > (ただし, カードは Lanai 9 (Myriinet 2000) ですが, > スイッチの関係で Myrinet 1280 mode です.) > > from Kameyama Toyohisa 住元様。 下記コマンドを実行したところ、動作しました。 ループバックテストは問題ないようです。 > 住元です。 > > 一つ確認したいことがあります。 > > serverマシンでEthernet NICを外してスタンドアロンで立ち上げたあと、 > rpmtestでserverマシン上でloopback通信を行なった場合はどうなりますでしょ > うか? > > % rpmtest server myrinet2k -ping また色々試してみて、結果に変化が見られたら連絡します。 以上 ============================================= 三菱電機株式会社 先端技術総合研究所   電力システム技術部 配電システムグループ         榎本 博 TEL: 06-6497-7635 FAX : 06-6497-7727 E-mail: Enomoto.Hiroshi @ wrc.melco.co.jp ============================================= From s-sumi @ flab.fujitsu.co.jp Mon Apr 15 14:34:13 2002 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Mon, 15 Apr 2002 14:34:13 +0900 Subject: [SCore-users-jp] Re: Re: =?iso-2022-jp?B?GyRCPEJAUyROJCIkaxsoQkgvVw==?= =?iso-2022-jp?B?GyRCOT1ALiRyNjUkKCRGMjwkNSQkGyhC?= In-Reply-To: <00fe01c1e43e$3c726600$c0cc8c0a@ENOMOTO> References: <200204120839.g3C8dvv09167@yl-dhcp18.is.s.u-tokyo.ac.jp> <00fe01c1e43e$3c726600$c0cc8c0a@ENOMOTO> Message-ID: <20020415143413C.s-sumi@flab.fujitsu.co.jp> 住元です。 From: "Hiroshi Enomoto" Subject: Re: Re: 実績のあるH/W構成を教えて下さい Date: Mon, 15 Apr 2002 14:27:29 +0900 Message-ID: <00fe01c1e43e$3c726600$c0cc8c0a @ ENOMOTO> Enomoto.Hiroshi> 亀山様。 Enomoto.Hiroshi> 情報ありがとうございます。購入の際参考にしたいと思います。 Enomoto.Hiroshi> Enomoto.Hiroshi> > たしか, 2 node でしか動かしていなかったような... Enomoto.Hiroshi> > Enomoto.Hiroshi> > 多分, Enomoto.Hiroshi> > ECS p4ita (http://www.ecs.com.tw/products/p4ita.htm) Enomoto.Hiroshi> > MSI MS-6339 (http://www.msi.com.tw/products/mainboard/mainboard.php?model=MS-6339) Enomoto.Hiroshi> > です. Enomoto.Hiroshi> > Enomoto.Hiroshi> > 最近やったのは, それぞれ 1 台ずつの 2 node で SCore 4.2.1 が動くのは Enomoto.Hiroshi> > 確認したと思います. Enomoto.Hiroshi> > (ただし, カードは Lanai 9 (Myriinet 2000) ですが, Enomoto.Hiroshi> > スイッチの関係で Myrinet 1280 mode です.) Enomoto.Hiroshi> > Enomoto.Hiroshi> > from Kameyama Toyohisa Enomoto.Hiroshi> Enomoto.Hiroshi> 住元様。 Enomoto.Hiroshi> 下記コマンドを実行したところ、動作しました。 Enomoto.Hiroshi> ループバックテストは問題ないようです。 Enomoto.Hiroshi> Enomoto.Hiroshi> > 住元です。 Enomoto.Hiroshi> > Enomoto.Hiroshi> > 一つ確認したいことがあります。 Enomoto.Hiroshi> > Enomoto.Hiroshi> > serverマシンでEthernet NICを外してスタンドアロンで立ち上げたあと、 Enomoto.Hiroshi> > rpmtestでserverマシン上でloopback通信を行なった場合はどうなりますでしょ Enomoto.Hiroshi> > うか? Enomoto.Hiroshi> > Enomoto.Hiroshi> > % rpmtest server myrinet2k -ping Enomoto.Hiroshi> Enomoto.Hiroshi> また色々試してみて、結果に変化が見られたら連絡します。 それでは、Ethernetを搭載してのloopback通信はどうでしょう。 1)Ethernet搭載のみ(inetネットワークはdisable) 2)Ethernet搭載 inetネットワークはenable 2)が もしNGなら、Ethernet NICの別の種類のもの(例えば手持ちの他のもの、 eepro100など)に変更してみるとどうでしょうか? MB, NICとの相性かもしれませんね、、 ------ Shinji Sumimoto, Fujitsu Labs From nrcb @ streamline-computing.com Mon Apr 15 18:15:04 2002 From: nrcb @ streamline-computing.com (Nick Birkett) Date: Mon, 15 Apr 2002 10:15:04 +0100 Subject: [SCore-users-jp] [SCore-users] Problem starting multi-user Message-ID: <0204151015040K.17042@pecan.comlab.ox.ac.uk> Hi we had a problem with one of our cluster nodes (comp3) so commented it out of scorehosts.db. I have restarted scoreboard and msgbserv. Now when starting scored with sc_watch I get the following error: ----------------------------------------------------------------------------- SCOUT: Spawning done. 15/Apr/2002 10:03:42 SYSLOG: /opt/score/deploy/scored 15/Apr/2002 10:03:42 SYSLOG: SCore-D 4.2 $Id: init.cc,v 1.63 2001/09/07 09:10:26 hori Exp $ 15/Apr/2002 10:03:42 SYSLOG: Compile option(s): 15/Apr/2002 10:03:42 SYSLOG: SCore-D network: myrinet2k/myrinet2k 15/Apr/2002 10:03:42 SYSLOG: Cluster[0]: (0..4)x1.i386-redhat7-linux2_4.i686.500 15/Apr/2002 10:03:42 SYSLOG: Memory: 880[MB], Swap: 2048[MB], Disk: 2023[MB] 15/Apr/2002 10:03:42 SYSLOG: Network[0]: myrinet2k/myrinet2k 15/Apr/2002 10:03:42 SYSLOG: Network[1]: ethernet/ethernet 15/Apr/2002 10:03:42 SYSLOG: Scheduler initiated: Timeslice = 500 [msec] 15/Apr/2002 10:03:42 SYSLOG: Queue[0] activated, exclusive scheduling 15/Apr/2002 10:03:42 SYSLOG: Queue[1] activated, time-sharing scheduling 15/Apr/2002 10:03:42 SYSLOG: Queue[2] activated, time-sharing scheduling 15/Apr/2002 10:03:42 SYSLOG: Session ID: 0 15/Apr/2002 10:03:42 SYSLOG: Server Host: comp5.ph.bham.ac.uk 15/Apr/2002 10:03:42 SYSLOG: Backup Host: comp1.ph.bham.ac.uk <4> SCore-D:ERROR Unable to continue session-0. ------------------------------------------------------------------------------ If I also comment comp5 out of scorehosts.db and try again it works (using comp0,1,2,4). I have done an rpmtest (ping and point to point) between comp5 and all other available hosts and this seems fine (10 us round trip). I have encountered this problem before when removing hosts, but have not been able to find what the problem is. Anybody else seen this ? Regards, Nick _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From hori @ swimmy-soft.com Mon Apr 15 18:41:12 2002 From: hori @ swimmy-soft.com (Atsushi HORI) Date: Mon, 15 Apr 2002 18:41:12 +0900 Subject: [SCore-users-jp] Re: [SCore-users] Problem starting multi-user In-Reply-To: <0204151015040K.17042@pecan.comlab.ox.ac.uk> References: <0204151015040K.17042@pecan.comlab.ox.ac.uk> Message-ID: <3101740872.hori0001@mail.bestsystems.co.jp> Hi. >Hi we had a problem with one of our cluster nodes (comp3) so commented it out >of scorehosts.db. > >I have restarted scoreboard and msgbserv. > >Now when starting scored with sc_watch I get the following error: SCore-D remebers the cluster configuration of the last time and also remembers the jobs running. Here "remeber" means some info is stored into disk. When SCore-D is restarted, then it checks the file with the current cluster configuration, and when it discovers some difference, then it will not to start. When you want to start SCore-D with different clsuter ocnfiguration, you must specify "session No." or reset the previous session with "-reset" option. The session was introduced so that aborted job(s) in the previous session can be preserved with the different configuration. Think about the case two hosts crash while some user jobs are running. The jobs only restarted from their checkpoint when the two hosts are fixed, but it may takes some time. And you want to continue SCore-D running on the shrinked cluster (beacuse two hosts are missing). This can be done by specifying the different session id. When the two hosts are fixed, then stop SCore-D and restart SCore-D with the original session no. The default session no. is 0. _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From s-sumi @ flab.fujitsu.co.jp Mon Apr 15 18:42:01 2002 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Mon, 15 Apr 2002 18:42:01 +0900 Subject: [SCore-users-jp] Re: [SCore-users] Problem starting multi-user In-Reply-To: <0204151015040K.17042@pecan.comlab.ox.ac.uk> References: <0204151015040K.17042@pecan.comlab.ox.ac.uk> Message-ID: <20020415184201C.s-sumi@flab.fujitsu.co.jp> Hi. Could you try to run scored with -reset option? It seems some checkpoint files is on the node 4(comp5). Shinji. From: Nick Birkett Subject: [SCore-users] Problem starting multi-user Date: Mon, 15 Apr 2002 10:15:04 +0100 Message-ID: <0204151015040K.17042 @ pecan.comlab.ox.ac.uk> nrcb> Hi we had a problem with one of our cluster nodes (comp3) so commented it out nrcb> of scorehosts.db. nrcb> nrcb> I have restarted scoreboard and msgbserv. nrcb> nrcb> Now when starting scored with sc_watch I get the following error: nrcb> nrcb> nrcb> ----------------------------------------------------------------------------- nrcb> SCOUT: Spawning done. nrcb> 15/Apr/2002 10:03:42 SYSLOG: /opt/score/deploy/scored nrcb> 15/Apr/2002 10:03:42 SYSLOG: SCore-D 4.2 $Id: init.cc,v 1.63 2001/09/07 nrcb> 09:10:26 hori Exp $ nrcb> 15/Apr/2002 10:03:42 SYSLOG: Compile option(s): nrcb> 15/Apr/2002 10:03:42 SYSLOG: SCore-D network: myrinet2k/myrinet2k nrcb> 15/Apr/2002 10:03:42 SYSLOG: Cluster[0]: nrcb> (0..4)x1.i386-redhat7-linux2_4.i686.500 nrcb> 15/Apr/2002 10:03:42 SYSLOG: Memory: 880[MB], Swap: 2048[MB], Disk: 2023[MB] nrcb> 15/Apr/2002 10:03:42 SYSLOG: Network[0]: myrinet2k/myrinet2k nrcb> 15/Apr/2002 10:03:42 SYSLOG: Network[1]: ethernet/ethernet nrcb> 15/Apr/2002 10:03:42 SYSLOG: Scheduler initiated: Timeslice = 500 [msec] nrcb> 15/Apr/2002 10:03:42 SYSLOG: Queue[0] activated, exclusive scheduling nrcb> 15/Apr/2002 10:03:42 SYSLOG: Queue[1] activated, time-sharing scheduling nrcb> 15/Apr/2002 10:03:42 SYSLOG: Queue[2] activated, time-sharing scheduling nrcb> 15/Apr/2002 10:03:42 SYSLOG: Session ID: 0 nrcb> 15/Apr/2002 10:03:42 SYSLOG: Server Host: comp5.ph.bham.ac.uk nrcb> 15/Apr/2002 10:03:42 SYSLOG: Backup Host: comp1.ph.bham.ac.uk nrcb> <4> SCore-D:ERROR Unable to continue session-0. nrcb> nrcb> ------------------------------------------------------------------------------ nrcb> nrcb> If I also comment comp5 out of scorehosts.db and try again it works (using nrcb> comp0,1,2,4). nrcb> nrcb> I have done an rpmtest (ping and point to point) between comp5 and all other nrcb> available hosts and this seems fine (10 us round trip). nrcb> nrcb> I have encountered this problem before when removing hosts, but have not been nrcb> able to find what the problem is. nrcb> nrcb> Anybody else seen this ? nrcb> nrcb> Regards, nrcb> nrcb> Nick nrcb> _______________________________________________ nrcb> SCore-users mailing list nrcb> SCore-users @ pccluster.org nrcb> http://www.pccluster.org/mailman/listinfo/score-users nrcb> ------ Shinji Sumimoto, Fujitsu Labs _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From higu @ ihas.nagoya-u.ac.jp Tue Apr 16 13:38:31 2002 From: higu @ ihas.nagoya-u.ac.jp (Higuchi, Atsushi) Date: Tue, 16 Apr 2002 13:38:31 +0900 Subject: [SCore-users-jp] Intel Pro / 1G =?ISO-2022-JP?B?GyRCJE4+bDlnJE4bKEJib290?= =?ISO-2022-JP?B?ZGlzaw==?= Message-ID: <200204160438.AA01882@higu1.ihas.nagoya-u.ac.jp> Score-users のみなさま,初めまして.樋口@名古屋大と申します. UNIX Userの掲載記事につられ,1Gでの通信ができなかった売り物の Kondaraから Redhat 7.2 + SCoreに移行しようと作業中です. 基本的にeitに言われるがままに作業をしていますが, bootdiskを作成し,それを計算用PCに突っ込んで起動させると, PCIボードに刺したIntel Pro /1Gを認識していないようです. fddブートのメッセージを見ると; SIOCSIFADDR: No such device となり,これは別のgiga ethanet のドライバーの様な 気がしています. ひょっとすると過去に何度もこの手の問題がこのMLに展開され, メンバーの方々もウンザリするかも知れませんが,何か解決 する情報がございましたらお願いいたします. 特に Intel Ether Pro 1000B を使われて成功された方から 何か得られれば幸いです. #eitを使わず,各PCにredhat を入れた上でrpmで計算機用の #kernelにアップデート等を施した方が早いでしょうか? ちなみに,こちらの並列(未だ動いていない)計算機群環境は 以下の様になります: ・PIII  1U ラックマウントモデル(dual proc.:ぷらっとホーム製)×4 ・SCSI HDD 18GB 搭載. ・オンボードのether express pro ×2はbiosで殺してあります. ・PCIスロットにIntel Ether Pro 1000B をinstallしてあります. ・サーバーも計算機の頭数に入れるようにeitでは設定しました. お手数をおかけしますが,よろしくお願いします. 樋口 /************************************************ 樋口篤志 名古屋大学地球水循環研究センター  〒464-8601 名古屋市千種区不老町 Tel: 052-789-5467 Fax: 052-789-3436 e-mail: higu @ ihas.nagoya-u.ac.jp (official) ahiguchi @ mui.biglobe.ne.jp (unofficial) URL:http://rc.ihas.nagoya-u.ac.jp/~higu/ **************************************************/ From kouchi @ fasol.fujitsu.com Tue Apr 16 13:50:45 2002 From: kouchi @ fasol.fujitsu.com (Hiroyuki KOUCHI) Date: Tue, 16 Apr 2002 13:50:45 +0900 Subject: [SCore-users-jp] =?ISO-2022-JP?B?U0NPT1AbJEIkSyREGyhK?= =?ISO-2022-JP?B?GyRCJCQkRhsoQg==?= In-Reply-To: <20020413232525M.s-sumi@bd6.so-net.ne.jp> References: <20020413232525M.s-sumi@bd6.so-net.ne.jp> Message-ID: <200204160450.AA00923@hiroyuki.fasol.fujitsu.com> 住元様 毎度、情報ご提供いただきありがとうございます。幸地です。 レスが遅れて申し訳ありません。 以下のメールでは、SCore4.2.1のソースにあるSCOOPを 5.0のソース環境のでコンパイルをするということですね。 試してみようと思います。 ありがとうござしました。 >住元です。 > >From: Hiroyuki KOUCHI >Subject: [SCore-users-jp] SCOOPについて >Date: Sat, 13 Apr 2002 18:56:38 +0900 > >> メーリングリスト一同様 >> >> いつも情報提供していただきありがとうございます。幸地です。 >> >> SCOOPについて質問させてください。よろしくお願い致します。 >> >> SCoreのドキュメントには、SCOOPについての内容が示されていますが、 >> EITによるSCore5のインストール終了後には、SCOOPがインストールされてませんでした。 >> また、ソースにも、FTPサイトにも存在しません。 >> >> SCOOPは、どこにいけば手に入るのでしょうか > >SCOOPは、SCore 4.2からun-supported になったためソースからも外されてしまっ >た可能性があります。SCoreの古いバージョン(4.2.1)にはバイナリは入ってい >ませんが、ソースは入っていたと思います。ソースからのインストール方法は多 >少ちがいますので、ドキュメントを参照して下さい。 > >----- >住元 真司 E-Mail: s-sumi @ bd6.so-net.ne.jp > -------------------------------------------------- Hiroyuki KOUCHI Systems Engnieering Dept. II Solutions Systems Business Div. FUJITSU ADVANCED SOLUTIONS LIMITED 1-2-4,Shinkoyahu, Kanagawa-ku, Yokohama, TEL:+81 45-438-2105 FAX:+81 45-438-2318 URL http://www.fasol.fujitsu.com E-mail: kouchi @ fasol.fujitsu.com -------------------------------------------------- From s-sumi @ flab.fujitsu.co.jp Tue Apr 16 14:02:41 2002 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Tue, 16 Apr 2002 14:02:41 +0900 Subject: [SCore-users-jp] Intel Pro / 1G =?iso-2022-jp?B?GyRCJE4+bDlnJE4bKEJib290ZGlzaw==?= In-Reply-To: <200204160438.AA01882@higu1.ihas.nagoya-u.ac.jp> References: <200204160438.AA01882@higu1.ihas.nagoya-u.ac.jp> Message-ID: <20020416140241T.s-sumi@flab.fujitsu.co.jp> 住元です。 Intel PRO 1000Bというのは初めて聞くのですが、具体的な製品名(いつ出荷で 利用LSIチップの情報)はなんでしょうか? lspciコマンドの結果を教えてもら えれば対応しているかどうかはわかります。 フロッピー搭載のe1000(Intelのもの)のドライバは古いかもしれませんが、 EITでのインストール後に入るカーネルは3月時点での最新版のe1000が入ってい ます。 もし、Intel PRO 1000Bがe1000デバイスドライバでサポートされているのであれ ば、EITでのインストールはeepro100を使って行ない、インストール後に Intel PRO 1000Bのデバイスドライバを入れる(対応)のが無難と思います。 一応、EITでは試していませんが、Intel PRO1000, PRO1000T, PRO1000XT 上で SCoreが動くことは2ノードですが確認しています。 From: "Higuchi, Atsushi" Subject: [SCore-users-jp] Intel Pro / 1G の場合のbootdisk Date: Tue, 16 Apr 2002 13:38:31 +0900 Message-ID: <200204160438.AA01882 @ higu1.ihas.nagoya-u.ac.jp> higu> Score-users のみなさま,初めまして.樋口@名古屋大と申します. higu> higu> UNIX Userの掲載記事につられ,1Gでの通信ができなかった売り物の higu> Kondaraから Redhat 7.2 + SCoreに移行しようと作業中です. higu> higu> 基本的にeitに言われるがままに作業をしていますが, higu> bootdiskを作成し,それを計算用PCに突っ込んで起動させると, higu> PCIボードに刺したIntel Pro /1Gを認識していないようです. higu> higu> fddブートのメッセージを見ると; higu> SIOCSIFADDR: No such device higu> となり,これは別のgiga ethanet のドライバーの様な higu> 気がしています. higu> higu> ひょっとすると過去に何度もこの手の問題がこのMLに展開され, higu> メンバーの方々もウンザリするかも知れませんが,何か解決 higu> する情報がございましたらお願いいたします. higu> 特に Intel Ether Pro 1000B を使われて成功された方から higu> 何か得られれば幸いです. higu> higu> #eitを使わず,各PCにredhat を入れた上でrpmで計算機用の higu> #kernelにアップデート等を施した方が早いでしょうか? higu> higu> ちなみに,こちらの並列(未だ動いていない)計算機群環境は higu> 以下の様になります: higu> ・PIII  1U ラックマウントモデル(dual proc.:ぷらっとホーム製)×4 higu> ・SCSI HDD 18GB 搭載. higu> ・オンボードのether express pro ×2はbiosで殺してあります. higu> ・PCIスロットにIntel Ether Pro 1000B をinstallしてあります. higu> ・サーバーも計算機の頭数に入れるようにeitでは設定しました. higu> higu> お手数をおかけしますが,よろしくお願いします. higu> higu> 樋口 higu> higu> /************************************************ higu> 樋口篤志 名古屋大学地球水循環研究センター higu>  〒464-8601 名古屋市千種区不老町 higu> Tel: 052-789-5467 Fax: 052-789-3436 higu> e-mail: higu @ ihas.nagoya-u.ac.jp (official) higu> ahiguchi @ mui.biglobe.ne.jp (unofficial) higu> URL:http://rc.ihas.nagoya-u.ac.jp/~higu/ higu> **************************************************/ ------ Shinji Sumimoto, Fujitsu Labs From Enomoto.Hiroshi @ wrc.melco.co.jp Thu Apr 18 17:47:01 2002 From: Enomoto.Hiroshi @ wrc.melco.co.jp (Hiroshi Enomoto) Date: Thu, 18 Apr 2002 17:47:01 +0900 Subject: [SCore-users-jp] =?iso-2022-jp?B?TXlyaW5ldCAbJEIlRiU5JUg8OkdUJE44NjB4GyhC?= References: <200204120839.g3C8dvv09167@yl-dhcp18.is.s.u-tokyo.ac.jp> <00fe01c1e43e$3c726600$c0cc8c0a@ENOMOTO> <20020415143413C.s-sumi@flab.fujitsu.co.jp> Message-ID: <003601c1e6b5$9b9b7490$c0cc8c0a@ENOMOTO> 住元様、亀山様。 三菱電機 榎本です。 Myrinetテスト失敗の原因を突き止めましたので報告致します。 まず、結論として、 ASUS P4T-EのBIOSのIRQ設定をAUTOにすると、 MyrinetとEthernetのNICが同じIRQに割り当てられてしまうことが原因でした。 RedHat,SCoreをインストールした後、NICのIRQ設定を書き換えて重複を避けると Myrinetテストがうまくいき、Mandelのデモプログラムも動きました。 以下のような現象が見受けられ、カードの位置や相性といったことに 目を向けていたため、原因の特定にかなり時間がかかってしまいました。 ?当初、弊社山本がインストールしたときには、全く同じ設定でインストール   したにも関わらず、ちゃんと動いていた。  (IRQが重複していても、そういうことはありうる?) ?linuxconf から、EthernetNICのIRQを変えれば値は変わるものと思っていたが、  /proc/pci の値には反映されなかった。  (これはこういうものなのでしょうか?) ?MyrinetのPoint-to-Point通信(メッセージ)で、カードの位置によって  終了時にマシンが落ちる場合と落ちない場合があった。 原因の特定にあたり、色々とアドバイスありがとうございました。 この問題の解決が、新たにSCoreをインストールしようとして いる方への参考になればと思います。 以上 ============================================= 三菱電機株式会社 先端技術総合研究所   電力システム技術部 配電システムグループ         榎本 博 TEL: 06-6497-7635 FAX : 06-6497-7727 E-mail: Enomoto.Hiroshi @ wrc.melco.co.jp ============================================= From s-sumi @ flab.fujitsu.co.jp Thu Apr 18 17:56:42 2002 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Thu, 18 Apr 2002 17:56:42 +0900 Subject: [SCore-users-jp] Re: Myrinet =?iso-2022-jp?B?GyRCJUYlOSVIPDpHVCROODYweBsoQg==?= In-Reply-To: <003601c1e6b5$9b9b7490$c0cc8c0a@ENOMOTO> References: <00fe01c1e43e$3c726600$c0cc8c0a@ENOMOTO> <20020415143413C.s-sumi@flab.fujitsu.co.jp> <003601c1e6b5$9b9b7490$c0cc8c0a@ENOMOTO> Message-ID: <20020418175642I.s-sumi@flab.fujitsu.co.jp> 榎本様 住元です。 情報どうもありがとうございます。同じマザーボードを使っていて同じ現象に困っ ているユーザが海外にいますので、この情報を伝えたいと思っています。 それで、いくつか確認したいのですが、、 結局、BIOSの設定でIRQをAutoを解除(とIRQの設定?)すればよいのでしょうか? Linux上でIRQの操作をするのでしょうか? From: "Hiroshi Enomoto" Subject: Myrinet テスト失敗の原因 Date: Thu, 18 Apr 2002 17:47:01 +0900 Message-ID: <003601c1e6b5$9b9b7490$c0cc8c0a @ ENOMOTO> Enomoto.Hiroshi> 住元様、亀山様。 Enomoto.Hiroshi> Enomoto.Hiroshi> 三菱電機 榎本です。 Enomoto.Hiroshi> Myrinetテスト失敗の原因を突き止めましたので報告致します。 Enomoto.Hiroshi> Enomoto.Hiroshi> まず、結論として、 Enomoto.Hiroshi> ASUS P4T-EのBIOSのIRQ設定をAUTOにすると、 Enomoto.Hiroshi> MyrinetとEthernetのNICが同じIRQに割り当てられてしまうことが原因でした。 Enomoto.Hiroshi> RedHat,SCoreをインストールした後、NICのIRQ設定を書き換えて重複を避けると Enomoto.Hiroshi> Myrinetテストがうまくいき、Mandelのデモプログラムも動きました。 Enomoto.Hiroshi> Enomoto.Hiroshi> 以下のような現象が見受けられ、カードの位置や相性といったことに Enomoto.Hiroshi> 目を向けていたため、原因の特定にかなり時間がかかってしまいました。 Enomoto.Hiroshi> Enomoto.Hiroshi> ?当初、弊社山本がインストールしたときには、全く同じ設定でインストール Enomoto.Hiroshi>   したにも関わらず、ちゃんと動いていた。 Enomoto.Hiroshi>  (IRQが重複していても、そういうことはありうる?) Enomoto.Hiroshi> ?linuxconf から、EthernetNICのIRQを変えれば値は変わるものと思っていたが、 Enomoto.Hiroshi>  /proc/pci の値には反映されなかった。 Enomoto.Hiroshi>  (これはこういうものなのでしょうか?) PCIのNICの場合は通常はBIOSが与えた値が利用されます。APICを使っている場合 は、違いますが、、 Enomoto.Hiroshi> ?MyrinetのPoint-to-Point通信(メッセージ)で、カードの位置によって Enomoto.Hiroshi>  終了時にマシンが落ちる場合と落ちない場合があった。 Enomoto.Hiroshi> Enomoto.Hiroshi> 原因の特定にあたり、色々とアドバイスありがとうございました。 Enomoto.Hiroshi> Enomoto.Hiroshi> この問題の解決が、新たにSCoreをインストールしようとして Enomoto.Hiroshi> いる方への参考になればと思います。 Enomoto.Hiroshi> Enomoto.Hiroshi> 以上 Enomoto.Hiroshi> Enomoto.Hiroshi> ============================================= Enomoto.Hiroshi> 三菱電機株式会社 先端技術総合研究所 Enomoto.Hiroshi>   電力システム技術部 配電システムグループ Enomoto.Hiroshi>         榎本 博 Enomoto.Hiroshi> TEL: 06-6497-7635 Enomoto.Hiroshi> FAX : 06-6497-7727 Enomoto.Hiroshi> E-mail: Enomoto.Hiroshi @ wrc.melco.co.jp Enomoto.Hiroshi> ============================================= Enomoto.Hiroshi> Enomoto.Hiroshi> ------ Shinji Sumimoto, Fujitsu Labs From Enomoto.Hiroshi @ wrc.melco.co.jp Thu Apr 18 19:42:03 2002 From: Enomoto.Hiroshi @ wrc.melco.co.jp (Hiroshi Enomoto) Date: Thu, 18 Apr 2002 19:42:03 +0900 Subject: [SCore-users-jp] =?iso-2022-jp?B?UmU6IFtTQ29yZS11c2Vycy1qcF0gUmU6IE15cmluZXQgGyRCJUYbKEI=?= =?iso-2022-jp?B?GyRCJTklSDw6R1QkTjg2MHgbKEI=?= References: <00fe01c1e43e$3c726600$c0cc8c0a@ENOMOTO> <20020415143413C.s-sumi@flab.fujitsu.co.jp> <003601c1e6b5$9b9b7490$c0cc8c0a@ENOMOTO> <20020418175642I.s-sumi@flab.fujitsu.co.jp> Message-ID: <007a01c1e6c5$af456130$c0cc8c0a@ENOMOTO> 住元様。 三菱電機 榎本です。 > それで、いくつか確認したいのですが、、 > > 結局、BIOSの設定でIRQをAutoを解除(とIRQの設定?)すればよいのでしょうか? > Linux上でIRQの操作をするのでしょうか? BIOSでIRQの設定をします。 Autoの場合、Myrinet,EthernetのIRQは、USBなど使ってないデバイス と共に、IRQは9に設定されてました。 そこで、EthernetのIRQを10に、MyrinetのIRQを11に割り当ててみたところ 動作しました。 以上 ============================================= 三菱電機株式会社 先端技術総合研究所   電力システム技術部 配電システムグループ         榎本 博 TEL: 06-6497-7635 FAX : 06-6497-7727 E-mail: Enomoto.Hiroshi @ wrc.melco.co.jp ============================================= From s-sumi @ flab.fujitsu.co.jp Thu Apr 18 19:43:26 2002 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Thu, 18 Apr 2002 19:43:26 +0900 Subject: [SCore-users-jp] Re: Myrinet =?iso-2022-jp?B?GyRCJUYlOSVIPDpHVCROODYweBsoQg==?= In-Reply-To: <007a01c1e6c5$af456130$c0cc8c0a@ENOMOTO> References: <003601c1e6b5$9b9b7490$c0cc8c0a@ENOMOTO> <20020418175642I.s-sumi@flab.fujitsu.co.jp> <007a01c1e6c5$af456130$c0cc8c0a@ENOMOTO> Message-ID: <20020418194326S.s-sumi@flab.fujitsu.co.jp> 榎本様 住元です。 情報ありがとうございました。 From: "Hiroshi Enomoto" Subject: Re: [SCore-users-jp] Re: Myrinet テスト失敗の原因 Date: Thu, 18 Apr 2002 19:42:03 +0900 Message-ID: <007a01c1e6c5$af456130$c0cc8c0a @ ENOMOTO> Enomoto.Hiroshi> 住元様。 Enomoto.Hiroshi> Enomoto.Hiroshi> 三菱電機 榎本です。 Enomoto.Hiroshi> Enomoto.Hiroshi> > それで、いくつか確認したいのですが、、 Enomoto.Hiroshi> > Enomoto.Hiroshi> > 結局、BIOSの設定でIRQをAutoを解除(とIRQの設定?)すればよいのでしょうか? Enomoto.Hiroshi> > Linux上でIRQの操作をするのでしょうか? Enomoto.Hiroshi> Enomoto.Hiroshi> BIOSでIRQの設定をします。 Enomoto.Hiroshi> Autoの場合、Myrinet,EthernetのIRQは、USBなど使ってないデバイス Enomoto.Hiroshi> と共に、IRQは9に設定されてました。 Enomoto.Hiroshi> そこで、EthernetのIRQを10に、MyrinetのIRQを11に割り当ててみたところ Enomoto.Hiroshi> 動作しました。 Enomoto.Hiroshi> Enomoto.Hiroshi> Enomoto.Hiroshi> 以上 Enomoto.Hiroshi> Enomoto.Hiroshi> ============================================= Enomoto.Hiroshi> 三菱電機株式会社 先端技術総合研究所 Enomoto.Hiroshi>   電力システム技術部 配電システムグループ Enomoto.Hiroshi>         榎本 博 Enomoto.Hiroshi> TEL: 06-6497-7635 Enomoto.Hiroshi> FAX : 06-6497-7727 Enomoto.Hiroshi> E-mail: Enomoto.Hiroshi @ wrc.melco.co.jp Enomoto.Hiroshi> ============================================= Enomoto.Hiroshi> Enomoto.Hiroshi> ------ Shinji Sumimoto, Fujitsu Labs From rafmet @ mat.uni.torun.pl Tue Apr 23 19:33:38 2002 From: rafmet @ mat.uni.torun.pl (Rafal Metkowski) Date: Tue, 23 Apr 2002 12:33:38 +0200 (CEST) Subject: [SCore-users-jp] [SCore-users] Gigabit ethernet Message-ID: Hi, What vendors/types of gigabit ethernet adapters does SCore support ? Which gigabit ethernet adapters and switches do you recommend for use with SCore ? Thanks, Rafal -- Rafal Metkowski Registered Linux User # 169641 _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From s-sumi @ flab.fujitsu.co.jp Wed Apr 24 15:52:40 2002 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Wed, 24 Apr 2002 15:52:40 +0900 Subject: [SCore-users-jp] Re: [SCore-users] Gigabit ethernet In-Reply-To: References: Message-ID: <20020424155240I.s-sumi@flab.fujitsu.co.jp> Hi. PM/Ethernet does not depend on Ethernet NIC and Switch Hardware. However, communication performance on PM/Ethernet (of course TCP/IP) is depend on NIC hardware. NICs: We have tested SCore on Syskonnect SK98xx, Intel PRO/1000T(XT), Brordcom 57xx based(such as 3Com996, Syskonnect 9Dxx), PacketEngines G-NIC II, and NS DP83820 based NICs. At the point of communication performance view, we recommend the Intel PRO/1000T(XT) and Syskonnect SK98xx (not 9Dxx). Switches: Most of Gigabit Ethernet Switches can be used on SCore. We have tested our system on Summit 7i (32 port 1000BASE/SX). How many number of cluster nodes are you planning to build? Shinji. From: Rafal Metkowski Subject: [SCore-users] Gigabit ethernet Date: Tue, 23 Apr 2002 12:33:38 +0200 (CEST) Message-ID: rafmet> Hi, rafmet> rafmet> What vendors/types of gigabit ethernet adapters does SCore support ? rafmet> Which gigabit ethernet adapters and switches do you recommend for use rafmet> with SCore ? rafmet> rafmet> Thanks, rafmet> rafmet> Rafal rafmet> rafmet> -- rafmet> Rafal Metkowski rafmet> Registered Linux User # 169641 rafmet> rafmet> rafmet> rafmet> _______________________________________________ rafmet> SCore-users mailing list rafmet> SCore-users @ pccluster.org rafmet> http://www.pccluster.org/mailman/listinfo/score-users rafmet> rafmet> ------ Shinji Sumimoto, Fujitsu Labs _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From rafmet @ mat.uni.torun.pl Wed Apr 24 17:32:34 2002 From: rafmet @ mat.uni.torun.pl (Rafal Metkowski) Date: Wed, 24 Apr 2002 10:32:34 +0200 (CEST) Subject: [SCore-users-jp] Re: [SCore-users] Gigabit ethernet In-Reply-To: <20020424155240I.s-sumi@flab.fujitsu.co.jp> Message-ID: On Wed, 24 Apr 2002, Shinji Sumimoto wrote: > Hi. > > PM/Ethernet does not depend on Ethernet NIC and Switch Hardware. > However, communication performance on PM/Ethernet (of course TCP/IP) > is depend on NIC hardware. > > NICs: We have tested SCore on Syskonnect SK98xx, Intel PRO/1000T(XT), > Brordcom 57xx based(such as 3Com996, Syskonnect 9Dxx), PacketEngines > G-NIC II, and NS DP83820 based NICs. > > At the point of communication performance view, we recommend the Intel > PRO/1000T(XT) and Syskonnect SK98xx (not 9Dxx). > > Switches: > Most of Gigabit Ethernet Switches can be used on SCore. > We have tested our system on Summit 7i (32 port 1000BASE/SX). > > How many number of cluster nodes are you planning to build? We plan to connect eleven SMP nodes using Gigabit Ethernet. We are already using SCore on Fast Ethernet. Thanks for advice Rafal -- Rafal Metkowski Registered Linux User # 169641 _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Thu Apr 25 10:38:56 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Thu, 25 Apr 2002 10:38:56 +0900 Subject: [SCore-users-jp] [SCore-users] SCore 5.0.1 released Message-ID: <200204250138.g3P1cuv10264@yl-dhcp18.is.s.u-tokyo.ac.jp> We are happy to announce the SCore 5.0.1 release. Please visit the following URL to obtain the package. http://www.pccluster.org/score/dist/ SCore 5.0.1 s a bug-fix release for the SCore 5.0. Following bugs are fixed in SCore 5.0: kernel kernel hangs to exec mandel on PM/Eternet. PM/Ethernet don't work on RealTek Ethernet cards. SCore Wrong usage on /etc/rc.d/init.d/pbs* usage. Don't use mpif90 on Fujitsu compiler. scout fails if server host only FQDN hostname. On single user mode, scout done still scored don't done completely. RPM update replace /etc/profile.d/score.sh and score.csh. mpich jumpshot is not include in binary rpm. mpif90 dosen't work. doc bug fix rsh-all and scbcast description in Japanese man page. util rsh-all dosen't work with -i option. build make returns exit status 1. Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users