From a347802r @ tobata.isc.kyutech.ac.jp Fri Nov 1 14:31:46 2002 From: a347802r @ tobata.isc.kyutech.ac.jp (iida ryousuke) Date: Fri, 01 Nov 2002 14:31:46 +0900 Subject: [SCore-users-jp] Score起動上でのOpenMPのコンパイルおよび実行コマンドについて Message-ID: <3DC211C2.8080504@tobata.isc.kyutech.ac.jp> 九州工業大学の飯田と申します。Scoreを起動させてプログラム(28-1.c)をコン パイル、実行を行おうとすると、以下のようなメッセージが表示され、プログラ ムが実行できません。これは、プログラム自体にエラーがあるのでしょうか。も しくは、コンパイル、実行コマンドが間違っているのですか。 $ omcc -omniconfig=scash -O3 -o 28-1 28-1.c -lm Compiling '28-1.c'... $ scrun -nodes=1*2 ./28-1 SCore-D 5.0.1 connected. <0> SCORE-D:WARNING Unable to change directory (/home/kaimen/omp/10), and set to /var/scored/singleuser/500/jobs/jid-1. <0:0> SCORE: One node ready. <0> SCORE: Program signaled (SIGSEGV). 九州工業大学 飯田良介 メールアドレス  From kameyama @ pccluster.org Fri Nov 1 14:29:20 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Fri, 01 Nov 2002 14:29:20 +0900 Subject: [SCore-users-jp] Score起動上でのOpenMP のコンパイルおよび実行コマンドについて In-Reply-To: Your message of "Fri, 01 Nov 2002 14:31:46 JST." <3DC211C2.8080504@tobata.isc.kyutech.ac.jp> Message-ID: <20021101052842.AC01320047@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <3DC211C2.8080504 @ tobata.isc.kyutech.ac.jp> iida ryousuke wrotes: > 九州工業大学の飯田と申します。Scoreを起動させてプログラム(28-1.c)をコン > パイル、実行を行おうとすると、以下のようなメッセージが表示され、プログラ > ムが実行できません。これは、プログラム自体にエラーがあるのでしょうか。も > しくは、コンパイル、実行コマンドが間違っているのですか。 どの可能性もありそうですが... > $ omcc -omniconfig=scash -O3 -o 28-1 28-1.c -lm > Compiling '28-1.c'... > $ scrun -nodes=1*2 ./28-1 とりあえず, scrun -nodes=1x2 ./28-1 ~ で動かしてみてください. (1 host 2 processor で動かすのは 2*1 ではなくて 2x1 です. 現在は > <0:0> SCORE: One node ready. 1 プロセスで動いています. from Kameyama Toyohisa From a347802r @ tobata.isc.kyutech.ac.jp Fri Nov 1 16:13:58 2002 From: a347802r @ tobata.isc.kyutech.ac.jp (iida ryousuke) Date: Fri, 01 Nov 2002 16:13:58 +0900 Subject: [SCore-users-jp] Score起動時におけるOpenMPについて Message-ID: <3DC229B6.9070003@tobata.isc.kyutech.ac.jp> 九州工業大学の飯田です。 scrun ‐nodes=2x1 ./28-1 で実行してみたところ以下のようになりました。 どのように対処すればよいですか。 $ omcc -omniconfig=scash -O3 -o 28-1 28-1.c -lm Compiling '28-1.c'... $ scrun -nodes=2x1 ./28-1 FEP:ERROR SCore-D Login failed :Resouce unavailable. 九州工業大学 飯田良介 メールアドレス  From kameyama @ pccluster.org Fri Nov 1 16:16:04 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Fri, 01 Nov 2002 16:16:04 +0900 Subject: [SCore-users-jp] Score起動時におけるOpenMP について In-Reply-To: Your message of "Fri, 01 Nov 2002 16:13:58 JST." <3DC229B6.9070003@tobata.isc.kyutech.ac.jp> Message-ID: <20021101071525.3ECC02004C@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <3DC229B6.9070003 @ tobata.isc.kyutech.ac.jp> iida ryousuke wrotes: > scrun ‐nodes=2x1 ./28-1 で実行してみたところ以下のようになりました。 > どのように対処すればよいですか。 > > $ omcc -omniconfig=scash -O3 -o 28-1 28-1.c -lm > Compiling '28-1.c'... > $ scrun -nodes=2x1 ./28-1 > FEP:ERROR SCore-D Login failed :Resouce unavailable. 2x1 というと 2 host で実行することになります. エラーメッセージから考えると, 2 host 使用できなかった可能性が 高そうです. scout を起動した時, 何 host 確保していますでしょうか? 1 host だけ確保したとき $ scout -g host1 とか $ scout -g group -n 1 とかのように 1 host しか確保していない場合はプログラムは 2 host で動いて くれません. 一旦 scout を抜けてより多くの host を確保して scout を再起動する必要があります. from Kameyama Toyohisa From emile.carcamo @ nec.fr Sat Nov 2 03:12:29 2002 From: emile.carcamo @ nec.fr (Emile CARCAMO) Date: Fri, 01 Nov 2002 19:12:29 +0100 Subject: [SCore-users-jp] [SCore-users] Installing SCore 5.2.0 Message-ID: <200211011812.gA1ICT102466@emilepc.ess.nec.fr> Dear list members, On the master machine, I installed a RedHat 7.3 from scratch (no upgrade in my case). Then I run ./Install from the SCore 5.2.0 CDROM. The install of ALL of the SCore RPM's failed simply because the libglut.so.3 is needed by the "user RPM". To fix that is- sue, you need to install Mesa-3.4.2-7 from the RedHat 7.2 CDROM or grab it from the RPMfind site (http://rpmfind.net). To get rid of a file conflict, I was obliged to invoke "rpm -i Mesa-3.4.2-7.i386.rpm --force". The rest of the install process went very smoothly. I also noticed on the compute nodes that some links to startup crond are missing under /etc/rc.d tree : /etc/rc.d/rc2.d/S90crond -> ../init.d/crond /etc/rc.d/rc3.d/S90crond -> ../init.d/crond /etc/rc.d/rc4.d/S90crond -> ../init.d/crond /etc/rc.d/rc5.d/S90crond -> ../init.d/crond I always have to redo them by hand. Hope that helps. Regards, -- Emile_CARCAMO NEC European http://www.ess.nec.de System Engineer Supercomputer mailto:emile.carcamo @ nec.fr Systems France GSM mailto:emile.carcamo @ orange.fr (+33)1-3930-6601 FAX (+33)1-3930-6613 PHONE / Your mouse has moved. Windows NT must be restarted \ (+33)6-8063-7003 GSM \ for the change to take effect. Reboot now? [ OK ] / _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From e973220 @ eve.u-ryukyu.ac.jp Mon Nov 4 19:09:21 2002 From: e973220 @ eve.u-ryukyu.ac.jp (金城 尚志) Date: Mon, 4 Nov 2002 19:09:21 +0900 Subject: [SCore-users-jp] NPB make.def について In-Reply-To: <3DB8BA20.2020205@tobata.isc.kyutech.ac.jp> Message-ID: 琉球大学の金城です。 今回、質問があってメールをさせてもらっております。 よろしく御願いします。 【質問】 NAS Parallel Benchmark (NPB)の、make.def はどのように設定したらよいのでしょうか? 【問題点】 NPB2.3のディレクトリで makeができません。 【試みたこと】 スレッド:[devel] [SCore-users-jp] NPBについ て http://www.pccluster.org/pipermail/score-users-jp/2001-December/000002.html を参考にして、make.def を 記述しました。 【エラーメッセージ】 make コマンドを打った後、 コンパイル時に次のようなエラーメッセージがでます。 $ make lu NPROCS=4 CLASS=S (略) /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(irecv.o)(.text+0x4 c): more undefined references to `_kio' follow collect2: ld returned 1 exit status make[1]: *** [../bin/lu.S.4] Error 1 make[1]: Leaving directory `/home/kinjo/NPB2.3/LU' make: *** [lu] Error 2 【こうなって欲しい!】 make を成功させ 実行ファイルを手に入れたい。 【開発環境】 ・SCore 5.0.1 ・RedHat Linux 7.3 (フルインストール) ・NPB2.3 以上です。 稚拙な説明かもしれませんが、ご教授をよろしく御願いします。 ━┛━┛━┛━┛━┛━┛━┛━┛━┛   琉球大学理学部 物質地球科学科   金城 尚志 (キンジョウヒサシ) ━┛━┛━┛━┛━┛━┛━┛━┛━┛ From ishikawa @ is.s.u-tokyo.ac.jp Mon Nov 4 19:49:07 2002 From: ishikawa @ is.s.u-tokyo.ac.jp (Yutaka Ishikawa) Date: Mon, 04 Nov 2002 19:49:07 +0900 (JST) Subject: [SCore-users-jp] NPB make.def について In-Reply-To: References: <3DB8BA20.2020205@tobata.isc.kyutech.ac.jp> Message-ID: <20021104.194907.783378289.ishikawa@is.s.u-tokyo.ac.jp> From: "金城 尚志" > /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(irecv.o)(.text+0x4 このメッセージを見る限り、SCoreのMPIをリンクしていないように見えます。 % which mpif77 で、確かに、SCoreのMPIすなわち、 /opt/score/bin/mpif77 が使われているか確認してみて下さい。 石川 From emile.carcamo @ nec.fr Mon Nov 4 22:02:49 2002 From: emile.carcamo @ nec.fr (Emile CARCAMO) Date: Mon, 04 Nov 2002 14:02:49 +0100 Subject: [SCore-users-jp] [SCore-users] Installing SCore 5.2.0 Message-ID: <200211041302.gA4D2n702556@emilepc.ess.nec.fr> Dear list members, On the master machine, I installed a RedHat 7.3 from scratch (no upgrade in my case). Then I run ./Install from the SCore 5.2.0 CDROM. The install of ALL of the SCore RPM's failed simply because the libglut.so.3 is needed by the "user RPM". To fix that is- sue, you need to install Mesa-3.4.2-7 from the RedHat 7.2 CDROM or grab it from the RPMfind site (http://rpmfind.net). To get rid of a file conflict, I was obliged to invoke "rpm -i Mesa-3.4.2-7.i386.rpm --force". The rest of the install process went very smoothly. I also noticed on the compute nodes that some links to startup crond are missing under /etc/rc.d tree : /etc/rc.d/rc2.d/S90crond -> ../init.d/crond /etc/rc.d/rc3.d/S90crond -> ../init.d/crond /etc/rc.d/rc4.d/S90crond -> ../init.d/crond /etc/rc.d/rc5.d/S90crond -> ../init.d/crond I always have to redo them by hand. Hope that helps. Regards, -- Emile_CARCAMO NEC European http://www.ess.nec.de System Engineer Supercomputer mailto:emile.carcamo @ nec.fr Systems France GSM mailto:emile.carcamo @ orange.fr (+33)1-3930-6601 FAX (+33)1-3930-6613 PHONE / Your mouse has moved. Windows NT must be restarted \ (+33)6-8063-7003 GSM \ for the change to take effect. Reboot now? [ OK ] / _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From e973220 @ eve.u-ryukyu.ac.jp Mon Nov 4 23:01:17 2002 From: e973220 @ eve.u-ryukyu.ac.jp (金城 尚志) Date: Mon, 4 Nov 2002 23:01:17 +0900 Subject: [SCore-users-jp] NPB make.def について In-Reply-To: <20021104.194907.783378289.ishikawa@is.s.u-tokyo.ac.jp> Message-ID: 琉球大の金城です。 > % which mpif77 >で、確かに、SCoreのMPIすなわち、 > /opt/score/bin/mpif77 >が使われているか確認してみて下さい。 はい、以下確認してみました。 どうやら、リンクは通っているようです。 $ which mpif77 /opt/score/bin/mpif77 もう一度、LUをmake コンパイルするコマンドを 行いましたが、前と同様のエラーが発生し makeは成功しませんでした。 $ make lu NPROCS=4 CLASS=A (略) wait.o(.text+0xbd): undefined reference to `_kio' wait.o(.text+0xc3): undefined reference to `_kio' wait.o(.text+0x1ba): undefined reference to `_kio' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(irecv.o)(.text+0x4 c): more undefined references to `_kio' follow collect2: ld returned 1 exit status make[1]: *** [../bin/lu.S.4] Error 1 make[1]: Leaving directory `/home/kinjo/NPB2.3/LU' make: *** [lu] Error 2 これだけでは、情報不足かもしれませんが どうかよろしく御願いします。 ━┛━┛━┛━┛━┛━┛━┛━┛━┛   琉球大学理学部 物質地球科学科   金城 尚志 (キンジョウヒサシ) ━┛━┛━┛━┛━┛━┛━┛━┛━┛ From nrcb @ streamline-computing.com Mon Nov 4 23:41:17 2002 From: nrcb @ streamline-computing.com (Nick Birkett) Date: Mon, 4 Nov 2002 14:41:17 +0000 Subject: [SCore-users-jp] [SCore-users] SCore 5.2.0 Message-ID: <200211041441.gA4EfHI02098@zeralda.streamline.com> Does SCore 5.2 EIT come with PXE boot, or do we have to add it like for 5.0.1 ? Cheers, Nick _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From ishikawa @ is.s.u-tokyo.ac.jp Tue Nov 5 07:17:29 2002 From: ishikawa @ is.s.u-tokyo.ac.jp (Yutaka Ishikawa) Date: Tue, 05 Nov 2002 07:17:29 +0900 (JST) Subject: [SCore-users-jp] [SCore-users] SCore 5.2.0 In-Reply-To: <200211041441.gA4EfHI02098@zeralda.streamline.com> References: <200211041441.gA4EfHI02098@zeralda.streamline.com> Message-ID: <20021105.071729.607958422.ishikawa@is.s.u-tokyo.ac.jp> > Does SCore 5.2 EIT come with PXE boot, or do we have to add it like for 5.0.1 > ? I'm sorry, but I did not have a time to integrate your effort to the 5.2 EIT. But I would like to do in the next release, i.e., the end of the next February. Sincerely, Yutaka Ishikawa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Tue Nov 5 09:38:36 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Tue, 05 Nov 2002 09:38:36 +0900 Subject: [SCore-users-jp] Re: [SCore-users] Installing SCore 5.2.0 In-Reply-To: Your message of "Fri, 01 Nov 2002 19:12:29 JST." <200211011812.gA1ICT102466@emilepc.ess.nec.fr> Message-ID: <20021105003719.C47692003C@neal.il.is.s.u-tokyo.ac.jp> In article <200211011812.gA1ICT102466 @ emilepc.ess.nec.fr> Emile CARCAMO wrotes: > The install of ALL of the SCore RPM's failed simply because > the libglut.so.3 is needed by the "user RPM". To fix that is- > sue, you need to install Mesa-3.4.2-7 from the RedHat 7.2 > CDROM or grab it from the RPMfind site (http://rpmfind.net). You don't need to install any RedHat 7.2 rpms. libglut.so is include glut-3.7-4.i386.rpm on RdHat 7.3. Please install glut-3.7-4.i386.rpm. > I also noticed on the compute nodes that > some links to startup crond are missing under /etc/rc.d tree : > > /etc/rc.d/rc2.d/S90crond -> ../init.d/crond > /etc/rc.d/rc3.d/S90crond -> ../init.d/crond > /etc/rc.d/rc4.d/S90crond -> ../init.d/crond > /etc/rc.d/rc5.d/S90crond -> ../init.d/crond > > I always have to redo them by hand. Hope that helps. Regards, This link is deleted in EIT. If you don't want this, please issue following command before start EIT: # echo /sbin/chkconfig --add crond > /opt/score/setup/install/pcc-env.sh # chmod a+x /opt/score/setup/install/pcc-env.sh from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Tue Nov 5 10:07:51 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Tue, 05 Nov 2002 10:07:51 +0900 Subject: [SCore-users-jp] NPB make.def について In-Reply-To: Your message of "Mon, 04 Nov 2002 23:01:17 JST." Message-ID: <20021105010633.EB0892003E@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article "金城 尚志" wrotes: > はい、以下確認してみました。 > どうやら、リンクは通っているようです。 > > $ which mpif77 > /opt/score/bin/mpif77 あの mail の内容はともかくとして, mpif77 は mpi library の位置を知っているので, FMPI_LIB, FMPI_INC などは指定しなくて構いません. ポイントは以下です. 1. mpi プログラムの compile および link のためには /opt/score/bin/mpi* を使用する. MPIF77. FLINK は /opt/score/bin/mpif77 を MPICC, CLINK は /opt/score/bin/mpicc を使用するようにしてください. (ここの指定を full path にしておけば, 環境変数の設定を あまり気にせずにすみます. 2. RAND を randdp にする もしかしたら, gnu compiler 以外のコンパイラを使用する場合には 違って来るかもしれませんが... 3. FMPI_LIB, FMPI_INC などは設定する必要はありません. コンパイラやバージョンによって異なるので, むしろ指定しないほうが トラブルが少ないと思います. 4. FFLAGS, CFLAGS などはコンパイラに合わせて設定する. -O フラグら -mcpu= フラグなどを適宜指定すれば速くなる可能性があります. まず, 1 から 3 を確認してみてください. > もう一度、LUをmake コンパイルするコマンドを > 行いましたが、前と同様のエラーが発生し > makeは成功しませんでした。 > > $ make lu NPROCS=4 CLASS=A > (略) この略した部分 (どのようなコマンドおよびオプションで compile および link を 行っているか) が分かると原因がはっきりすると思いますけど... from Kameyama Toyohisa From e973220 @ eve.u-ryukyu.ac.jp Tue Nov 5 13:08:48 2002 From: e973220 @ eve.u-ryukyu.ac.jp (金城 尚志) Date: Tue, 5 Nov 2002 13:08:48 +0900 Subject: [SCore-users-jp] NPB make.def について In-Reply-To: <20021105010633.EB0892003E@neal.il.is.s.u-tokyo.ac.jp> Message-ID: 琉球大の金城です。 【解決】 NPBのコンパイルの件、解決しました。 亀山さんの >3. FMPI_LIB, FMPI_INC などは設定する必要はありません. > コンパイラやバージョンによって異なるので, むしろ指定しないほうが > トラブルが少ないと思います. アドバイスを反映して、今までのFMPI_LIB, FMPI_INCの設定を コメントアウトしたらうまくコンパイルができました。 他は、なにも変更はしていません。 make.def ファイルを下に記述します。 あとついでに、最初のエラーメッセージも 記述しておきます。 非常に助かりました。どうもありがとうございました。 ━┛━┛━┛━┛━┛━┛━┛━┛━┛   琉球大学理学部 物質地球科学科   金城 尚志 (キンジョウヒサシ) ━┛━┛━┛━┛━┛━┛━┛━┛━┛ ■make.def #--------------------------------------------------------------------------- # # SITE- AND/OR PLATFORM-SPECIFIC DEFINITIONS. # #--------------------------------------------------------------------------- #--------------------------------------------------------------------------- # Items in this file will need to be changed for each platform. # (Note these definitions are inconsistent with NPB2.1.) #--------------------------------------------------------------------------- #--------------------------------------------------------------------------- # Parallel Fortran: # # For CG, EP, FT, MG, LU, SP and BT, which are in Fortran, the following must # be defined: # # MPIF77 - Fortran compiler # FFLAGS - Fortran compilation arguments # FMPI_INC - any -I arguments required for compiling MPI/Fortran # FLINK - Fortran linker # FLINKFLAGS - Fortran linker arguments # FMPI_LIB - any -L and -l arguments required for linking MPI/Fortran # # compilations are done with $(MPIF77) $(FMPI_INC) $(FFLAGS) or # $(MPIF77) $(FFLAGS) # linking is done with $(FLINK) $(FMPI_LIB) $(FLINKFLAGS) #--------------------------------------------------------------------------- #--------------------------------------------------------------------------- # This is the fortran compiler used for MPI programs #--------------------------------------------------------------------------- #MPIF77 = f77 MPIF77 = /opt/score/bin/mpif77 # This links MPI fortran programs; usually the same as ${MPIF77} #FLINK = f77 FLINK = /opt/score/bin/mpif77 #--------------------------------------------------------------------------- # These macros are passed to the linker to help link with MPI correctly #--------------------------------------------------------------------------- #FMPI_LIB = -L/usr/local/lib -lmpi #FMPI_LIB = -L/opt/score/mpi/mpich-1.2.0/i386-redhat7-linux2_4/lib -lmpi #--------------------------------------------------------------------------- # These macros are passed to the compiler to help find 'mpif.h' #--------------------------------------------------------------------------- #FMPI_INC = -I/usr/local/include #FMPI_INC = -I/opt/score/mpi/mpich-1.2.0/i386-redhat7-linux2_4/include #--------------------------------------------------------------------------- # Global *compile time* flags for Fortran programs #--------------------------------------------------------------------------- FFLAGS = -O3 # FFLAGS = -g #--------------------------------------------------------------------------- # Global *link time* flags. Flags for increasing maximum executable # size usually go here. #--------------------------------------------------------------------------- FLINKFLAGS = #--------------------------------------------------------------------------- # Parallel C: # # For IS, which is in C, the following must be defined: # # MPICC - C compiler # CFLAGS - C compilation arguments # CMPI_INC - any -I arguments required for compiling MPI/C # CLINK - C linker # CLINKFLAGS - C linker flags # CMPI_LIB - any -L and -l arguments required for linking MPI/C # # compilations are done with $(MPICC) $(CMPI_INC) $(CFLAGS) or # $(MPICC) $(CFLAGS) # linking is done with $(CLINK) $(CMPI_LIB) $(CLINKFLAGS) #--------------------------------------------------------------------------- #--------------------------------------------------------------------------- # This is the C compiler used for MPI programs #--------------------------------------------------------------------------- #MPICC = cc MPICC = /opt/score/bin/mpicc # This links MPI C programs; usually the same as ${MPICC} #CLINK = cc CLINK = /opt/score/bin/mpicc #--------------------------------------------------------------------------- # These macros are passed to the linker to help link with MPI correctly #--------------------------------------------------------------------------- #CMPI_LIB = -L/usr/local/lib -lmpi CMPI_LIB = -L/opt/score/mpi/mpich-1.2.0/i386-redhat7-linux2_4/lib -lmpi #--------------------------------------------------------------------------- # These macros are passed to the compiler to help find 'mpi.h' #--------------------------------------------------------------------------- #CMPI_INC = -I/usr/local/include CMPI_INC = -I/opt/score/mpi/mpich-1.2.0/i386-redhat7-linux2_4/include #--------------------------------------------------------------------------- # Global *compile time* flags for C programs #--------------------------------------------------------------------------- CFLAGS = -O3 # CFLAGS = -g #--------------------------------------------------------------------------- # Global *link time* flags. Flags for increasing maximum executable # size usually go here. #--------------------------------------------------------------------------- CLINKFLAGS = #--------------------------------------------------------------------------- # MPI dummy library: # # Uncomment if you want to use the MPI dummy library supplied by NAS instead # of the true message-passing library. The include file redefines several of # the above macros. It also invokes make in subdirectory MPI_dummy. Make # sure that no spaces or tabs precede include. #--------------------------------------------------------------------------- # include ../config/make.dummy #--------------------------------------------------------------------------- # Utilities C: # # This is the C compiler used to compile C utilities. Flags required by # this compiler go here also; typically there are few flags required; hence # there are no separate macros provided for such flags. #--------------------------------------------------------------------------- #CC = cc -g CC = /opt/score/bin/mpicc #--------------------------------------------------------------------------- # Destination of executables, relative to subdirs of the main directory. . #--------------------------------------------------------------------------- BINDIR = ../bin #--------------------------------------------------------------------------- # Some machines (e.g. Crays) have 128-bit DOUBLE PRECISION numbers, which # is twice the precision required for the NPB suite. A compiler flag # (e.g. -dp) can usually be used to change DOUBLE PRECISION variables to # 64 bits, but the MPI library may continue to send 128 bits. Short of # recompiling MPI, the solution is to use MPI_REAL to send these 64-bit # numbers, and MPI_COMPLEX to send their complex counterparts. Uncomment # the following line to enable this substitution. #--------------------------------------------------------------------------- # CONVERTFLAG = -DCONVERTDOUBLE #--------------------------------------------------------------------------- # The variable RAND controls which random number generator # is used. It is described in detail in Doc/README.install. # Use "randi8" unless there is a reason to use another one. # Other allowed values are "randi8_safe", "randdp" and "randdpvec" #--------------------------------------------------------------------------- #RAND = randi8 RAND = randdp # The following is highly reliable but may be slow: # RAND = randdp ■make 時のエラーメッセージ ========================================= = NAS Parallel Benchmarks 2.3 = = MPI/F77/C = ========================================= cd LU; make NPROCS=4 CLASS=S make[1]: Entering directory `/home/kinjo/NPB2.3/LU' make[2]: Entering directory `/home/kinjo/NPB2.3/sys' make[2]: Nothing to be done for `all'. make[2]: Leaving directory `/home/kinjo/NPB2.3/sys' ../sys/setparams lu 4 S /opt/score/bin/mpif77 -o ../bin/lu.S.4 lu.o init_comm.o read_input.o bcast_inputs.o proc_grid.o neighbors.o nodedim.o subdomain.o setcoeff.o sethyper.o setbv.o exact.o setiv.o erhs.o ssor.o exchange_1.o exchange_3.o exchange_4.o exchange_5.o exchange_6.o rhs.o l2norm.o jacld.o blts.o jacu.o buts.o error.o pintgr.o verify.o ../common/print_results.o ../common/timers.o -L/opt/score/mpi/mpich-1.2.0/i386-redhat7-linux2_4/lib -l mpi /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(MPI.o): In function `lam_F2C_argv': MPI.o(.text+0x41a): undefined reference to `argvadd' MPI.o(.text+0x45e): undefined reference to `argvfree' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(laminit.o): In function `lam_linit': laminit.o(.text+0x33): undefined reference to `kenter' laminit.o(.text+0x62): undefined reference to `show_help' laminit.o(.text+0xb7): undefined reference to `show_help' laminit.o(.text+0xd5): undefined reference to `_kio' laminit.o(.text+0xeb): undefined reference to `_kio' laminit.o(.text+0x101): undefined reference to `_kio' laminit.o(.text+0x112): undefined reference to `_kio' laminit.o(.text+0x120): undefined reference to `_kio' laminit.o(.text+0x129): undefined reference to `lpattach' laminit.o(.text+0x154): undefined reference to `kpause' laminit.o(.text+0x1b2): undefined reference to `_kio' laminit.o(.text+0x22d): undefined reference to `rpstate' laminit.o(.text+0x248): undefined reference to `_kio' laminit.o(.text+0x264): undefined reference to `_kio' laminit.o(.text+0x287): undefined reference to `stoi' laminit.o(.text+0x2b2): undefined reference to `nsend' laminit.o(.text+0x2d1): undefined reference to `_kio' laminit.o(.text+0x2db): undefined reference to `_kio' laminit.o(.text+0x334): undefined reference to `nrecv' laminit.o(.text+0x352): undefined reference to `_kio' laminit.o(.text+0x39c): undefined reference to `getnodeid' laminit.o(.text+0x3fe): undefined reference to `_kio' laminit.o(.text+0x40c): undefined reference to `_kio' laminit.o(.text+0x45a): undefined reference to `getnodeid' laminit.o(.text+0x473): undefined reference to `_kio' laminit.o(.text+0x48e): undefined reference to `_kio' laminit.o(.text+0x4c0): undefined reference to `_kio' laminit.o(.text+0x4e6): undefined reference to `_kio' laminit.o(.text+0x51a): undefined reference to `_kio' laminit.o(.text+0x591): undefined reference to `mrev4' laminit.o(.text+0x5a7): undefined reference to `lam_rtrstore' laminit.o(.text+0x5ce): undefined reference to `_kio' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(laminit.o): In function `lam_init_comm_world': laminit.o(.text+0x6e6): undefined reference to `_kio' laminit.o(.text+0x72b): undefined reference to `al_insert' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(laminit.o): In function `get_singleton_idx': laminit.o(.text+0x76b): undefined reference to `rpstate' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(laminit.o): In function `lam_get_proc_array': laminit.o(.text+0x7c4): undefined reference to `_kio' laminit.o(.text+0x7ce): undefined reference to `_kio' laminit.o(.text+0x7d6): undefined reference to `_kio' laminit.o(.text+0x7fc): undefined reference to `getntype' laminit.o(.text+0x82e): undefined reference to `_kio' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(laminited.o): In function `lam_initerr': laminited.o(.text+0x84): undefined reference to `show_help' laminited.o(.text+0x104): undefined reference to `show_help' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamprocs.o): In function `lam_procadd': lamprocs.o(.text+0x85): undefined reference to `al_init' lamprocs.o(.text+0xd4): undefined reference to `al_find' lamprocs.o(.text+0x101): undefined reference to `al_insert' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamprocs.o): In function `lam_procfind': lamprocs.o(.text+0x1a7): undefined reference to `al_find' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamprocs.o): In function `lam_procrm': lamprocs.o(.text+0x1d8): undefined reference to `al_delete' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamprocs.o): In function `lam_nextproc': lamprocs.o(.text+0x24a): undefined reference to `al_next' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamprocs.o): In function `lam_nukeprocs': lamprocs.o(.text+0x2a4): undefined reference to `al_free' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamtrace.o): In function `lam_tr_comm': lamtrace.o(.text+0x15): undefined reference to `_kio' lamtrace.o(.text+0x72): undefined reference to `getnodeid' lamtrace.o(.text+0x11d): undefined reference to `mrev4' lamtrace.o(.text+0x135): undefined reference to `lam_rtrstore' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamtrace.o): In function `lam_tr_dtype': lamtrace.o(.text+0x166): undefined reference to `_kio' lamtrace.o(.text+0x1af): undefined reference to `mrev4' lamtrace.o(.text+0x1ca): undefined reference to `lam_rtrstore' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamtrace.o): In function `lam_tr_timer': lamtrace.o(.text+0x217): undefined reference to `_kio' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamtrace.o): In function `lam_tr_off': lamtrace.o(.text+0x24a): undefined reference to `_kio' lamtrace.o(.text+0x25c): undefined reference to `_kio' lamtrace.o(.text+0x272): undefined reference to `lam_trpoint' lamtrace.o(.text+0x279): undefined reference to `getnodeid' lamtrace.o(.text+0x284): undefined reference to `rw' lamtrace.o(.text+0x293): undefined reference to `rw' lamtrace.o(.text+0x2a2): undefined reference to `rw' lamtrace.o(.text+0x2b1): undefined reference to `rw' lamtrace.o(.text+0x2c8): undefined reference to `rev8' lamtrace.o(.text+0x2d4): undefined reference to `rw' lamtrace.o(.text+0x2f7): undefined reference to `lam_rtrstore' lamtrace.o(.text+0x316): undefined reference to `rw' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamtrace.o): In function `lam_tr_on': lamtrace.o(.text+0x33b): undefined reference to `_kio' lamtrace.o(.text+0x34f): undefined reference to `_kio' lamtrace.o(.text+0x36b): undefined reference to `lam_trpoint' lamtrace.o(.text+0x372): undefined reference to `getnodeid' lamtrace.o(.text+0x37d): undefined reference to `rw' lamtrace.o(.text+0x38c): undefined reference to `rw' lamtrace.o(.text+0x39b): undefined reference to `rw' lamtrace.o(.text+0x3aa): undefined reference to `rw' lamtrace.o(.text+0x3c1): undefined reference to `rev8' lamtrace.o(.text+0x3ce): undefined reference to `rw' lamtrace.o(.text+0x3eb): undefined reference to `lam_rtrstore' lamtrace.o(.text+0x406): undefined reference to `rw' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamtrace.o): In function `lam_tr_init': lamtrace.o(.text+0x42e): undefined reference to `_kio' lamtrace.o(.text+0x468): undefined reference to `getnodeid' lamtrace.o(.text+0x470): undefined reference to `rw' lamtrace.o(.text+0x47f): undefined reference to `rw' lamtrace.o(.text+0x48e): undefined reference to `rw' lamtrace.o(.text+0x49d): undefined reference to `rw' lamtrace.o(.text+0x4b7): undefined reference to `rev8' lamtrace.o(.text+0x4fd): undefined reference to `rev8' lamtrace.o(.text+0x517): undefined reference to `lam_rtrstore' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamtrace.o): In function `lam_tr_msg': lamtrace.o(.text+0x56b): undefined reference to `lam_trpoint' lamtrace.o(.text+0x572): undefined reference to `getnodeid' lamtrace.o(.text+0x57d): undefined reference to `rw' lamtrace.o(.text+0x58c): undefined reference to `rw' lamtrace.o(.text+0x59b): undefined reference to `rw' lamtrace.o(.text+0x5a8): undefined reference to `rw' lamtrace.o(.text+0x5ba): undefined reference to `rev8' lamtrace.o(.text+0x636): undefined reference to `mrev4' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamtrace.o): In function `lam_tr_sub': lamtrace.o(.text+0x66b): undefined reference to `lam_trpoint' lamtrace.o(.text+0x672): undefined reference to `getnodeid' lamtrace.o(.text+0x67d): undefined reference to `rw' lamtrace.o(.text+0x68c): undefined reference to `rw' lamtrace.o(.text+0x69b): undefined reference to `rw' lamtrace.o(.text+0x6aa): undefined reference to `rw' lamtrace.o(.text+0x6b9): undefined reference to `rev8' lamtrace.o(.text+0x6cf): undefined reference to `mrev4' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamtrace.o): In function `lam_tr_cffstart': lamtrace.o(.text+0x8d5): undefined reference to `_kio' lamtrace.o(.text+0x8de): undefined reference to `_kio' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamtrace.o): In function `lam_tr_cffend': lamtrace.o(.text+0x92f): undefined reference to `_kio' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamtrace.o): In function `lam_tr_buoy': lamtrace.o(.text+0xa1f): undefined reference to `getnodeid' lamtrace.o(.text+0xa2a): undefined reference to `rw' lamtrace.o(.text+0xa39): undefined reference to `rw' lamtrace.o(.text+0xa48): undefined reference to `rw' lamtrace.o(.text+0xa57): undefined reference to `rw' lamtrace.o(.text+0xa66): undefined reference to `rev8' lamtrace.o(.text+0xaa5): undefined reference to `lam_rtrstore' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamtrace.o): In function `lam_tr_coloron': lamtrace.o(.text+0xb02): undefined reference to `getnodeid' lamtrace.o(.text+0xb0d): undefined reference to `rw' lamtrace.o(.text+0xb1c): undefined reference to `rw' lamtrace.o(.text+0xb2b): undefined reference to `rw' lamtrace.o(.text+0xb3a): undefined reference to `rw' lamtrace.o(.text+0xb4c): undefined reference to `rev8' lamtrace.o(.text+0xb54): undefined reference to `rw' lamtrace.o(.text+0xb61): undefined reference to `rw' lamtrace.o(.text+0xb6e): undefined reference to `rw' lamtrace.o(.text+0xb8b): undefined reference to `lam_rtrstore' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamtrace.o): In function `lam_tr_coloroff': lamtrace.o(.text+0xbde): undefined reference to `getnodeid' lamtrace.o(.text+0xbe9): undefined reference to `rw' lamtrace.o(.text+0xbf8): undefined reference to `rw' lamtrace.o(.text+0xc07): undefined reference to `rw' lamtrace.o(.text+0xc16): undefined reference to `rw' lamtrace.o(.text+0xc25): undefined reference to `rev8' lamtrace.o(.text+0xc3f): undefined reference to `lam_rtrstore' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamtrace.o): In function `lam_tr_commname': lamtrace.o(.text+0xca5): undefined reference to `getnodeid' lamtrace.o(.text+0xcb0): undefined reference to `rw' lamtrace.o(.text+0xcbf): undefined reference to `rw' lamtrace.o(.text+0xcce): undefined reference to `rw' lamtrace.o(.text+0xcdd): undefined reference to `rw' lamtrace.o(.text+0xcef): undefined reference to `rev8' lamtrace.o(.text+0xd18): undefined reference to `rw' lamtrace.o(.text+0xd38): undefined reference to `lam_rtrstore' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamtrace.o): In function `mkflatdtype': lamtrace.o(.text+0xdb7): undefined reference to `getnodeid' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamtrace.o): In function `lam_tr_timer': lamtrace.o(.text+0x22b): undefined reference to `ttime' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamupdown.o): In function `lam_resetfunc': lamupdown.o(.text+0xc5): undefined reference to `_kio' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamupdown.o): In function `lam_printfunc': lamupdown.o(.text+0x26d): undefined reference to `blktype' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamupdown.o): In function `lam_nukefunc': lamupdown.o(.text+0x2eb): undefined reference to `_kio' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(wtime.o): In function `MPI_Wtime': wtime.o(.text+0xa): undefined reference to `ttime' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(rpi_lamd.o): In function `_rpi_lamd_init': rpi_lamd.o(.text+0x16): undefined reference to `getnodeid' rpi_lamd.o(.text+0x55): undefined reference to `lam_ksignal' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(rpi_lamd.o): In function `_rpi_lamd_start': rpi_lamd.o(.text+0xd3): undefined reference to `_kio' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(rpi_lamd.o): In function `_rpi_lamd_advance': rpi_lamd.o(.text+0x301): undefined reference to `_kio' rpi_lamd.o(.text+0x495): undefined reference to `microsleep' rpi_lamd.o(.text+0x4dd): undefined reference to `_kio' rpi_lamd.o(.text+0x4e3): undefined reference to `_kio' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(rpi_lamd.o): In function `lamd_testany': rpi_lamd.o(.text+0x65a): undefined reference to `getnodeid' rpi_lamd.o(.text+0x70d): undefined reference to `bfiselect' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(rpi_lamd.o): In function `lamd_waitany': rpi_lamd.o(.text+0x7d7): undefined reference to `bfselect' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(rpi_lamd.o): In function `lamd_fillfyi': rpi_lamd.o(.text+0x925): undefined reference to `_kio' rpi_lamd.o(.text+0x931): undefined reference to `_kio' rpi_lamd.o(.text+0x936): undefined reference to `_kio' rpi_lamd.o(.text+0x94e): undefined reference to `_kio' rpi_lamd.o(.text+0x966): undefined reference to `_kio' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(rpi_lamd.o): In function `lamd_probe': rpi_lamd.o(.text+0xa9e): undefined reference to `bfselect' rpi_lamd.o(.text+0xab5): undefined reference to `bfiprobe' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(rpi_lamd.o): In function `lamd_bfrecv': rpi_lamd.o(.text+0x105b): undefined reference to `bfiprobe' rpi_lamd.o(.text+0x1083): undefined reference to `bfrecv' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(rpi_lamd.o): In function `lamd_dsend': rpi_lamd.o(.text+0x10ef): undefined reference to `dsend' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(rpi_lamd.o): In function `lamd_noretry': rpi_lamd.o(.text+0x1129): undefined reference to `lam_ksigretry' rpi_lamd.o(.text+0x113b): undefined reference to `lam_ksigsetretry' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(rpi_lamd.o): In function `lamd_retry': rpi_lamd.o(.text+0x115c): undefined reference to `lam_ksigretry' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(rpi_lamd.o): In function `lamd_shrink': rpi_lamd.o(.text+0x1241): undefined reference to `getrent' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(rpi_lamd.o): In function `lamd_route': rpi_lamd.o(.text+0x1291): undefined reference to `getnodeid' rpi_lamd.o(.text+0x12a7): undefined reference to `getroute' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(rpi_lamd.o): In function `lamd_finalize1': rpi_lamd.o(.text+0x1306): undefined reference to `_kio' rpi_lamd.o(.text+0x1338): undefined reference to `_kio' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamfault.o): In function `lam_commfault': lamfault.o(.text+0xd5): undefined reference to `al_next' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(rpi_ushm.o): In function `_rpi_c2c_start': rpi_ushm.o(.text+0x42a): undefined reference to `mrev4' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(rpi_ushm.o): In function `connect_all': rpi_ushm.o(.text+0xc04): undefined reference to `ldogetlinks' rpi_ushm.o(.text+0xc1e): undefined reference to `sfh_sock_open_srv_inet_stm' rpi_ushm.o(.text+0xdb8): undefined reference to `nrecv' rpi_ushm.o(.text+0xdd9): undefined reference to `sfh_sock_open_clt_inet_stm' rpi_ushm.o(.text+0xe20): undefined reference to `nsend' rpi_ushm.o(.text+0xe38): undefined reference to `sfh_sock_accept_tmout' rpi_ushm.o(.text+0xeb2): undefined reference to `sfh_sock_set_buf_size' rpi_ushm.o(.text+0xecc): undefined reference to `sfh_sock_set_buf_size' rpi_ushm.o(.text+0xf3f): undefined reference to `nsend' rpi_ushm.o(.text+0xf7f): undefined reference to `nrecv' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(rpi_ushm.o): In function `_rpi_c2c_fastsend': rpi_ushm.o(.text+0x12cc): undefined reference to `rev8' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(rpi_ushm.o): In function `_rpi_c2c_fastrecv': rpi_ushm.o(.text+0x14b2): undefined reference to `rev8' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(shm_ulow.o): In function `_shm_proc_read_env': shm_ulow.o(.text+0x21): undefined reference to `_kio' shm_ulow.o(.text+0x32): undefined reference to `ttime' shm_ulow.o(.text+0x4b): undefined reference to `_kio' shm_ulow.o(.text+0x5f): undefined reference to `ttime' shm_ulow.o(.text+0x68): undefined reference to `_kio' shm_ulow.o(.text+0x6e): undefined reference to `_kio' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(shm_ulow.o): In function `_shm_push_body_box': shm_ulow.o(.text+0x68a): undefined reference to `_kio' shm_ulow.o(.text+0x69b): undefined reference to `ttime' shm_ulow.o(.text+0x6b8): undefined reference to `_kio' shm_ulow.o(.text+0x6cc): undefined reference to `ttime' shm_ulow.o(.text+0x6d5): undefined reference to `_kio' shm_ulow.o(.text+0x6db): undefined reference to `_kio' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(shm_ulow.o): In function `_shm_push_body_pool': shm_ulow.o(.text+0x924): undefined reference to `_kio' shm_ulow.o(.text+0x935): undefined reference to `ttime' shm_ulow.o(.text+0x952): undefined reference to `_kio' shm_ulow.o(.text+0x966): undefined reference to `ttime' shm_ulow.o(.text+0x96f): undefined reference to `_kio' shm_ulow.o(.text+0x975): undefined reference to `_kio' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(shm_ulow.o): In function `_shm_push_env': shm_ulow.o(.text+0xbb2): undefined reference to `_kio' shm_ulow.o(.text+0xbc3): undefined reference to `ttime' shm_ulow.o(.text+0xbdc): undefined reference to `_kio' shm_ulow.o(.text+0xbf0): undefined reference to `ttime' shm_ulow.o(.text+0xbfc): undefined reference to `_kio' shm_ulow.o(.text+0xc02): undefined reference to `_kio' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(shm_ulow.o): In function `_shm_fastsend': shm_ulow.o(.text+0xc5e): undefined reference to `_kio' shm_ulow.o(.text+0xc6f): undefined reference to `ttime' shm_ulow.o(.text+0xc8c): undefined reference to `_kio' shm_ulow.o(.text+0xca0): undefined reference to `ttime' shm_ulow.o(.text+0xca9): undefined reference to `_kio' shm_ulow.o(.text+0xcaf): undefined reference to `_kio' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(shm_ulow.o): In function `_shm_fastrecv': shm_ulow.o(.text+0xf81): undefined reference to `_kio' shm_ulow.o(.text+0xf92): undefined reference to `ttime' shm_ulow.o(.text+0xfaf): undefined reference to `_kio' shm_ulow.o(.text+0xfc3): undefined reference to `ttime' shm_ulow.o(.text+0xfcc): undefined reference to `_kio' shm_ulow.o(.text+0xfd2): undefined reference to `_kio' shm_ulow.o(.text+0x1083): undefined reference to `_kio' shm_ulow.o(.text+0x109a): undefined reference to `ttime' shm_ulow.o(.text+0x10b7): undefined reference to `_kio' shm_ulow.o(.text+0x10cb): undefined reference to `ttime' shm_ulow.o(.text+0x10d4): undefined reference to `_kio' shm_ulow.o(.text+0x10da): undefined reference to `_kio' shm_ulow.o(.text+0x1151): undefined reference to `_kio' shm_ulow.o(.text+0x1162): undefined reference to `ttime' shm_ulow.o(.text+0x117e): undefined reference to `_kio' shm_ulow.o(.text+0x1192): undefined reference to `ttime' shm_ulow.o(.text+0x119b): undefined reference to `_kio' shm_ulow.o(.text+0x11a1): undefined reference to `_kio' shm_ulow.o(.text+0x1230): undefined reference to `_kio' shm_ulow.o(.text+0x1241): undefined reference to `ttime' shm_ulow.o(.text+0x125e): undefined reference to `_kio' shm_ulow.o(.text+0x1272): undefined reference to `ttime' shm_ulow.o(.text+0x127b): undefined reference to `_kio' shm_ulow.o(.text+0x1281): undefined reference to `_kio' shm_ulow.o(.text+0x130b): undefined reference to `_kio' shm_ulow.o(.text+0x1322): undefined reference to `ttime' shm_ulow.o(.text+0x133f): undefined reference to `_kio' shm_ulow.o(.text+0x1353): undefined reference to `ttime' shm_ulow.o(.text+0x135c): undefined reference to `_kio' shm_ulow.o(.text+0x1362): undefined reference to `_kio' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(shm_ulow.o): In function `waitforack': shm_ulow.o(.text+0x1401): undefined reference to `_kio' shm_ulow.o(.text+0x1412): undefined reference to `ttime' shm_ulow.o(.text+0x142b): undefined reference to `_kio' shm_ulow.o(.text+0x143f): undefined reference to `ttime' shm_ulow.o(.text+0x1448): undefined reference to `_kio' shm_ulow.o(.text+0x144e): undefined reference to `_kio' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(shm_usysv.o): In function `_shm_cleanup': shm_usysv.o(.text+0xd7): undefined reference to `lam_deregister_object' shm_usysv.o(.text+0xf3): undefined reference to `lam_deregister_object' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(tcp_low.o): In function `_tcp_proc_read_env': tcp_low.o(.text+0x31a): undefined reference to `mrev4' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(tcp_low.o): In function `tcp_req_rcvd_body_synch': tcp_low.o(.text+0x7d2): undefined reference to `mrev4' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(tcp_low.o): In function `tcp_req_rcvd_ack_long': tcp_low.o(.text+0x8d2): undefined reference to `mrev4' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(tcp_low.o): In function `_tcp_req_recv': tcp_low.o(.text+0xa33): undefined reference to `mrev4' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(tcp_low.o): In function `_tcp_buffered_adv': tcp_low.o(.text+0xcab): undefined reference to `mrev4' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(tcp_low.o): In function `sread': tcp_low.o(.text+0x10c3): undefined reference to `_kio' tcp_low.o(.text+0x10f6): undefined reference to `ttime' tcp_low.o(.text+0x117d): undefined reference to `_kio' tcp_low.o(.text+0x11a7): undefined reference to `ttime' tcp_low.o(.text+0x11b0): undefined reference to `_kio' tcp_low.o(.text+0x11b6): undefined reference to `_kio' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(tcp_low.o): In function `swrite': tcp_low.o(.text+0x11f3): undefined reference to `_kio' tcp_low.o(.text+0x1229): undefined reference to `ttime' tcp_low.o(.text+0x127e): undefined reference to `_kio' tcp_low.o(.text+0x12a6): undefined reference to `ttime' tcp_low.o(.text+0x12af): undefined reference to `_kio' tcp_low.o(.text+0x12b5): undefined reference to `_kio' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(tcp_low.o): In function `swritev': tcp_low.o(.text+0x130c): undefined reference to `_kio' tcp_low.o(.text+0x1336): undefined reference to `ttime' tcp_low.o(.text+0x1419): undefined reference to `_kio' tcp_low.o(.text+0x1441): undefined reference to `ttime' tcp_low.o(.text+0x144a): undefined reference to `_kio' tcp_low.o(.text+0x1450): undefined reference to `_kio' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(tcp_low.o): In function `sselect': tcp_low.o(.text+0x146f): undefined reference to `_kio' tcp_low.o(.text+0x148a): undefined reference to `ttime' tcp_low.o(.text+0x14d5): undefined reference to `_kio' tcp_low.o(.text+0x14ea): undefined reference to `ttime' tcp_low.o(.text+0x14f3): undefined reference to `_kio' tcp_low.o(.text+0x14f9): undefined reference to `_kio' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(tcp_low.o): In function `_tcp_fastsend': tcp_low.o(.text+0x16c9): undefined reference to `mrev4' tcp_low.o(.text+0x1733): undefined reference to `mrev4' tcp_low.o(.text+0x1797): undefined reference to `rw' tcp_low.o(.text+0x17a6): undefined reference to `rw' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(tcp_low.o): In function `_tcp_fastrecv': tcp_low.o(.text+0x199a): undefined reference to `mrev4' tcp_low.o(.text+0x1a49): undefined reference to `mrev4' tcp_low.o(.text+0x1b03): undefined reference to `mrev4' tcp_low.o(.text+0x1c09): undefined reference to `mrev4' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(tcp_low.o): In function `waitforack': tcp_low.o(.text+0x1d29): undefined reference to `mrev4' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamclocks.o): In function `lam_clocksync': lamclocks.o(.text+0xb1): undefined reference to `getnodeid' lamclocks.o(.text+0x16c): undefined reference to `nsend' lamclocks.o(.text+0x199): undefined reference to `nrecv' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamclocks.o): In function `sync_master': lamclocks.o(.text+0x2ae): undefined reference to `nsend' lamclocks.o(.text+0x2be): undefined reference to `nrecv' lamclocks.o(.text+0x2f1): undefined reference to `ttime' lamclocks.o(.text+0x306): undefined reference to `nsend' lamclocks.o(.text+0x319): undefined reference to `nrecv' lamclocks.o(.text+0x325): undefined reference to `ttime' lamclocks.o(.text+0x391): undefined reference to `nsend' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamclocks.o): In function `sync_slave': lamclocks.o(.text+0x411): undefined reference to `nrecv' lamclocks.o(.text+0x425): undefined reference to `nsend' lamclocks.o(.text+0x448): undefined reference to `nrecv' lamclocks.o(.text+0x454): undefined reference to `ttime' lamclocks.o(.text+0x47a): undefined reference to `nsend' lamclocks.o(.text+0x493): undefined reference to `nrecv' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamcomm.o): In function `lam_comm_free': lamcomm.o(.text+0xa2): undefined reference to `ah_next' lamcomm.o(.text+0xba): undefined reference to `ah_free' lamcomm.o(.text+0x13d): undefined reference to `al_find' lamcomm.o(.text+0x14c): undefined reference to `al_delete' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamdeferr.o): In function `lam_comm_errfatal': lamdeferr.o(.text+0x5d): undefined reference to `kexit' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamdeferr.o): In function `lam_win_errfatal': lamdeferr.o(.text+0xb6): undefined reference to `kexit' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamdeferr.o): In function `report_error': lamdeferr.o(.text+0x176): undefined reference to `_kio' lamdeferr.o(.text+0x233): undefined reference to `_kio' lamdeferr.o(.text+0x252): undefined reference to `getnodeid' lamdeferr.o(.text+0x272): undefined reference to `getnodeid' lamdeferr.o(.text+0x2b1): undefined reference to `getnodeid' lamdeferr.o(.text+0x2be): undefined reference to `tprintf' lamdeferr.o(.text+0x2d1): undefined reference to `getnodeid' lamdeferr.o(.text+0x2e0): undefined reference to `tprintf' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(c2cbuf.o): In function `_cbuf_init': c2cbuf.o(.text+0x17): undefined reference to `ah_init' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(c2cbuf.o): In function `_cbuf_end': c2cbuf.o(.text+0x64): undefined reference to `al_free' c2cbuf.o(.text+0x77): undefined reference to `ah_next' c2cbuf.o(.text+0x8e): undefined reference to `ah_free' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(c2cbuf.o): In function `_cbuf_find': c2cbuf.o(.text+0xcd): undefined reference to `ah_find' c2cbuf.o(.text+0x111): undefined reference to `al_next' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(c2cbuf.o): In function `_cbuf_delete': c2cbuf.o(.text+0x147): undefined reference to `ah_find' c2cbuf.o(.text+0x1a2): undefined reference to `al_delete' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(c2cbuf.o): In function `_cbuf_append': c2cbuf.o(.text+0x1c7): undefined reference to `ah_find' c2cbuf.o(.text+0x1ec): undefined reference to `next_prime' c2cbuf.o(.text+0x1fb): undefined reference to `ah_expand' c2cbuf.o(.text+0x23b): undefined reference to `ah_insert' c2cbuf.o(.text+0x255): undefined reference to `ah_find' c2cbuf.o(.text+0x280): undefined reference to `al_init' c2cbuf.o(.text+0x2b6): undefined reference to `al_append' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(c2cbuf.o): In function `cid_2_comm': c2cbuf.o(.text+0x2fc): undefined reference to `al_find' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(shm_common.o): In function `_shm_advance': shm_common.o(.text+0x36): undefined reference to `_kio' shm_common.o(.text+0x59): undefined reference to `ttime' shm_common.o(.text+0x144): undefined reference to `_kio' shm_common.o(.text+0x155): undefined reference to `ttime' shm_common.o(.text+0x16f): undefined reference to `_kio' shm_common.o(.text+0x194): undefined reference to `_kio' shm_common.o(.text+0x19a): undefined reference to `_kio' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(shm_common.o): In function `_shm_create_area': shm_common.o(.text+0xba2): undefined reference to `lam_register_objects' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(abort.o): In function `MPI_Abort': abort.o(.text+0x61): undefined reference to `kexit' abort.o(.text+0x84): undefined reference to `kexit' abort.o(.text+0x8d): undefined reference to `_kio' abort.o(.text+0x95): undefined reference to `_kio' abort.o(.text+0xd5): undefined reference to `rpdoom' abort.o(.text+0x100): undefined reference to `kexit' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(csetname.o): In function `MPI_Comm_set_name': csetname.o(.text+0x7d): undefined reference to `_kio' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(errstring.o): In function `MPI_Error_string': errstring.o(.text+0xae): undefined reference to `blktype' errstring.o(.text+0x17e): undefined reference to `lam_errorstr' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamattr.o): In function `lam_putkey': lamattr.o(.text+0x212): undefined reference to `ah_init' lamattr.o(.text+0x233): undefined reference to `next_prime' lamattr.o(.text+0x23e): undefined reference to `ah_expand' lamattr.o(.text+0x25e): undefined reference to `ah_insert' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamattr.o): In function `lam_getkey': lamattr.o(.text+0x296): undefined reference to `ah_find' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamattr.o): In function `lam_delkey': lamattr.o(.text+0x2ba): undefined reference to `ah_delete' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lambuf.o): In function `lam_bufinit': lambuf.o(.text+0xcc): undefined reference to `rev8' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lamdtype.o): In function `lam_type_free': lamdtype.o(.text+0x176): undefined reference to `ah_next' lamdtype.o(.text+0x18b): undefined reference to `ah_free' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lampublish.o): In function `lam_publish': lampublish.o(.text+0x21): undefined reference to `lam_rtrnamepub' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lampublish.o): In function `lam_unpublish': lampublish.o(.text+0x3d): undefined reference to `lam_rtrnamedel' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lampublish.o): In function `lam_getpublished': lampublish.o(.text+0x61): undefined reference to `lam_rtrnameget' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(lampublish.o): In function `lam_nukepublished': lampublish.o(.text+0x8a): undefined reference to `lam_rtrnamesweep' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(sendrecv.o): In function `MPI_Sendrecv': sendrecv.o(.text+0x1e): undefined reference to `_kio' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(wait.o): In function `MPI_Wait': wait.o(.text+0x88): undefined reference to `_kio' wait.o(.text+0xbd): undefined reference to `_kio' wait.o(.text+0xc3): undefined reference to `_kio' wait.o(.text+0x1ba): undefined reference to `_kio' /usr/lib/gcc-lib/i386-redhat-linux/2.96/../../../libmpi.a(irecv.o)(.text+0x4 c): more undefined references to `_kio' follow collect2: ld returned 1 exit status make[1]: *** [../bin/lu.S.4] Error 1 make[1]: Leaving directory `/home/kinjo/NPB2.3/LU' make: *** [lu] Error 2 From nrcb @ streamline-computing.com Wed Nov 6 16:09:23 2002 From: nrcb @ streamline-computing.com (Nick Birkett) Date: Wed, 6 Nov 2002 07:09:23 +0000 Subject: [SCore-users-jp] [SCore-users] kernel 2.4.18-3SCORE source Message-ID: <200211060709.gA679NK02361@zeralda.streamline.com> Hi I am not able to build kernel 2.4.18-3SCORE from soure code (kernel source in 5.2 score.rpm directory). I have tried it on RedHat 7.2 and RedHat 7.3 using gcc and kgcc, but get same error: make mrproper make menuconfig make dep make bzImage gcc -D__KERNEL__ -I/raid0/src/linux-2.4.18-3SCORE/include -Wall -Wstrict-prototypes -Wno-trigraphs -O2 -fno-strict-aliasing -fno-common -fomit-frame-pointer -pipe -mpreferred-stack-boundary=2 -march=i686 -DKBUILD_BASENAME=check -DEXPORT_SYMTAB -c check.c In file included from check.c:36: efi.h:40:26: asm-ia64/efi.h: No such file or directory In file included from check.c:36: efi.h:83: parse error before `efi_guid_t' efi.h:83: warning: no semicolon at end of struct or union efi.h:89: parse error before `}' Even if I disable Advanced partition types in config. .config attached. Cheers, Nick -------------- next part -------------- 文字コード指定の無い添付文書を保管しました... 名前: .config URL: From emile.carcamo @ nec.fr Wed Nov 6 17:35:17 2002 From: emile.carcamo @ nec.fr (Emile CARCAMO) Date: Wed, 06 Nov 2002 09:35:17 +0100 Subject: [SCore-users-jp] Re: [SCore-users] kernel 2.4.18-3SCORE source In-Reply-To: Your message of "Wed, 06 Nov 2002 07:09:23 GMT." <200211060709.gA679NK02361@zeralda.streamline.com> Message-ID: <200211060835.gA68ZHB04025@emilepc.ess.nec.fr> nrcb @ streamline-computing.com said: > Hi I am not able to build kernel 2.4.18-3SCORE from soure code (kernel > source in 5.2 score.rpm directory). > > I have tried it on RedHat 7.2 and RedHat 7.3 using gcc and kgcc, but > get same error: Dear ALL, Me too !! I was disappointed to notice that in Score 5.2.0 the kernel source directory (a.k.a. /usr/src/linux) is now empty, then I am not able to even rebuild a SCore kernel that includes BSD accounting on a per node basis. Too bad! Let's hope that /usr/src/linux tree will be available for download in a near future ;-) Thanks again for your help, and best regards. -- Emile_CARCAMO NEC European http://www.ess.nec.de System Engineer Supercomputer mailto:emile.carcamo @ nec.fr Systems France GSM mailto:emile.carcamo @ orange.fr (+33)1-3930-6601 FAX (+33)1-3930-6613 PHONE / Your mouse has moved. Windows NT must be restarted \ (+33)6-8063-7003 GSM \ for the change to take effect. Reboot now? [ OK ] / _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Wed Nov 6 18:15:10 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Wed, 06 Nov 2002 18:15:10 +0900 Subject: [SCore-users-jp] Re: [SCore-users] kernel 2.4.18-3SCORE source In-Reply-To: Your message of "Wed, 06 Nov 2002 07:09:23 JST." <200211060709.gA679NK02361@zeralda.streamline.com> Message-ID: <20021106091339.6D22C20037@neal.il.is.s.u-tokyo.ac.jp> In article <200211060709.gA679NK02361 @ zeralda.streamline.com> Nick Birkett wrotes: > I have tried it on RedHat 7.2 and RedHat 7.3 using gcc and kgcc, but get same > error: ... > gcc -D__KERNEL__ -I/raid0/src/linux-2.4.18-3SCORE/include -Wall -Wstrict-pro > totypes -Wno-trigraphs -O2 -fno-strict-aliasing -fno-common -fomit-frame-poin > ter -pipe -mpreferred-stack-boundary=2 -march=i686 -DKBUILD_BASENAME=check > -DEXPORT_SYMTAB -c check.c > In file included from check.c:36: > efi.h:40:26: asm-ia64/efi.h: No such file or directory > In file included from check.c:36: > efi.h:83: parse error before `efi_guid_t' > efi.h:83: warning: no semicolon at end of struct or union > efi.h:89: parse error before `}' > > Even if I disable Advanced partition types in config. Sorry, please apply this oatch. ---------------------------------------cut here--------------------------------- Index: fs/partitions/Config.in =================================================================== RCS file: /develop/cvsroot/score-src/kernel/linux2.4.18_itanium/fs/partitions/Config.in,v retrieving revision 1.1.1.1 diff -u -r1.1.1.1 Config.in --- fs/partitions/Config.in 1 Aug 2002 07:47:37 -0000 1.1.1.1 +++ fs/partitions/Config.in 6 Nov 2002 09:08:42 -0000 @@ -32,7 +32,9 @@ bool ' SGI partition support' CONFIG_SGI_PARTITION bool ' Ultrix partition table support' CONFIG_ULTRIX_PARTITION bool ' Sun partition tables support' CONFIG_SUN_PARTITION - bool ' EFI GUID Partition support' CONFIG_EFI_PARTITION + if [ "$ARCH" = "ia64" ]; then + bool ' EFI GUID Partition support' CONFIG_EFI_PARTITION + fi else if [ "$ARCH" = "alpha" ]; then define_bool CONFIG_OSF_PARTITION y Index: fs/partitions/check.c =================================================================== RCS file: /develop/cvsroot/score-src/kernel/linux2.4.18_itanium/fs/partitions/check.c,v retrieving revision 1.1.1.1 retrieving revision 1.1.1.1.2.1 diff -u -r1.1.1.1 -r1.1.1.1.2.1 --- fs/partitions/check.c 1 Aug 2002 07:47:37 -0000 1.1.1.1 +++ fs/partitions/check.c 6 Nov 2002 08:46:58 -0000 1.1.1.1.2.1 @@ -33,7 +33,9 @@ #include "sun.h" #include "ibm.h" #include "ultrix.h" +#ifdef __ia64__ #include "efi.h" +#endif extern int *blk_size[]; Index: fs/partitions/msdos.c =================================================================== RCS file: /develop/cvsroot/score-src/kernel/linux2.4.18_itanium/fs/partitions/msdos.c,v retrieving revision 1.1.1.1 retrieving revision 1.1.1.1.2.1 diff -u -r1.1.1.1 -r1.1.1.1.2.1 --- fs/partitions/msdos.c 1 Aug 2002 07:47:37 -0000 1.1.1.1 +++ fs/partitions/msdos.c 6 Nov 2002 08:46:58 -0000 1.1.1.1.2.1 @@ -35,7 +35,9 @@ #include "check.h" #include "msdos.h" +#ifdef ___ia64__ #include "efi.h" +#endif #if CONFIG_BLK_DEV_MD extern void md_autodetect_dev(kdev_t dev); ---------------------------------------cut here--------------------------------- from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Wed Nov 6 18:55:28 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Wed, 06 Nov 2002 18:55:28 +0900 Subject: [SCore-users-jp] Re: [SCore-users] kernel 2.4.18-3SCORE source In-Reply-To: Your message of "Wed, 06 Nov 2002 09:35:17 JST." <200211060835.gA68ZHB04025@emilepc.ess.nec.fr> Message-ID: <20021106095357.A653620037@neal.il.is.s.u-tokyo.ac.jp> In article <200211060835.gA68ZHB04025 @ emilepc.ess.nec.fr> Emile CARCAMO wrotes: > Let's hope that /usr/src/linux tree will be available for > download in a near future ;-) Thanks again for your help, > and best regards. kernel sourece rpm is available in cdrom: score.rpm/kernel-source-score-2.4.18-3SCORE.i386.rpm and download to individual: http://www.pccluster.org/dist/pub/score-5.2.0/rpm.redhat7.3.i386/kernel-source-score-2.4.18-3SCORE.i386.rpm Note that: 1. If you installed by EIT, please install this rpm to server host. Because compute host does not install compiler, you can't compile kernel on compute host that installed SCore 5.2 EIT. 2. This rpm will install under /usr/src/linux-2.4.18score directory. The /usr/src/linux-2.4 directory keeps redhat original kernel source. 3. Please apply a patch to my privious mail (or download to following URL, this is same). http://www.pccluster.org/score/dist/pub/score-5.2.0/rpm.redhat7.3.i386/kernel-source-score.efi.patch from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From emile.carcamo @ nec.fr Wed Nov 6 22:47:58 2002 From: emile.carcamo @ nec.fr (Emile CARCAMO) Date: Wed, 06 Nov 2002 14:47:58 +0100 Subject: [SCore-users-jp] [SCore-users] Compiling kernel source 2.4.18-3SCORE In-Reply-To: Your message of "Wed, 06 Nov 2002 18:55:28 +0900." <20021106095357.A653620037@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <200211061347.gA6DlwB08863@emilepc.ess.nec.fr> Dear Kameyama-san, I've tried to do everything as you suggested : 1- install the kernel-source-score-2.4.18-3SCORE on the SCore master host. 2- appply your patch "kernel-source-score.efi.patch" : cd /usr/src/linux2.4.18score cat XXX | patch -p0 make xconfig , etc, etc ... I still have an error when processing the driver e100 as shown in the log file enclosed. Did I miss something ? I remember being able to recompile the kernel 2.4.18-2SCORE without any problem at all... Thanks again for your help, and best regards. -- Emile_CARCAMO NEC European http://www.ess.nec.de System Engineer Supercomputer mailto:emile.carcamo @ nec.fr Systems France GSM mailto:emile.carcamo @ orange.fr (+33)1-3930-6601 FAX (+33)1-3930-6613 PHONE / Your mouse has moved. Windows NT must be restarted \ (+33)6-8063-7003 GSM \ for the change to take effect. Reboot now? [ OK ] / -------------- next part -------------- 文字コード指定の無い添付文書を保管しました... 名前: Dot_config_SCore URL: -------------- next part -------------- 文字コード指定の無い添付文書を保管しました... 名前: COMPILE.log URL: From klaas @ ccrl-nece.de Wed Nov 6 23:25:59 2002 From: klaas @ ccrl-nece.de (Jens Klaas) Date: Wed, 6 Nov 2002 15:25:59 +0100 Subject: [SCore-users-jp] Re: [SCore-users] Compiling kernel source 2.4.18-3SCORE In-Reply-To: <200211061347.gA6DlwB08863@emilepc.ess.nec.fr> References: <200211061347.gA6DlwB08863@emilepc.ess.nec.fr> Message-ID: <200211061525.59514.klaas@ccrl-nece.de> Dear Emile, I took a look in your .config file. It seems that you choose the driver for the EtherExpress Pro 100 AND the alternate E100 driver at the same time. -----a part of your .config---- # CONFIG_DM9102 is not set CONFIG_EEPRO100=y CONFIG_E100=y # CONFIG_FEALNX is not set -----a part of your .config---- That won't work, they are alternate drivers! btw.... I compiled the linux-2.4.18-3.score kernel without the efi patch,.... just copied the /usr/src/linux/include/asm-ia64 directory from the 2.4.18 kernel to the new one,.... It seems to work. :-) cu Jens On Wednesday 06 November 2002 02:47 pm, Emile CARCAMO wrote: > Dear Kameyama-san, > > I've tried to do everything as you suggested : > > 1- install the kernel-source-score-2.4.18-3SCORE on the > SCore master host. > > 2- appply your patch "kernel-source-score.efi.patch" : > > cd /usr/src/linux2.4.18score > cat XXX | patch -p0 > make xconfig , etc, etc ... > > I still have an error when processing the driver e100 as > shown in the log file enclosed. Did I miss something ? I > remember being able to recompile the kernel 2.4.18-2SCORE > without any problem at all... Thanks again for your help, > and best regards. -- ------------------------------------------------------------------------------ Jens Klaas NEC Europe Ltd. C&C Research Laboratories Rathausallee 10 D-53757 Sankt Augustin Phone: 02241/9252-0 02241/9252-72 Fax: 02241/9252-99 eMail: klaas @ ccrl-nece.de www.ccrl-nece.de/klaas ------------------------------------------------------------------------------ In sharks we trust. ------------------------------------------------------------------------------ _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From emile.carcamo @ nec.fr Thu Nov 7 00:23:01 2002 From: emile.carcamo @ nec.fr (Emile CARCAMO) Date: Wed, 06 Nov 2002 16:23:01 +0100 Subject: [SCore-users-jp] Re: [SCore-users] Compiling kernel source 2.4.18-3SCORE In-Reply-To: Your message of "Wed, 06 Nov 2002 15:25:59 +0100." <200211061525.59514.klaas@ccrl-nece.de> Message-ID: <200211061523.gA6FN1w11183@emilepc.ess.nec.fr> > Dear Emile, > I took a look in your .config file. It seems that you choose the driver for > the EtherExpress Pro 100 AND the alternate E100 driver at the same time. > > -----a part of your .config---- > # CONFIG_DM9102 is not set > CONFIG_EEPRO100=y > CONFIG_E100=y > # CONFIG_FEALNX is not set > -----a part of your .config---- > > That won't work, they are alternate drivers! > Hello Jens, This was the solution, many thanks about the hint !!! My problem is that I ran "make oldconfig" to guess the .config contents on a PC (the master) that is *not* an Express5800 so there are side effects like that one. Best regards, -- Emile_CARCAMO NEC European http://www.ess.nec.de System Engineer Supercomputer mailto:emile.carcamo @ nec.fr Systems France GSM mailto:emile.carcamo @ orange.fr (+33)1-3930-6601 FAX (+33)1-3930-6613 PHONE / Your mouse has moved. Windows NT must be restarted \ (+33)6-8063-7003 GSM \ for the change to take effect. Reboot now? [ OK ] / _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From nrcb @ streamline-computing.com Thu Nov 7 15:35:37 2002 From: nrcb @ streamline-computing.com (Nick Birkett) Date: Thu, 7 Nov 2002 06:35:37 +0000 Subject: [SCore-users-jp] Re: [SCore-users] kernel 2.4.18-3SCORE source In-Reply-To: <20021106091339.6D22C20037@neal.il.is.s.u-tokyo.ac.jp> References: <20021106091339.6D22C20037@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <200211070635.gA76Zc602108@zeralda.streamline.com> On Wednesday 06 November 2002 09:15 am, kameyama @ pccluster.org wrote: > Sorry, please apply this oatch. > ---------------------------------------cut > here--------------------------------- Index: fs/partitions/Config.in > =================================================================== > RCS file: > /develop/cvsroot/score-src/kernel/linux2.4.18_itanium/fs/partitions/Config. >in,v retrieving revision 1.1.1.1 > diff -u -r1.1.1.1 Config.in > --- fs/partitions/Config.in 1 Aug 2002 07:47:37 -0000 1.1.1.1 > +++ fs/partitions/Config.in 6 Nov 2002 09:08:42 -0000 > @@ -32,7 +32,9 @@ > bool ' SGI partition support' CONFIG_SGI_PARTITION > bool ' Ultrix partition table support' CONFIG_ULTRIX_PARTITION > bool ' Sun partition tables support' CONFIG_SUN_PARTITION > - bool ' EFI GUID Partition support' CONFIG_EFI_PARTITION > + if [ "$ARCH" = "ia64" ]; then > + bool ' EFI GUID Partition support' CONFIG_EFI_PARTITION > + fi > else > if [ "$ARCH" = "alpha" ]; then > define_bool CONFIG_OSF_PARTITION y > Index: fs/partitions/check.c > =================================================================== > RCS file: > /develop/cvsroot/score-src/kernel/linux2.4.18_itanium/fs/partitions/check.c >,v retrieving revision 1.1.1.1 > retrieving revision 1.1.1.1.2.1 > diff -u -r1.1.1.1 -r1.1.1.1.2.1 > --- fs/partitions/check.c 1 Aug 2002 07:47:37 -0000 1.1.1.1 > +++ fs/partitions/check.c 6 Nov 2002 08:46:58 -0000 1.1.1.1.2.1 > @@ -33,7 +33,9 @@ > #include "sun.h" > #include "ibm.h" > #include "ultrix.h" > +#ifdef __ia64__ > #include "efi.h" > +#endif > > extern int *blk_size[]; > > Index: fs/partitions/msdos.c > =================================================================== > RCS file: > /develop/cvsroot/score-src/kernel/linux2.4.18_itanium/fs/partitions/msdos.c >,v retrieving revision 1.1.1.1 > retrieving revision 1.1.1.1.2.1 > diff -u -r1.1.1.1 -r1.1.1.1.2.1 > --- fs/partitions/msdos.c 1 Aug 2002 07:47:37 -0000 1.1.1.1 > +++ fs/partitions/msdos.c 6 Nov 2002 08:46:58 -0000 1.1.1.1.2.1 > @@ -35,7 +35,9 @@ > > #include "check.h" > #include "msdos.h" > +#ifdef ___ia64__ > #include "efi.h" > +#endif > > #if CONFIG_BLK_DEV_MD > extern void md_autodetect_dev(kdev_t dev); > ---------------------------------------cut > here--------------------------------- > Kameyama san - thanks it all works now. _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From u9915240 @ student.anu.edu.au Thu Nov 7 22:55:46 2002 From: u9915240 @ student.anu.edu.au (John Uhlmann) Date: Fri, 08 Nov 2002 00:55:46 +1100 Subject: [SCore-users-jp] [SCore-users] Multiuser Memory Issues Message-ID: <3DCA70E2.446FC388@student.anu.edu.au> I've recently noticed a peculiar difference between scored in single user and multi-user modes. I can't remember seeing this documented anywhere, so I thought that I'd ask. The situation is basically that when I run jobs in multi-user mode then the maximum job size that I can fit on the system is far smaller than in single user mode. (About 60% for the job in question which has a O(N^2) memory footprint.) For reference, my cluster has SMP nodes with 384MB main memory and 1GB swap. In the morning I intend to investigate this further by trying different jobs and also looking at the situation on a non-SMP cluster. But for now, I was wondering if anyone had come across this phenomenon before and could explain it. John _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From arpiruk @ yahoo.com Fri Nov 8 00:36:22 2002 From: arpiruk @ yahoo.com (=?iso-2022-jp?b?YXJwaXJ1ayAbJEIhdxsoQiB5YWhvby5jb20=?=) Date: Thu, 7 Nov 2002 07:36:22 -0800 (PST) Subject: [SCore-users-jp] [SCore-users] Re: SCore-users digest, Vol 1 #119 - 2 msgs In-Reply-To: <20021107030001.3939.53891.Mailman@www.pccluster.org> Message-ID: <20021107153622.73741.qmail@web13902.mail.yahoo.com> Dear Score communities, I'm now trying to install score on suse kernel 2.4.19 cluster with SCI but for first step I want to use it with normal ethernet connection first, but there is no patch for kernel 2.4.19 provided, can I the one for 2.4.18 or there no need to patch? Sincerely, --------------------------------- Do you Yahoo!? U2 on LAUNCH - Exclusive medley & videos from Greatest Hits CD -------------- next part -------------- HTMLの添付ファイルを保管しました... URL: From hermann.lauer @ iwr.uni-heidelberg.de Fri Nov 8 02:19:55 2002 From: hermann.lauer @ iwr.uni-heidelberg.de (Hermann Lauer) Date: Thu, 7 Nov 2002 18:19:55 +0100 Subject: [SCore-users-jp] [SCore-users] debian support Message-ID: <20021107181955.A3447@lemon.iwr.uni-heidelberg.de> Dear SCore users, I'd just like to know if there are any plans for debian 3.0 (woody) support - suse and redhat are listed in the 5.2 docu. Are there any problems known from SCore with special kernel patches from vendors needed or any other special requirements/bug issues with the (c-)libraries supplied ? Thanks for any reply, greetings Hermann -- Netzwerkadministration/Zentrale Dienste, Interdiziplinaeres Zentrum fuer wissenschaftliches Rechnen der Universitaet Heidelberg IWR; INF 368; 69120 Heidelberg; Tel: (06221)54-8236 Fax: -5224 Email: Hermann.Lauer @ iwr.uni-heidelberg.de _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From ishikawa @ is.s.u-tokyo.ac.jp Fri Nov 8 07:10:44 2002 From: ishikawa @ is.s.u-tokyo.ac.jp (Yutaka Ishikawa) Date: Fri, 08 Nov 2002 07:10:44 +0900 (JST) Subject: [SCore-users-jp] Re: [SCore-users] debian support In-Reply-To: <20021107181955.A3447@lemon.iwr.uni-heidelberg.de> References: <20021107181955.A3447@lemon.iwr.uni-heidelberg.de> Message-ID: <20021108.071044.730556894.ishikawa@is.s.u-tokyo.ac.jp> > I'd just like to know if there are any plans for debian 3.0 (woody) support - > suse and redhat are listed in the 5.2 docu. Due to the limited man power in the PC cluster consortium, the consortium only supports redhat. I heard that someone ported SCore to the debian environment, but I do not know the current status. -- Yutaka Ishikawa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From Yamamoto.Takaya @ wrc.melco.co.jp Fri Nov 8 16:13:43 2002 From: Yamamoto.Takaya @ wrc.melco.co.jp (Takaya Yamamoto) Date: Fri, 08 Nov 2002 16:13:43 +0900 Subject: [SCore-users-jp] [SCore-users] s-bitの質問 Message-ID: <5.0.2.5.2.20021108160220.00bdb8b8@133.141.16.40> 三菱電機 山本です。 プログラムの実行方法について質問があります。 シミュレーションプログラムで、コード内に iopl()とかcli()のようなrootでしか実行できない関数を入れようとしています。 このようなプログラムを一般ユーザーが実行するために、 以前の古いSCore2.3とかSCore2.4では、  # chown root  # chmod +s とs-bitを立てることで実行可能となったのですが、 SCore5.0.0ではこれでは動いてくれません。 こういった実行方法は、いつのまにかできなくなったのでしょうか? 以上 _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Fri Nov 8 16:41:30 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Fri, 08 Nov 2002 16:41:30 +0900 Subject: [SCore-users-jp] [SCore-users] s-bitの質問 In-Reply-To: Your message of "Fri, 08 Nov 2002 16:13:43 JST." <5.0.2.5.2.20021108160220.00bdb8b8@133.141.16.40> Message-ID: <20021108074127.DEB5B20048@neal.il.is.s.u-tokyo.ac.jp> 亀山です. 日本語の mail は SCore-users-jp に... In article <5.0.2.5.2.20021108160220.00bdb8b8 @ 133.141.16.40> Takaya Yamamoto wrotes: > このようなプログラムを一般ユーザーが実行するために、 > 以前の古いSCore2.3とかSCore2.4では、 >  # chown root >  # chmod +s > とs-bitを立てることで実行可能となったのですが、 > SCore5.0.0ではこれでは動いてくれません。 SCore 2.x のころは single user mode では SCore プログラムは自分自身で 直接動いていました. そのため, SCore プログラムは全部の host で同じパスでアクセス できる必要がありました. ところが, SCore 3 からは SCore プログラムは scored が起動 host から compute host へコピーしてから実行しています. single user mode の場合, binary file は起動した user へ chown してしまい, root の setuid bit は無意味になってしまいます. multi user mode の場合, mode はコピーされないような感じです. いずれにしても setuid bit は使用できないような... from Kameyama Toyohisa From amik @ cfdlab.mcgill.ca Fri Nov 8 23:19:35 2002 From: amik @ cfdlab.mcgill.ca (Amik St-Cyr CFD Lab) Date: 08 Nov 2002 09:19:35 -0500 Subject: [SCore-users-jp] [SCore-users] stock kernel unstable in Redhat 7.3 Message-ID: <1036765176.17418.4.camel@stan.cfdlab.mcgill.ca> Hi, The new 5.2 and 5.0.1 versions of SCore are using for head-node (5.0.1) RH-7.3 and compute nodes in 5.2 are using RH-7.3. The kernel patch in score is based on kernel 2.4.18-3 but serious stability bugs related to I/O and NFS v3 can cause machine to hang up / crash. A kernel update can be found on the RH site: http://lwn.net/Articles/3593/ ... 64984 - Redhat 7.3: nfs writes very slow. 66143 - System hang after 5-12 h IO stress - flushtlb problem? ... Updated kernel is named 2.4.18-5 on the RH site. I was wondering if this could be updated in both distributions? Thank you very much, Amik St-Cyr -- _____________________________________________________ Dr. A. St-Cyr Research Associate, CFD Lab Department of Mechanical Engineering McGill University 688 Sherbrooke Street West, 7th floor Montreal, Qc, Canada H3A 2S6 Tel: +1 (514) 398-1710, Admin. Fax : 2203 amik @ cfdlab.mcgill.ca _____________________________________________________ _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From bogdan.costescu @ iwr.uni-heidelberg.de Sat Nov 9 00:08:26 2002 From: bogdan.costescu @ iwr.uni-heidelberg.de (Bogdan Costescu) Date: Fri, 8 Nov 2002 16:08:26 +0100 (CET) Subject: [SCore-users-jp] Re: [SCore-users] stock kernel unstable in Redhat 7.3 In-Reply-To: <1036765176.17418.4.camel@stan.cfdlab.mcgill.ca> Message-ID: On 8 Nov 2002, Amik St-Cyr CFD Lab wrote: > Updated kernel is named 2.4.18-5 on the RH site. Actually the latest update from RedHat is 2.4.18-17. There are indeed several NFS-related fixes since 2.4.18-3, plus quite a lot of others. Have you tried applying the patch to the 2.4.18-update kernel and failed ? I'll probably do this here sometimes in the very near future, so I'll appreciate any info on it. If not, you'll hear from me when I'll do it :-) -- Bogdan Costescu IWR - Interdisziplinaeres Zentrum fuer Wissenschaftliches Rechnen Universitaet Heidelberg, INF 368, D-69120 Heidelberg, GERMANY Telephone: +49 6221 54 8869, Telefax: +49 6221 54 8868 E-mail: Bogdan.Costescu @ IWR.Uni-Heidelberg.De _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From amik @ cfdlab.mcgill.ca Sat Nov 9 00:19:29 2002 From: amik @ cfdlab.mcgill.ca (Amik St-Cyr CFD Lab) Date: 08 Nov 2002 10:19:29 -0500 Subject: [SCore-users-jp] Re: [SCore-users] stock kernel unstable in Redhat 7.3 In-Reply-To: References: Message-ID: <1036768769.17419.32.camel@stan.cfdlab.mcgill.ca> Hi, We are planning to do it if no score developer does it. What is scaring me is that I compiled score from source (5.0.1) and I needed almost 5 unmentioned patches from the score group before getting it to fully compile. I dont know how much patches I will need from them with the revised kernel... Anyway, we have no choice, if they don't do it, we will. How can you manage to tell your users that their simulations will crash every 5-12 hours ??? Best, Amik On Fri, 2002-11-08 at 10:08, Bogdan Costescu wrote: > On 8 Nov 2002, Amik St-Cyr CFD Lab wrote: > > > Updated kernel is named 2.4.18-5 on the RH site. > > Actually the latest update from RedHat is 2.4.18-17. There are indeed > several NFS-related fixes since 2.4.18-3, plus quite a lot of others. Have > you tried applying the patch to the 2.4.18-update kernel and failed ? > I'll probably do this here sometimes in the very near future, so I'll > appreciate any info on it. If not, you'll hear from me when I'll do it :-) > > -- > Bogdan Costescu > > IWR - Interdisziplinaeres Zentrum fuer Wissenschaftliches Rechnen > Universitaet Heidelberg, INF 368, D-69120 Heidelberg, GERMANY > Telephone: +49 6221 54 8869, Telefax: +49 6221 54 8868 > E-mail: Bogdan.Costescu @ IWR.Uni-Heidelberg.De -- _____________________________________________________ Dr. A. St-Cyr Research Associate, CFD Lab Department of Mechanical Engineering McGill University 688 Sherbrooke Street West, 7th floor Montreal, Qc, Canada H3A 2S6 Tel: +1 (514) 398-1710, Admin. Fax : 2203 amik @ cfdlab.mcgill.ca _____________________________________________________ _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From bogdan.costescu @ iwr.uni-heidelberg.de Sat Nov 9 00:39:52 2002 From: bogdan.costescu @ iwr.uni-heidelberg.de (Bogdan Costescu) Date: Fri, 8 Nov 2002 16:39:52 +0100 (CET) Subject: [SCore-users-jp] Re: [SCore-users] stock kernel unstable in Redhat 7.3 In-Reply-To: <1036768769.17419.32.camel@stan.cfdlab.mcgill.ca> Message-ID: On 8 Nov 2002, Amik St-Cyr CFD Lab wrote: > What is scaring me is that I compiled score from > source (5.0.1) and I needed almost 5 unmentioned patches > from the score group before getting it to fully compile. My idea was first to try to patch the "official" SCore kernel, 2.4.18-3 with the patch provided. If it works (as in if there are no rejects and the kernel compiles cleanly), then I would go further and try the patch on 2.4.18-17. > How can you manage to tell your users that their simulations > will crash every 5-12 hours ??? Uh, is your system crashing every 5-12 hours ??? We also have some problems here on the HELICS cluster using 5.0.1, but as there are also some hardware problems, we can't point the finger at SCore... -- Bogdan Costescu IWR - Interdisziplinaeres Zentrum fuer Wissenschaftliches Rechnen Universitaet Heidelberg, INF 368, D-69120 Heidelberg, GERMANY Telephone: +49 6221 54 8869, Telefax: +49 6221 54 8868 E-mail: Bogdan.Costescu @ IWR.Uni-Heidelberg.De _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From amik @ cfdlab.mcgill.ca Sat Nov 9 01:11:45 2002 From: amik @ cfdlab.mcgill.ca (Amik St-Cyr CFD Lab) Date: 08 Nov 2002 11:11:45 -0500 Subject: [SCore-users-jp] Re: [SCore-users] stock kernel unstable in Redhat 7.3 In-Reply-To: References: Message-ID: <1036771905.17419.68.camel@stan.cfdlab.mcgill.ca> You can see that in the Score-user archive (a few threads up) some people managed to do it provided a few supplemental patches from the SCore group. (compiling 2.4.18-3 + SCore Patch from source.) Best, Amik On Fri, 2002-11-08 at 10:39, Bogdan Costescu wrote: > On 8 Nov 2002, Amik St-Cyr CFD Lab wrote: > > > What is scaring me is that I compiled score from > > source (5.0.1) and I needed almost 5 unmentioned patches > > from the score group before getting it to fully compile. > > My idea was first to try to patch the "official" SCore kernel, 2.4.18-3 > with the patch provided. If it works (as in if there are no rejects and > the kernel compiles cleanly), then I would go further and try the patch on > 2.4.18-17. > > > How can you manage to tell your users that their simulations > > will crash every 5-12 hours ??? > > Uh, is your system crashing every 5-12 hours ??? We also have some > problems here on the HELICS cluster using 5.0.1, but as there are > also some hardware problems, we can't point the finger at SCore... > > -- > Bogdan Costescu > > IWR - Interdisziplinaeres Zentrum fuer Wissenschaftliches Rechnen > Universitaet Heidelberg, INF 368, D-69120 Heidelberg, GERMANY > Telephone: +49 6221 54 8869, Telefax: +49 6221 54 8868 > E-mail: Bogdan.Costescu @ IWR.Uni-Heidelberg.De -- _____________________________________________________ Dr. A. St-Cyr Research Associate, CFD Lab Department of Mechanical Engineering McGill University 688 Sherbrooke Street West, 7th floor Montreal, Qc, Canada H3A 2S6 Tel: +1 (514) 398-1710, Admin. Fax : 2203 amik @ cfdlab.mcgill.ca _____________________________________________________ _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From s-sumi @ bd6.so-net.ne.jp Sat Nov 9 02:22:31 2002 From: s-sumi @ bd6.so-net.ne.jp (Shinji Sumimoto) Date: Sat, 09 Nov 2002 02:22:31 +0900 (JST) Subject: [SCore-users-jp] Re: [SCore-users] stock kernel unstable in Redhat 7.3 In-Reply-To: <1036768769.17419.32.camel@stan.cfdlab.mcgill.ca> References: <1036768769.17419.32.camel@stan.cfdlab.mcgill.ca> Message-ID: <20021109.022231.74755044.s-sumi@bd6.so-net.ne.jp> Hi. Sorry for late response. I do not recommend to apply score patch to Redhat kernel because of too much reject files. :-< NFS around bugs are fixed on linux-2.4.19. Here is the NFS related patch list in redhat kernel spec file (The files are in /usr/src/redhat/SOURCES) ============================================================ # 15xx # NFS patches: selected bits from Trond's 2.4.19pre8 patchset # Patch1501: linux-2.4.19-nfs-01-pathconf.dif.txt Patch1503: linux-2.4.19-nfs-03-noac.dif.txt Patch1504: linux-2.4.19-nfs-04-seekdir.dif.txt Patch1505: linux-2.4.19-nfs-05-rdplus.dif.txt Patch1506: linux-2.4.19-nfs-06-rpc_bkl.dif.txt Patch1507: linux-2.4.19-nfs-07-bkl2.dif.txt Patch1508: linux-2.4.19-nfs-08-rpc_cong.dif.txt Patch1509: linux-2.4.19-nfs-09-rpc_wspace.dif.txt Patch1510: linux-2.4.19-nfs-10-ping.dif.txt Patch1511: linux-2.4.19-nfs-11-rpc_tweaks.dif.txt Patch1550: linux-2.4.18-nfs-default-size.patch # # 16xx # NFS server patches # Patch1600: linux-2.4.19-nfsd-B-NfsdErrFix.patch # end NFS ============================================================ If you want to fix the problem, I recommend to apply the above patch to score kernel or apply score patch to original 2.4.19 or 2.4.20rc1. However current score patch to original 2.4.18 but including various fixes. So I will send you, score-2.4.18 minimal patch. Try to apply it to original 2.4.19 or 2.4.20rc1 kernel. Some patches are rejected, but easy to fix them. PS: The patch will up www.pcclusters.org. Shinji. From: Amik St-Cyr CFD Lab Subject: [SCore-users-jp] Re: [SCore-users] stock kernel unstable in Redhat 7.3 Date: 08 Nov 2002 10:19:29 -0500 Message-ID: <1036768769.17419.32.camel @ stan.cfdlab.mcgill.ca> amik> We are planning to do it if no score developer does it. amik> What is scaring me is that I compiled score from amik> source (5.0.1) and I needed almost 5 unmentioned patches amik> from the score group before getting it to fully compile. amik> amik> I dont know how much patches I will need from them with amik> the revised kernel... amik> amik> Anyway, we have no choice, if they don't do it, we will. amik> How can you manage to tell your users that their simulations amik> will crash every 5-12 hours ??? amik> amik> Best, amik> amik> Amik amik> amik> On Fri, 2002-11-08 at 10:08, Bogdan Costescu wrote: amik> > On 8 Nov 2002, Amik St-Cyr CFD Lab wrote: amik> > amik> > > Updated kernel is named 2.4.18-5 on the RH site. amik> > amik> > Actually the latest update from RedHat is 2.4.18-17. There are indeed amik> > several NFS-related fixes since 2.4.18-3, plus quite a lot of others. Have amik> > you tried applying the patch to the 2.4.18-update kernel and failed ? amik> > I'll probably do this here sometimes in the very near future, so I'll amik> > appreciate any info on it. If not, you'll hear from me when I'll do it :-) amik> > amik> > -- amik> > Bogdan Costescu amik> > amik> > IWR - Interdisziplinaeres Zentrum fuer Wissenschaftliches Rechnen amik> > Universitaet Heidelberg, INF 368, D-69120 Heidelberg, GERMANY amik> > Telephone: +49 6221 54 8869, Telefax: +49 6221 54 8868 amik> > E-mail: Bogdan.Costescu @ IWR.Uni-Heidelberg.De amik> -- amik> _____________________________________________________ amik> Dr. A. St-Cyr amik> Research Associate, CFD Lab amik> Department of Mechanical Engineering amik> McGill University amik> 688 Sherbrooke Street West, 7th floor amik> Montreal, Qc, Canada H3A 2S6 amik> Tel: +1 (514) 398-1710, Admin. Fax : 2203 amik> amik @ cfdlab.mcgill.ca amik> _____________________________________________________ amik> amik> _______________________________________________ amik> SCore-users mailing list amik> SCore-users @ pccluster.org amik> http://www.pccluster.org/mailman/listinfo/score-users amik> _______________________________________________ amik> SCore-users-jp mailing list amik> SCore-users-jp @ pccluster.org amik> http://www.pccluster.org/mailman/listinfo/score-users-jp amik> ----- Shinji Sumimoto E-Mail: s-sumi @ bd6.so-net.ne.jp _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From amik @ cfdlab.mcgill.ca Sat Nov 9 02:59:13 2002 From: amik @ cfdlab.mcgill.ca (Amik St-Cyr CFD Lab) Date: 08 Nov 2002 12:59:13 -0500 Subject: [SCore-users-jp] Re: [SCore-users] stock kernel unstable in Redhat 7.3 In-Reply-To: <20021109.022231.74755044.s-sumi@bd6.so-net.ne.jp> References: <1036768769.17419.32.camel@stan.cfdlab.mcgill.ca> <20021109.022231.74755044.s-sumi@bd6.so-net.ne.jp> Message-ID: <1036778353.17419.81.camel@stan.cfdlab.mcgill.ca> Shinji, The problem with the flushtlb is also resolved in that kernel? Amik On Fri, 2002-11-08 at 12:22, Shinji Sumimoto wrote: > Hi. > > Sorry for late response. > > I do not recommend to apply score patch to Redhat kernel because of > too much reject files. :-< > > NFS around bugs are fixed on linux-2.4.19. > > Here is the NFS related patch list in redhat kernel spec file > (The files are in /usr/src/redhat/SOURCES) > ============================================================ > # 15xx > # NFS patches: selected bits from Trond's 2.4.19pre8 patchset > # > Patch1501: linux-2.4.19-nfs-01-pathconf.dif.txt > Patch1503: linux-2.4.19-nfs-03-noac.dif.txt > Patch1504: linux-2.4.19-nfs-04-seekdir.dif.txt > Patch1505: linux-2.4.19-nfs-05-rdplus.dif.txt > Patch1506: linux-2.4.19-nfs-06-rpc_bkl.dif.txt > Patch1507: linux-2.4.19-nfs-07-bkl2.dif.txt > Patch1508: linux-2.4.19-nfs-08-rpc_cong.dif.txt > Patch1509: linux-2.4.19-nfs-09-rpc_wspace.dif.txt > Patch1510: linux-2.4.19-nfs-10-ping.dif.txt > Patch1511: linux-2.4.19-nfs-11-rpc_tweaks.dif.txt > Patch1550: linux-2.4.18-nfs-default-size.patch > # > # 16xx > # NFS server patches > # > Patch1600: linux-2.4.19-nfsd-B-NfsdErrFix.patch > # end NFS > ============================================================ > > If you want to fix the problem, I recommend to apply the above patch > to score kernel or apply score patch to original 2.4.19 or 2.4.20rc1. > > However current score patch to original 2.4.18 but including various > fixes. > > So I will send you, score-2.4.18 minimal patch. > Try to apply it to original 2.4.19 or 2.4.20rc1 kernel. > > Some patches are rejected, but easy to fix them. > > PS: The patch will up www.pcclusters.org. > > Shinji. > > From: Amik St-Cyr CFD Lab > Subject: [SCore-users-jp] Re: [SCore-users] stock kernel unstable in Redhat 7.3 > Date: 08 Nov 2002 10:19:29 -0500 > Message-ID: <1036768769.17419.32.camel @ stan.cfdlab.mcgill.ca> > > amik> We are planning to do it if no score developer does it. > amik> What is scaring me is that I compiled score from > amik> source (5.0.1) and I needed almost 5 unmentioned patches > amik> from the score group before getting it to fully compile. > amik> > amik> I dont know how much patches I will need from them with > amik> the revised kernel... > amik> > amik> Anyway, we have no choice, if they don't do it, we will. > amik> How can you manage to tell your users that their simulations > amik> will crash every 5-12 hours ??? > amik> > amik> Best, > amik> > amik> Amik > amik> > amik> On Fri, 2002-11-08 at 10:08, Bogdan Costescu wrote: > amik> > On 8 Nov 2002, Amik St-Cyr CFD Lab wrote: > amik> > > amik> > > Updated kernel is named 2.4.18-5 on the RH site. > amik> > > amik> > Actually the latest update from RedHat is 2.4.18-17. There are indeed > amik> > several NFS-related fixes since 2.4.18-3, plus quite a lot of others. Have > amik> > you tried applying the patch to the 2.4.18-update kernel and failed ? > amik> > I'll probably do this here sometimes in the very near future, so I'll > amik> > appreciate any info on it. If not, you'll hear from me when I'll do it :-) > amik> > > amik> > -- > amik> > Bogdan Costescu > amik> > > amik> > IWR - Interdisziplinaeres Zentrum fuer Wissenschaftliches Rechnen > amik> > Universitaet Heidelberg, INF 368, D-69120 Heidelberg, GERMANY > amik> > Telephone: +49 6221 54 8869, Telefax: +49 6221 54 8868 > amik> > E-mail: Bogdan.Costescu @ IWR.Uni-Heidelberg.De > amik> -- > amik> _____________________________________________________ > amik> Dr. A. St-Cyr > amik> Research Associate, CFD Lab > amik> Department of Mechanical Engineering > amik> McGill University > amik> 688 Sherbrooke Street West, 7th floor > amik> Montreal, Qc, Canada H3A 2S6 > amik> Tel: +1 (514) 398-1710, Admin. Fax : 2203 > amik> amik @ cfdlab.mcgill.ca > amik> _____________________________________________________ > amik> > amik> _______________________________________________ > amik> SCore-users mailing list > amik> SCore-users @ pccluster.org > amik> http://www.pccluster.org/mailman/listinfo/score-users > amik> _______________________________________________ > amik> SCore-users-jp mailing list > amik> SCore-users-jp @ pccluster.org > amik> http://www.pccluster.org/mailman/listinfo/score-users-jp > amik> > ----- > Shinji Sumimoto E-Mail: s-sumi @ bd6.so-net.ne.jp -- _____________________________________________________ Dr. A. St-Cyr Research Associate, CFD Lab Department of Mechanical Engineering McGill University 688 Sherbrooke Street West, 7th floor Montreal, Qc, Canada H3A 2S6 Tel: +1 (514) 398-1710, Admin. Fax : 2203 amik @ cfdlab.mcgill.ca _____________________________________________________ _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From s-sumi @ bd6.so-net.ne.jp Sat Nov 9 03:10:04 2002 From: s-sumi @ bd6.so-net.ne.jp (Shinji Sumimoto) Date: Sat, 09 Nov 2002 03:10:04 +0900 (JST) Subject: [SCore-users-jp] Re: [SCore-users] stock kernel unstable in Redhat 7.3 In-Reply-To: <1036778353.17419.81.camel@stan.cfdlab.mcgill.ca> References: <1036768769.17419.32.camel@stan.cfdlab.mcgill.ca> <20021109.022231.74755044.s-sumi@bd6.so-net.ne.jp> <1036778353.17419.81.camel@stan.cfdlab.mcgill.ca> Message-ID: <20021109.031004.108739199.s-sumi@bd6.so-net.ne.jp> Hi. I search the number 66143 in the kernel spec file. But I could not found the number. I search the number 66143 and found the patch. The following two patch. Please try this. ============================================================== --- drivers/ide/ide-dma.c.orig Tue Feb 26 11:50:13 2002 +++ drivers/ide/ide-dma.c Wed Jun 5 16:19:15 2002 @@ -813,6 +813,7 @@ case PCI_DEVICE_ID_AL_M5219: case PCI_DEVICE_ID_AMD_VIPER_7409: case PCI_DEVICE_ID_CMD_643: + case PCI_DEVICE_ID_SERVERWORKS_CSB5IDE: outb(inb(dma_base+2) & 0x60, dma_base+2); if (inb(dma_base+2) & 0x80) { printk("%s: simplex device: DMA forced\n", name); ============================================================== --- include/asm-i386/io.h.orig Wed Feb 6 15:53:22 2002 +++ include/asm-i386/io.h Wed Jun 5 17:07:40 2002 @@ -76,7 +76,11 @@ /* * Change "struct page" to physical address. */ +#ifdef CONFIG_HIGHMEM64G +#define page_to_phys(page) ((u64)(page - mem_map) << PAGE_SHIFT) +#else #define page_to_phys(page) ((page - mem_map) << PAGE_SHIFT) +#endif extern void * __ioremap(unsigned long offset, unsigned long size, unsigned long flags); ============================================================== You can see http://bugzilla.redhat.com/bugzilla/show_bug.cgi?id=66143 Shinji. From: Amik St-Cyr CFD Lab Subject: Re: [SCore-users-jp] Re: [SCore-users] stock kernel unstable in Redhat 7.3 Date: 08 Nov 2002 12:59:13 -0500 Message-ID: <1036778353.17419.81.camel @ stan.cfdlab.mcgill.ca> amik> Shinji, amik> amik> The problem with the flushtlb is also resolved in that kernel? amik> amik> Amik amik> amik> On Fri, 2002-11-08 at 12:22, Shinji Sumimoto wrote: amik> > Hi. amik> > amik> > Sorry for late response. amik> > amik> > I do not recommend to apply score patch to Redhat kernel because of amik> > too much reject files. :-< amik> > amik> > NFS around bugs are fixed on linux-2.4.19. amik> > amik> > Here is the NFS related patch list in redhat kernel spec file amik> > (The files are in /usr/src/redhat/SOURCES) amik> > ============================================================ amik> > # 15xx amik> > # NFS patches: selected bits from Trond's 2.4.19pre8 patchset amik> > # amik> > Patch1501: linux-2.4.19-nfs-01-pathconf.dif.txt amik> > Patch1503: linux-2.4.19-nfs-03-noac.dif.txt amik> > Patch1504: linux-2.4.19-nfs-04-seekdir.dif.txt amik> > Patch1505: linux-2.4.19-nfs-05-rdplus.dif.txt amik> > Patch1506: linux-2.4.19-nfs-06-rpc_bkl.dif.txt amik> > Patch1507: linux-2.4.19-nfs-07-bkl2.dif.txt amik> > Patch1508: linux-2.4.19-nfs-08-rpc_cong.dif.txt amik> > Patch1509: linux-2.4.19-nfs-09-rpc_wspace.dif.txt amik> > Patch1510: linux-2.4.19-nfs-10-ping.dif.txt amik> > Patch1511: linux-2.4.19-nfs-11-rpc_tweaks.dif.txt amik> > Patch1550: linux-2.4.18-nfs-default-size.patch amik> > # amik> > # 16xx amik> > # NFS server patches amik> > # amik> > Patch1600: linux-2.4.19-nfsd-B-NfsdErrFix.patch amik> > # end NFS amik> > ============================================================ amik> > amik> > If you want to fix the problem, I recommend to apply the above patch amik> > to score kernel or apply score patch to original 2.4.19 or 2.4.20rc1. amik> > amik> > However current score patch to original 2.4.18 but including various amik> > fixes. amik> > amik> > So I will send you, score-2.4.18 minimal patch. amik> > Try to apply it to original 2.4.19 or 2.4.20rc1 kernel. amik> > amik> > Some patches are rejected, but easy to fix them. amik> > amik> > PS: The patch will up www.pcclusters.org. amik> > amik> > Shinji. amik> > amik> > From: Amik St-Cyr CFD Lab amik> > Subject: [SCore-users-jp] Re: [SCore-users] stock kernel unstable in Redhat 7.3 amik> > Date: 08 Nov 2002 10:19:29 -0500 amik> > Message-ID: <1036768769.17419.32.camel @ stan.cfdlab.mcgill.ca> amik> > amik> > amik> We are planning to do it if no score developer does it. amik> > amik> What is scaring me is that I compiled score from amik> > amik> source (5.0.1) and I needed almost 5 unmentioned patches amik> > amik> from the score group before getting it to fully compile. amik> > amik> amik> > amik> I dont know how much patches I will need from them with amik> > amik> the revised kernel... amik> > amik> amik> > amik> Anyway, we have no choice, if they don't do it, we will. amik> > amik> How can you manage to tell your users that their simulations amik> > amik> will crash every 5-12 hours ??? amik> > amik> amik> > amik> Best, amik> > amik> amik> > amik> Amik amik> > amik> amik> > amik> On Fri, 2002-11-08 at 10:08, Bogdan Costescu wrote: amik> > amik> > On 8 Nov 2002, Amik St-Cyr CFD Lab wrote: amik> > amik> > amik> > amik> > > Updated kernel is named 2.4.18-5 on the RH site. amik> > amik> > amik> > amik> > Actually the latest update from RedHat is 2.4.18-17. There are indeed amik> > amik> > several NFS-related fixes since 2.4.18-3, plus quite a lot of others. Have amik> > amik> > you tried applying the patch to the 2.4.18-update kernel and failed ? amik> > amik> > I'll probably do this here sometimes in the very near future, so I'll amik> > amik> > appreciate any info on it. If not, you'll hear from me when I'll do it :-) amik> > amik> > amik> > amik> > -- amik> > amik> > Bogdan Costescu amik> > amik> > amik> > amik> > IWR - Interdisziplinaeres Zentrum fuer Wissenschaftliches Rechnen amik> > amik> > Universitaet Heidelberg, INF 368, D-69120 Heidelberg, GERMANY amik> > amik> > Telephone: +49 6221 54 8869, Telefax: +49 6221 54 8868 amik> > amik> > E-mail: Bogdan.Costescu @ IWR.Uni-Heidelberg.De amik> > amik> -- amik> > amik> _____________________________________________________ amik> > amik> Dr. A. St-Cyr amik> > amik> Research Associate, CFD Lab amik> > amik> Department of Mechanical Engineering amik> > amik> McGill University amik> > amik> 688 Sherbrooke Street West, 7th floor amik> > amik> Montreal, Qc, Canada H3A 2S6 amik> > amik> Tel: +1 (514) 398-1710, Admin. Fax : 2203 amik> > amik> amik @ cfdlab.mcgill.ca amik> > amik> _____________________________________________________ amik> > amik> amik> > amik> _______________________________________________ amik> > amik> SCore-users mailing list amik> > amik> SCore-users @ pccluster.org amik> > amik> http://www.pccluster.org/mailman/listinfo/score-users amik> > amik> _______________________________________________ amik> > amik> SCore-users-jp mailing list amik> > amik> SCore-users-jp @ pccluster.org amik> > amik> http://www.pccluster.org/mailman/listinfo/score-users-jp amik> > amik> amik> > ----- amik> > Shinji Sumimoto E-Mail: s-sumi @ bd6.so-net.ne.jp amik> -- amik> _____________________________________________________ amik> Dr. A. St-Cyr amik> Research Associate, CFD Lab amik> Department of Mechanical Engineering amik> McGill University amik> 688 Sherbrooke Street West, 7th floor amik> Montreal, Qc, Canada H3A 2S6 amik> Tel: +1 (514) 398-1710, Admin. Fax : 2203 amik> amik @ cfdlab.mcgill.ca amik> _____________________________________________________ amik> ----- Shinji Sumimoto E-Mail: s-sumi @ bd6.so-net.ne.jp _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From s-sumi @ bd6.so-net.ne.jp Sat Nov 9 09:51:37 2002 From: s-sumi @ bd6.so-net.ne.jp (Shinji Sumimoto) Date: Sat, 09 Nov 2002 09:51:37 +0900 (JST) Subject: [SCore-users-jp] Re: [SCore-users] stock kernel unstable in Redhat 7.3 In-Reply-To: <1036784288.17418.100.camel@stan.cfdlab.mcgill.ca> References: <1036778353.17419.81.camel@stan.cfdlab.mcgill.ca> <20021109.031004.108739199.s-sumi@bd6.so-net.ne.jp> <1036784288.17418.100.camel@stan.cfdlab.mcgill.ca> Message-ID: <20021109.095137.74755633.s-sumi@bd6.so-net.ne.jp> Hi. Could you give us more information of your system crash? Panic with messages? or dumb? Is the system crash is file server or computing nodes? If the crash node is computing node and every crash is the same node, it may be hardware problem or some environmental problems, such as different configution. Shinji. From: Amik St-Cyr CFD Lab Subject: Re: [SCore-users-jp] Re: [SCore-users] stock kernel unstable in Redhat 7.3 Date: 08 Nov 2002 14:38:07 -0500 Message-ID: <1036784288.17418.100.camel @ stan.cfdlab.mcgill.ca> amik> I think it is not the right one: amik> amik> http://marc.theaimsgroup.com/?l=linux-kernel&m=102208353523931&w=2 amik> amik> We need to be very sure this time before doing the amik> work. amik> amik> Thank you, amik> amik> Amik amik> _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From h995011b @ mbox.media.nagoya-u.ac.jp Sat Nov 9 17:01:34 2002 From: h995011b @ mbox.media.nagoya-u.ac.jp (Naoshi Ueda) Date: Sat, 9 Nov 2002 17:01:34 +0900 Subject: [SCore-users-jp] (no subject) Message-ID: <200211091701.EJH21695.9269C20I@mbox.media.nagoya-u.ac.jp> 名古屋大学の上田です。 現在、プログラム言語としてFORTRANを使用しているのですが、WINDOWS ではコンパイラにメモリの制限があるために、PCにどれだけ多くのメモ リを積んでも意味がないと聞きます。一方、LINUXではPCのメモリをフ ルに利用できると聞いたのですが、ここで一つ疑問があります。 どのようなものかと申しますと、SCore環境にすることでメモリの制限 が行われてしまうかどうかということです。 近日中に、PCを購入しようと考えており、解析のためにメモリを多く積 みたいと考えているところです。仮に、メモリの制限が行われてしまう と多く積んだメモリが無駄になることになってしまうので、ぜひともそ の点について詳しく知りたいと思っております。 どうぞ御回答よろしくお願いします。 追伸:上記の内容が不正確かまたは的外れなものでしたら、申し訳ござ いませんが訂正し、コンパイラやメモリのことについて教えていただけ たら幸いです。 ================================ 名古屋大学工学部 コンクリート構造研究室 上田 尚史 E-mail:h995011b @ mbox.media.nagoya-u.ac.jp ================================ From s-sumi @ bd6.so-net.ne.jp Sat Nov 9 20:42:51 2002 From: s-sumi @ bd6.so-net.ne.jp (Shinji Sumimoto) Date: Sat, 09 Nov 2002 20:42:51 +0900 (JST) Subject: [SCore-users-jp] (no subject) In-Reply-To: <200211091701.EJH21695.9269C20I@mbox.media.nagoya-u.ac.jp> References: <200211091701.EJH21695.9269C20I@mbox.media.nagoya-u.ac.jp> Message-ID: <20021109.204251.55514961.s-sumi@bd6.so-net.ne.jp> 富士通研の住元です。 From: Naoshi Ueda Subject: [SCore-users-jp] (no subject) Date: Sat, 9 Nov 2002 17:01:34 +0900 Message-ID: <200211091701.EJH21695.9269C20I @ mbox.media.nagoya-u.ac.jp> h995011b> 現在、プログラム言語としてFORTRANを使用しているのですが、WINDOWS h995011b> ではコンパイラにメモリの制限があるために、PCにどれだけ多くのメモ h995011b> リを積んでも意味がないと聞きます。一方、LINUXではPCのメモリをフ h995011b> ルに利用できると聞いたのですが、ここで一つ疑問があります。 h995011b> どのようなものかと申しますと、SCore環境にすることでメモリの制限 h995011b> が行われてしまうかどうかということです。 SCoreのプロセス実行環境はLinuxのものと同じですので、SCore用の作業領域 として多少のメモリは消費しますが、極端に(例えば半分)少なくなると言う ことはありません。また、1台では少なくてもクラスタ全体では、複数のノー ド分のメモリが使えますので、メモリが多く欲しい場合にはノード数を増やす という方法もとれます。 具体的にどれくらいのメモリを使うのでしょうか? 1GBでしょうか? 4GBでしょうか? 32bitマシンはもともと4GBのアドレス空間しかありませんので、通常は1GBの メモリ空間、Himemでも2GBの空間になります。当然、コンパイラによりアドレ ス空間に制限がある場合があります。 MAXのメモリ量というと、1 CPUでしたら2-3GB程度、2CPUでしたら、4-5GBとい うのが目安です。それ以上積んでもファイルキャッシュようには使えるかもし れませんが、、 h995011b> 近日中に、PCを購入しようと考えており、解析のためにメモリを多く積 h995011b> みたいと考えているところです。仮に、メモリの制限が行われてしまう h995011b> と多く積んだメモリが無駄になることになってしまうので、ぜひともそ h995011b> の点について詳しく知りたいと思っております。 h995011b> h995011b> どうぞ御回答よろしくお願いします。 h995011b> h995011b> 追伸:上記の内容が不正確かまたは的外れなものでしたら、申し訳ござ h995011b> いませんが訂正し、コンパイラやメモリのことについて教えていただけ h995011b> たら幸いです。 h995011b> h995011b> h995011b> ================================ h995011b> 名古屋大学工学部 コンクリート構造研究室 h995011b> 上田 尚史 h995011b> E-mail:h995011b @ mbox.media.nagoya-u.ac.jp h995011b> ================================ h995011b> _______________________________________________ h995011b> SCore-users-jp mailing list h995011b> SCore-users-jp @ pccluster.org h995011b> http://www.pccluster.org/mailman/listinfo/score-users-jp h995011b> ----- Shinji Sumimoto E-Mail: s-sumi @ bd6.so-net.ne.jp From kameyama @ pccluster.org Mon Nov 11 10:13:43 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Mon, 11 Nov 2002 10:13:43 +0900 Subject: [SCore-users-jp] (no subject) In-Reply-To: Your message of "Sat, 09 Nov 2002 20:42:51 JST." <20021109.204251.55514961.s-sumi@bd6.so-net.ne.jp> Message-ID: <20021111011312.BD12C20040@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <20021109.204251.55514961.s-sumi @ bd6.so-net.ne.jp> Shinji Sumimoto wrotes: > 32bitマシンはもともと4GBのアドレス空間しかありませんので、通常は1GBの > メモリ空間、Himemでも2GBの空間になります。 Himem の場合は user 空間は 3 GB です. これはいくらメモリを積んでも一つのプロセスでは 3 GB 以上のメモリは使用できないことを意味します. また, 全体の memory が 4 GB を超える場合は kernel に CONFIG_HIGHMEM64G を指定してコンパイルする必要があります. (EIT で install する場合, 適切な kernel が選択されるはずですが, テストしていません.) > 当然、コンパイラによりアドレ > ス空間に制限がある場合があります。 メモリを関数内にとるか関数外にとるかで使用できる容量が変わることも あります. (limit もしくは ulimit によって stack size が制限されている 可能性があるため.) > MAXのメモリ量というと、1 CPUでしたら2-3GB程度、2CPUでしたら、4-5GBとい > うのが目安です。それ以上積んでもファイルキャッシュようには使えるかもし > れませんが、、 multi user mode で複数の job を動かす場合は意味があるかもしれませんが... from Kameyama Toyohisa From k-hayashiatsogo-eng.co.jp Mon Nov 11 13:51:20 2002 From: k-hayashiatsogo-eng.co.jp (Keizo Hayashi) Date: Mon, 11 Nov 2002 13:51:20 +0900 Subject: [SCore-users-jp] SCore5.2をインストールしたらXが起動せず Message-ID: <004701c2893e$17f9f4f0$c500a8c0@0292hayashi> メーリングリストの皆様、お世話になります。 林敬三@綜合技術コンサルタントです。 以前もお世話になりましたが、このたび機械も新調し、改めて PCクラスタシステムを一から構築することとしました。 が、タイトルのとおり、SCoreをインストールしたらXが起動しなくなって しまいましたので、質問させていただきます。 今後は私も知り得た知識を生かして、ほかの方々の力になれることが あれば、積極的に支援したいと思っています。よろしくお願いします。 さて、今回質問させていただくのは、Webサイトからダウンロードした SCore5.2をインストールし、PCのリブート後にstartxと打ち込むと、 今まではXが起動していたのが、エラーメッセージを表示してXが起動 しなくなってしまったという現象です。Xを使わないテキスト環境では、 正常に並列計算ができます。 しかし、PCクラスタシステムでは、計算結果をグラフィカルに表示する 用途も考えていますので、Xはぜひ使用したいです。 何かわかりましたら、原因や対処を教えていただけないでしょうか。 以下に、使用環境などを記します。 ========== X起動時のエラーメッセージ 開始 ================ server error: no screens found When reporting a problem related to a server crash, please send the full server output, not just the last messages. This can be found in the log file "/var/log/XFree86.0.log". Please report problems to xfree86 @ xfree86.org. XIO: fatal IO error 104 (Connection reset by peer) on X server ":0.0" after 0 requests (0 known processed) with 0 events remaining. ========== X起動時のエラーメッセージ 終了 ================ あれっと思い、 # export DISPLAY=linux1.sgc.org:0.0 と打って、再度startxしてみましたが、同じでした。 使用マシン メーカー製PC:Celeron-1.3G、384M-RAM、40G-HDD    Intel810Eチップセット+オンボードグラフィック、オンボードNIC サーバホスト1台+計算ホスト3台の全4台構成、すべて同一仕様。 ホスト名=linux1.sgc.org 〜 linux4.sgc.org 使用ソフトウェア RedHat Linux7.3(書籍付属)  カーネルバージョン:2.4.18-3 + XFree4.2.0-8  インストールは「カスタム」を選択、「すべて」インストール。  SCoreインストール前にhostsやNISなどの設定を完了。 SCore5.2(Webよりダウンロード) (Windows2000Professionalとのデュアルブートで使用) インストールの経緯 サーバホスト ・ RedHat Linux7.3を「すべて」でインストールし、  hosts編集、NIS(マスタサーバ)設定などを完了。  テキストでログインし、startxでXが起動する状態にセッティング。 ・ ダウンロードしたSCore5.2をgunzip解凍してCD-Rへ焼き、  CD-RのISOファイルをマウントして、./Install を実行。 ・ その後、 eit -nisonly を打ち、インストールを完了。 ・ インストールを終了してリブートした後、startxを打つと、上記の  エラーメッセージが出てXを起動できない。 計算ホスト ・ サーバホスト同様、Redhat7.3を「すべて」でインストール、  NIS設定(スレーブサーバ)も実施。 ・ サーバホスト同様、CD-RのISOファイルをマウントし、ドキュメントに  従って以下入力。 # cd /mnt/cdrom/RedHat/RPMS/ # rpm -U kernel-headers-2.4.18-*.rpm (ファイルが無かったが、強行) # rpm -U kernel-source-2.4.18*.rpm (ファイルが無かったが、強行) # rpm -U kernel-doc-2.4.18-*.rpm # rpm -U kernel-2.4.18-*SCORE.i686.rpm # rpm -U kernel-smp-2.4.18-*SCORE.i686.rpm この段階でリブートし、startxと打つと、サーバホスト同様に上記 エラーメッセージが表示され、Xが起動しない。 とりあえず残りのインストールを進め、テキスト環境で並列計算が できることを確認しましたので、SCore5.2事態のインストールは うまくいっているものと思います。 現象は以上です。何かわかりましたらよろしくお願いします。 ================================= (株)綜合技術コンサルタント IT管理室 林 敬三 k-hayashi at sogo-eng.co.jp ================================= From nakata @ bestsystems.co.jp Mon Nov 11 13:31:00 2002 From: nakata @ bestsystems.co.jp (Hisaho Nakata) Date: Mon, 11 Nov 2002 13:31:00 +0900 Subject: [SCore-users-jp] SCore5.2をインストールしたらXが起動せず In-Reply-To: <004701c2893e$17f9f4f0$c500a8c0@0292hayashi> References: <004701c2893e$17f9f4f0$c500a8c0@0292hayashi> Message-ID: <20021111133100.72231464.nakata@bestsystems.co.jp> 中田@ベストシステムズです。 /var/log/XFree86.0.logにエラーログがでているのでそれを見れば、 何が原因か大体分かると思います。 > さて、今回質問させていただくのは、Webサイトからダウンロードした > SCore5.2をインストールし、PCのリブート後にstartxと打ち込むと、 > 今まではXが起動していたのが、エラーメッセージを表示してXが起動 > しなくなってしまったという現象です。Xを使わないテキスト環境では、 > 正常に並列計算ができます。 > しかし、PCクラスタシステムでは、計算結果をグラフィカルに表示する > 用途も考えていますので、Xはぜひ使用したいです。 > 何かわかりましたら、原因や対処を教えていただけないでしょうか。 > 以下に、使用環境などを記します。 ======================================================================== 株式会社 ベストシステムズ システムソリューション事業部テクニカルサポート 中田 寿穗 (nakata @ bestsystems.co.jp) 〒110-0016 東京都台東区台東2-18-8 台東K-1ビル 2,3F Tel: 03-5812-1350 Fax: 03-5812-1351 ======================================================================== From kameyama @ pccluster.org Mon Nov 11 14:18:51 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Mon, 11 Nov 2002 14:18:51 +0900 Subject: [SCore-users-jp] SCore5.2をインストールしたらXが起動せず In-Reply-To: Your message of "Mon, 11 Nov 2002 13:51:20 JST." <004701c2893e$17f9f4f0$c500a8c0@0292hayashi> Message-ID: <20021111051818.9D25720040@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <004701c2893e$17f9f4f0$c500a8c0 @ 0292hayashi> "Keizo Hayashi" wrotes: > 使用マシン > メーカー製PC:Celeron-1.3G、384M-RAM、40G-HDD >    Intel810Eチップセット+オンボードグラフィック、オンボードNIC > サーバホスト1台+計算ホスト3台の全4台構成、すべて同一仕様。 > ホスト名=linux1.sgc.org 〜 linux4.sgc.org この構成でサーバを計算ホストと兼用する設定にしているのでしょうか? (つまり, kernel を変更したかどうか, なんですが...) 入れ換えたのでしたら % dmesg | grep agp を行ってください. そこで, agpgart: Maximum main memory to use for agp memory:... などというメッセージが出ているかどうか確認してください. 出ていなかったら, # /sbin/modprobe agpgart をやってみてください. オンチップの graphic を使用する場合はこの kernel module が必要になります. > 計算ホスト > ・ サーバホスト同様、Redhat7.3を「すべて」でインストール、 >  NIS設定(スレーブサーバ)も実施。 > ・ サーバホスト同様、CD-RのISOファイルをマウントし、ドキュメントに >  従って以下入力。 > # cd /mnt/cdrom/RedHat/RPMS/ > # rpm -U kernel-headers-2.4.18-*.rpm (ファイルが無かったが、強行) > # rpm -U kernel-source-2.4.18*.rpm (ファイルが無かったが、強行) > # rpm -U kernel-doc-2.4.18-*.rpm > # rpm -U kernel-2.4.18-*SCORE.i686.rpm > # rpm -U kernel-smp-2.4.18-*SCORE.i686.rpm EIT で install する場合, 事前に redhat を install する必要は無いのですが... また, EIT で install した場合, kernel は SCore 対応のものに変更されています. ただ, X server を install していませんので, X は立ち上がらないと思います. from Kameyama Toyohisa From e973220 @ eve.u-ryukyu.ac.jp Mon Nov 11 14:50:51 2002 From: e973220 @ eve.u-ryukyu.ac.jp (金城 尚志) Date: Mon, 11 Nov 2002 14:50:51 +0900 Subject: [SCore-users-jp] ネットワークトランキング(PM/Ethernet)の設定 In-Reply-To: <20021111051818.9D25720040@neal.il.is.s.u-tokyo.ac.jp> Message-ID: こんにちわ。 琉球大学の金城です。 今回、ネットワークトランキングの設定 (異なるマザーボードを利用する際のEthernetのデバイス番号の割り当て) について質問させていただきたいと思っています。 よろしく御願いします。 【環境】 ・サーバホスト:1台 scib134.sci.u-ryukyu.ac.jp ・計算ホスト :4台 comp0.sci.u-ryukyu.ac.jp comp1.sci.u-ryukyu.ac.jp comp2.sci.u-ryukyu.ac.jp comp3.sci.u-ryukyu.ac.jp ・100BaseEthernet このうち、comp0だけがオンボードのNIC(eth0)を 搭載。しかしドライバが適合しないため、使用不可。 ^^^^^^^^^^^ 【実現したいこと】 オンボードイーサネット(eth0)を無視した NIC三枚での ネットワークトランキングの設定をしたい。 具体的には、 comp0 においては 【eth1】【eth2】【eth3】を使用 comp1-3においては 【eth0】【eth1】【eth2】を使用する。 【やってみたこと】 ・Network Trunking機構(PM/Ethernet)のシステム管理者ガイド http://www.google.co.jp/search?q=cache:JSZBMQw09B8C:pdswww.rwcp.or.jp/score/ dist/score/html-j/ja/reference/pm/ether-trunking.html+Network+Trunking&hl=ja &lr=lang_ja&ie=UTF-8 を参照してやってみましたが、 恥ずかしながら、どのようにしたらよいのか さっぱりわかりませんでした。 これだけの情報では不十分かもしれませんが、 どうかよろしく御願いします。 ━┛━┛━┛━┛━┛━┛━┛━┛━┛   琉球大学理学部 物質地球科学科   金城 尚志 (キンジョウヒサシ) ━┛━┛━┛━┛━┛━┛━┛━┛━┛ From kameyama @ pccluster.org Mon Nov 11 15:31:51 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Mon, 11 Nov 2002 15:31:51 +0900 Subject: [SCore-users-jp] ネットワークトランキング(PM/Ethernet)の設定 In-Reply-To: Your message of "Mon, 11 Nov 2002 14:50:51 JST." Message-ID: <20021111063117.E205820040@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article "金城 尚志" wrotes: > 【実現したいこと】 > オンボードイーサネット(eth0)を無視した > NIC三枚での > ネットワークトランキングの設定をしたい。 > > 具体的には、 > comp0 においては 【eth1】【eth2】【eth3】を使用 > comp1-3においては 【eth0】【eth1】【eth2】を使用する。 ethernet の config file で必要なのは unit 番号で uunit 番号と device の 割り当ては /sbin/etherpmctl で決定します. 手順としては, 以下のようになると思います. 1. config file の作成 3 つのそれぞれの device ごとの config file を作成します. % mkpmethernetconf -g group -device ... ではうまくいきませんので, 手動もしくは 0 comp0 /dev/eth1 1 comp1 /dev/eth0 2 comp2 /dev/eth0 3 comp3 /dev/eth0 のようなファイルを作って, そのファイルを渡します. それぞれ unit 番号は変更しておきます. 2. etherpmctl の設定 /etc/rc.d/init.d/pm_ethernet を編集して, 必要なだけ etherpmctl を起動します. 多分, comp0 は /sbin/etherpmctl eth0 -pm on -ir on unit 0 /sbin/etherpmctl eth1 -pm on -ir on unit 1 /sbin/etherpmctl eth2 -pm on -ir on unit 2 その他は /sbin/etherpmctl eth1 -pm on -ir on unit 0 /sbin/etherpmctl eth2 -pm on -ir on unit 1 /sbin/etherpmctl eth3 -pm on -ir on unit 2 のようになると思います. 3. scoreboard データベースを編集する. trunking 用の network を登録し, 各ホストの network 部分も更新します. > ・Network Trunking機構(PM/Ethernet)のシステム管理者ガイド > http://www.google.co.jp/search?q=cache:JSZBMQw09B8C:pdswww.rwcp.or.jp/score/ > dist/score/html-j/ja/reference/pm/ether-trunking.html+Network+Trunking&hl=ja > &lr=lang_ja&ie=UTF-8 最新は http://www.pccluster.org/score/dist/score/html/ja/reference/pm/ether-trunking.html にあります. (内容は変わっていないかも知れませんが...) pm-ethernet.conf 設定ファイルの作成がちょっと面倒なのと /etc/rc.d/init.d/pm_ethernet の更新がホストんいよって異なることに 注意すればあとはドキュメント通りだと思います. from Kameyama Toyohisa From k-hayashiatsogo-eng.co.jp Mon Nov 11 17:02:39 2002 From: k-hayashiatsogo-eng.co.jp (Keizo Hayashi) Date: Mon, 11 Nov 2002 17:02:39 +0900 Subject: [SCore-users-jp] SCore5.2をインストールしたらXが起動せず References: <004701c2893e$17f9f4f0$c500a8c0@0292hayashi> <20021111133100.72231464.nakata@bestsystems.co.jp> Message-ID: <004f01c28959$4729eda0$c500a8c0@0292hayashi> 林敬三@綜合技術コンサルタントです。 中田様、さっそくのアドバイスありがとうございます。 > > /var/log/XFree86.0.logにエラーログがでているのでそれを見れば、 > 何が原因か大体分かると思います。 > この件、さっそく調査しました。内容については、もう一つの方のリプライに 入れさせていただきました(亀山さんのほうです)。 どうもありがとうございました。 以上 ================================= (株)綜合技術コンサルタント IT管理室 林 敬三 k-hayashi at sogo-eng.co.jp ================================= From k-hayashiatsogo-eng.co.jp Mon Nov 11 17:06:24 2002 From: k-hayashiatsogo-eng.co.jp (Keizo Hayashi) Date: Mon, 11 Nov 2002 17:06:24 +0900 Subject: [SCore-users-jp] SCore5.2をインストールしたらXが起動せず References: <20021111051818.9D25720040@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <005001c28959$50b3cad0$c500a8c0@0292hayashi> 林敬三@綜合技術コンサルタントです。 亀山様、さっそくの対応ありがとうございます。 教えていただいた事項についてやってみましたが、改善しません でした。以下にに報告します。 何かわかりましたらまたよろしくお願いします。 まず、別に中田さんが指摘してくださったエラーログです。 300行以上の長いメッセージでしたので、エラーと関係なさそうな 先頭部分は省略し、末尾部分のみ記載しました。 まずければまた指摘をお願いいたします。 ======= 引用はじめ ======== # cat /var/log/XFree86.0.log 〜〜中略〜〜 (II) I810(0): clock: 157.5 MHz Image Size: 312 x 234 mm (II) I810(0): h_active: 1280 h_sync: 1344 h_sync_end 1504 h_blank_end 1728h_border: 0 (II) I810(0): v_active: 1024 v_sync: 1025 v_sync_end 1028 v_blanking: 1072v_border: 0 (II) I810(0): Ranges: V min: 48 V max: 170 Hz, H min: 30 H max: 94 kHz,PixClock max 240 MHz (II) I810(0): Monitor name: IBM 6639 P77 (II) I810(0): Serial No: 23BH383 (--) I810(0): Chipset: "i810e" (--) I810(0): Linear framebuffer at 0xF8000000 (--) I810(0): IO registers at addr 0xFEA80000 (EE) GARTInit: Unable to open /dev/agpgart (No such device) (EE) I810(0): AGP GART support is not available. Make sure your kernel has agpgart support or that the agpgartkernel module is loaded. (II) UnloadModule: "i810" (II) UnloadModule: "ddc" (II) Unloading /usr/X11R6/lib/modules/libddc.a (II) UnloadModule: "int10" (II) Unloading /usr/X11R6/lib/modules/linux/libint10.a (II) UnloadModule: "vbe" (II) Unloading /usr/X11R6/lib/modules/libvbe.a (II) UnloadModule: "vgahw" (II) Unloading /usr/X11R6/lib/modules/libvgahw.a (EE) Screen(s) found, but none have a usable configuration. Fatal server error: no screens found When reporting a problem related to a server crash, please send the full server output, not just the last messages. This can be found in the log file "/var/log/XFree86.0.log". Please report problems to xfree86 @ xfree86.org. ====== 引用終わり ======== 自分としては、メッセージの意味が??です。 agpgartって、何のことやら・・・ 次に、カーネルに関してです。 > > この構成でサーバを計算ホストと兼用する設定にしているのでしょうか? > (つまり, kernel を変更したかどうか, なんですが...) > 入れ換えたのでしたら > % dmesg | grep agp > を行ってください. > そこで, > agpgart: Maximum main memory to use for agp memory:... > などというメッセージが出ているかどうか確認してください. > 出ていなかったら, > # /sbin/modprobe agpgart > をやってみてください. > オンチップの graphic を使用する場合はこの kernel module が必要になります. > サーバホストは、計算ホストを兼用せず、サーバとしてのみ動作させます。 ですが、EITによるインストールでは、サーバは、計算も兼用する設定でセットアップ してしまったため、dmesgでは、「Linux version 2.4.18-3SCORE」となっています。 (並列計算は正常に行えています) ただ、上記の説明は私にはすこし難しく感じましたので、以下にメッセージを そのまま転記します。 ========== dmesg引用はじめ ========== # dmesg | grep agp Linux agpgart interface v0.99 (c) Jeff Hartmann agpgart: Maximum main memory to use for agp memory: 320M agpgart: no supported devices found. Linux agpgart interface v0.99 (c) Jeff Hartmann agpgart: Maximum main memory to use for agp memory: 320M agpgart: no supported devices found. Linux agpgart interface v0.99 (c) Jeff Hartmann agpgart: Maximum main memory to use for agp memory: 320M agpgart: no supported devices found. ========== dmesg引用終わり ========== 次に、「メッセージが出ていなかったら...」とのことでしたが、ここまでで 現象が好転しなかったため、次のコマンドも打ちました。 ========== modprobe引用はじめ ========== # /sbin/modprobe agpgart /lib/modules/2.4.18-3SCORE/kernel/drivers/char/agp/agpgart.o: init_module:No such device /lib/modules/2.4.18-3SCORE/kernel/drivers/char/agp/agpgart.o: insmod /lib/modules/2.4.18-3SCORE/kernel/drivers/char/agp/agpgart.o failed /lib/modules/2.4.18-3SCORE/kernel/drivers/char/agp/agpgart.o: insmod agpgart failed Hint: insmod errors can be caused by incorrect module parameters, including invalid IO or IRQ parameters ========== modprobe引用終わり ========== ・・・もしかして、ハードウェアがらみでしょうか?BIOS設定? Redhat7.3を入れたときは問題なかったのに?? 最後に、計算ホストについてです。 > > EIT で install する場合, 事前に redhat を install する必要は無いのですが... > また, EIT で install した場合, kernel は SCore 対応のものに変更されています. > ただ, X server を install していませんので, X は立ち上がらないと思います. > 計算ホストは、Windowsとのデュアルブートにしたいと思っていますので、 EITは使わずに、Redhatをインストールしたあと、SCoreをRPMインストール、 というやり方をとりました(サーバホストは、EITを使ってもデュアルブートが できるため、EITを使いました)。 計算ホストは、Xが立ち上がらなくてもかまわないのですが、RPMインストール しているだけに、以前動いていたものが動かなくなるというのは、気分的に なんだかなあ、というところです(取るに足らないことですが)。 では、以上、ほとんど自分としては何も考えないまま質問を返す形に なってしまいましたが、どうぞよろしくお願いいたします。 ================================= (株)綜合技術コンサルタント IT管理室 林 敬三 k-hayashi at sogo-eng.co.jp ================================= From nakata @ bestsystems.co.jp Mon Nov 11 16:47:52 2002 From: nakata @ bestsystems.co.jp (Hisaho Nakata) Date: Mon, 11 Nov 2002 16:47:52 +0900 Subject: [SCore-users-jp] SCore5.2をインストールしたらXが起動せず In-Reply-To: <005001c28959$50b3cad0$c500a8c0@0292hayashi> References: <20021111051818.9D25720040@neal.il.is.s.u-tokyo.ac.jp> <005001c28959$50b3cad0$c500a8c0@0292hayashi> Message-ID: <20021111164752.243ba586.nakata@bestsystems.co.jp> 中田@ベストシステムズです。 ログを見ると亀山さん睨んだとおりapgpartのデバイスがオープンできなくて、 エラーになっていますね。 だとすると、agpgartのモジュールを読み込むのに失敗しているのでしょうか。 まず、/etc/inittabのrunlevelを2にしてxdm(gdm, kdm)が起動しないように してから、リブートしそのあと # modprobe agpgart でモジュールを読み込んでから # startx してください。modprobeでagpgartを読み込んだとき何かエラーがでますか? > (--) I810(0): IO registers at addr 0xFEA80000 > (EE) GARTInit: Unable to open /dev/agpgart (No such device) > (EE) I810(0): AGP GART support is not available. Make sure your kernel has agpgart support or that the > agpgartkernel module is loaded. ======================================================================== 株式会社 ベストシステムズ システムソリューション事業部テクニカルサポート 中田 寿穗 (nakata @ bestsystems.co.jp) 〒110-0016 東京都台東区台東2-18-8 台東K-1ビル 2,3F Tel: 03-5812-1350 Fax: 03-5812-1351 ======================================================================== From kameyama @ pccluster.org Mon Nov 11 17:43:19 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Mon, 11 Nov 2002 17:43:19 +0900 Subject: [SCore-users-jp] SCore5.2をインストールしたらXが起動せず In-Reply-To: Your message of "Mon, 11 Nov 2002 17:06:24 JST." <005001c28959$50b3cad0$c500a8c0@0292hayashi> Message-ID: <20021111084245.8B6242004B@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <005001c28959$50b3cad0$c500a8c0 @ 0292hayashi> "Keizo Hayashi" wrotes: > (EE) GARTInit: Unable to open /dev/agpgart (No such device) > (EE) I810(0): AGP GART support is not available. Make sure your kernel has a > gpgart support or that the > agpgartkernel module is loaded. (中略) > ====== 引用終わり ======== > 自分としては、メッセージの意味が??です。 > agpgartって、何のことやら・・・ agpgart というのは kernel で AGP をサポートするための device driver です. > サーバホストは、計算ホストを兼用せず、サーバとしてのみ動作させます。 > ですが、EITによるインストールでは、サーバは、計算も兼用する設定でセットアップ > してしまったため、dmesgでは、「Linux version 2.4.18-3SCORE」となっています。 でしたら, kernel を redhat 付属のものに変更してしまうのが 確実だと思います. > Linux agpgart interface v0.99 (c) Jeff Hartmann > agpgart: Maximum main memory to use for agp memory: 320M > agpgart: no supported devices found. これはその driver を入れようとしているのですが, kernel 側でサポートしているものではないということを意味しています. kernel のほうは 810E はサポートしているはずなのですが... from Kameyama Toyohisa From h995011b @ mbox.media.nagoya-u.ac.jp Mon Nov 11 18:17:41 2002 From: h995011b @ mbox.media.nagoya-u.ac.jp (Naoshi Ueda) Date: Mon, 11 Nov 2002 18:17:41 +0900 Subject: [SCore-users-jp] 教えてください Message-ID: <200211111817.GHB45659.2209IC96@mbox.media.nagoya-u.ac.jp> 名古屋大学の上田です。 先日の質問に対する多くの回答ありがとうございます。 しかしながら,勉強不足もあって,いまいち内容が理解できない状況で す。そこで,質問を限ってお聞きしたいと思います。  現在,私どもは,自作のF77プログラムを用いて,構造物の有限要素 解析を行っているのですが,大きい構造物を解析対象とした時,どうし ても1台のPCでは解けないことから,並列計算に取り組もうと考えてお ります。現在の所,今ある古いPCを3台並列化させ,実際に計算をまわ してみたところ,うまく行きそうなので,新たにPCの導入を考えていま す。  そこで,現在は,以下の導入を考えています。    CPU:1台 Pen4 2.8G  メモリー:1台 2GB ランカード,ケーブル,ハブ:1Gbsのもの  当面は,6台のPCを並列化する。 プログラムは F77    そこで,教えていただきたいのは,ずばり「この環境でよろしいでし ょうか?」ということです。  素人なのでよく分かりませんが,不安なのは,メモリーを2GB積んで も,FULLに使用できるのかどうか,また,将来的には,どの程度までメ モリーの増設が出来るのか,コンパイラーはどれがいいのか などです。  また,当面の目標としては,1000万自由度程度の非線形解析を考えて いるのですが,いかがなものでしょうか。さらに,こうした方が良いと 言うご指摘ありましたら,お教えください。 よろしくお願いいたします。 ================================ 名古屋大学工学部 コンクリート構造研究室 上田 尚史 E-mail:h995011b @ mbox.media.nagoya-u.ac.jp ================================ From kameyama @ pccluster.org Mon Nov 11 19:01:36 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Mon, 11 Nov 2002 19:01:36 +0900 Subject: [SCore-users-jp] 教えてください In-Reply-To: Your message of "Mon, 11 Nov 2002 18:17:41 JST." <200211111817.GHB45659.2209IC96@mbox.media.nagoya-u.ac.jp> Message-ID: <20021111100101.618002004B@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <200211111817.GHB45659.2209IC96 @ mbox.media.nagoya-u.ac.jp> Naoshi Ueda wrotes: >  そこで,現在は,以下の導入を考えています。 >    CPU:1台 Pen4 2.8G >  メモリー:1台 2GB > ランカード,ケーブル,ハブ:1Gbsのもの >  当面は,6台のPCを並列化する。 プログラムは F77 >  そこで,教えていただきたいのは,ずばり「この環境でよろしいでし > ょうか?」ということです。 memory 2 GB は多分大丈夫だとは思います. (ただ, 私は Fortran で大きなメモリを使用する プログラムを動かしたことは無いのですが...) マシンに関しては 64 bit 66 MHz の PCI をサポートしているものを 使用してそこに ethernet カードを挿したほうが性能が出ると思います. ethernet カードは http://www.pccluster.org/score/dist/score/html/ja/overview/pm-perf.html を参考にしてください. ネットワークスイッチに関してはよく分かりません. 多分, 極端に安いものは避けたほうが良いとは思います. >  素人なのでよく分かりませんが,不安なのは,メモリーを2GB積んで > も,FULLに使用できるのかどうか,また,将来的には,どの程度までメ > モリーの増設が出来るのか,コンパイラーはどれがいいのか などです。 CPU 1 台でしたら, 多分 3 GB 程度が限界だと思います. (memory 2.5 GB の host で malloc() するプログラムを走らせたら, 2.8 GB あたりで失敗しました. 当然, 2.5 GB 以上は swap を使用していましたけど...) コンパイラは http://www.pccluster.org/score/dist/score/html/ja/overview/development.html にサポートしている商用コンパイラのリストがあります. from Kameyama Toyohisa From e973220 @ eve.u-ryukyu.ac.jp Mon Nov 11 20:41:09 2002 From: e973220 @ eve.u-ryukyu.ac.jp (金城 尚志) Date: Mon, 11 Nov 2002 20:41:09 +0900 Subject: [SCore-users-jp] ネットワークトランキング(PM/Ethernet) の設定 In-Reply-To: <20021111063117.E205820040@neal.il.is.s.u-tokyo.ac.jp> Message-ID: 琉球大の金城です。 亀山さま、アドバイスありがとうございます。 ですが、当方の勉強不足のためよくわからない点がいくつか ありましたので、申し訳ありませんがアドバイスを どうかよろしく御願いします。 >1. config file の作成 > 3 つのそれぞれの device ごとの config file を作成します. > % mkpmethernetconf -g group -device ... > ではうまくいきませんので, 手動もしくは > 0 comp0 /dev/eth1 > 1 comp1 /dev/eth0 > 2 comp2 /dev/eth0 > 3 comp3 /dev/eth0 > のようなファイルを作って, そのファイルを渡します. まず、test_kinjoというファイルに上の記述をしました。 $ cat test_kinjo 0 comp0 /dev/eth1 1 comp1 /dev/eth0 2 comp2 /dev/eth0 3 comp3 /dev/eth0 で、次に次のようなコマンドを入力しました。 # mkpmethernetconf -g almond -unit 0 test_kinjo # almond はグループ名 そうすると、test_kinjoファイルは次のように上書きされました。 unit 0 # maxnsend 0 - 32 maxnsend 16 # backoff 1000 - 20000 (usec) backoff 4800 # checksum (0 if off, 1 is on) checksum 0 # PE MAC address base hostname # comment 1 02:00:08:E3:4E:6E comp1.sci.u-ryukyu.ac.jp # ip=133.13.129.139 on eth0 1 02:00:08:E3:4D:6E comp1.sci.u-ryukyu.ac.jp # ip=133.13.129.139 on eth1 2 02:00:08:E3:4F:8B comp2.sci.u-ryukyu.ac.jp # ip=133.13.130.89 on eth0 2 02:00:08:E3:57:9B comp2.sci.u-ryukyu.ac.jp # ip=133.13.130.89 on eth2 3 02:00:08:E3:F4:95 comp3.sci.u-ryukyu.ac.jp # ip=133.13.130.90 on eth0 3 02:00:08:E3:58:9B comp3.sci.u-ryukyu.ac.jp # ip=133.13.130.90 on eth2 あと、ここ(上のコマンド)でなぜがcomp0において以下のエラーメッセージが 発生しています。 rcmd: comp0.sci.u-ryukyu.ac.jp: short readwarning: comp0.sci.u-ryukyu.ac.jp ethernet address is not found, ignore しかしながら、 comp0 に対してのホストサーバー側からのPING、SSHログインとも成功しているた め、 ホストサーバからcomp0に対しての通信ができないわけではないようです。 また、comp0側で ifconfig コマンドを実行すると、 eth1 eth2 eth3 ともにUPしています。(eth0はオンボードNICのため、故意に起動を 止めています)。 さらに、ここではなぜcomp1においてeth2のMACアドレスを取得していないのか、そし て comp[2-3]において、eth1のMACアドレスを取得していないかも疑問です。 どうすればいいのか、わからないので、 次に行きます。 >2. etherpmctl の設定 > /etc/rc.d/init.d/pm_ethernet を編集して, 必要なだけ etherpmctl > を起動します. > 多分, comp0 は > /sbin/etherpmctl eth0 -pm on -ir on unit 0 > /sbin/etherpmctl eth1 -pm on -ir on unit 1 > /sbin/etherpmctl eth2 -pm on -ir on unit 2 > その他は > /sbin/etherpmctl eth1 -pm on -ir on unit 0 > /sbin/etherpmctl eth2 -pm on -ir on unit 1 > /sbin/etherpmctl eth3 -pm on -ir on unit 2 > のようになると思います. これは、ホストサーバの/etc/rc.d/init.d/pm_ethernet を編集するのでしょうか? それとも、それぞれの計算ホストの/etc/rc.d/init.d/pm_ethernet を編集するのでしょうか? もし、それぞれの計算ホストではなく、ホストサーバ機の /etc/rc.d/init.d/pm_ethernetだったならば、 具体的にどのような書き方をしたらよいのでしょうか? >3. scoreboard データベースを編集する. > trunking 用の network を登録し, 各ホストの network 部分も更新します. これは、 /etc/rc.d/init.d/scoreboardでしょうか? それとも、 /opt/score5.0.0/sbin/scoreboard なのでしょうか? また、具体的にどのように記述したらよいのでしょうか。 正直、どうしたらいいのかわからなくて、 本当に困っています。 まことにお手数とは思いますが、なにとぞ よろしく御願いします。 ━┛━┛━┛━┛━┛━┛━┛━┛━┛   琉球大学理学部 物質地球科学科   金城 尚志 (キンジョウヒサシ) ━┛━┛━┛━┛━┛━┛━┛━┛━┛ From nrcb @ streamline-computing.com Mon Nov 11 19:42:47 2002 From: nrcb @ streamline-computing.com (Nick Birkett) Date: Mon, 11 Nov 2002 10:42:47 +0000 Subject: [SCore-users-jp] [SCore-users] Absoft V7 f77 and f90 Message-ID: <200211111042.gABAglr03954@zeralda.streamline.com> Hi I have the Absoft V 7.5 compiler. I think the absoft compiler stuff in SCore 5.0.1 is not up to date. Here is the README from the compiler service pack README: NOTE: The behavior of the -B108 option has changed. Now if a procedure name contains an underscore, 2 underscores will be appended. This is for compatibility with g77. If you want only a single underscore, please use -N15 for f77 or -YEXT_SFX='_' for f90 instead of -B108. Here is the absoft script from /opt/score/etc/compilers/absoft # $ $options{"absoft"} = sub { # all lower case and underscore, add libU77 $addoptions = ($f90) ? "-YEXT_NAMES=LCS": "-f"; $addoptions .= " -B100 -B108"; }; Can someone tell me axactly what I need to change to get absoft f77 and f90 to work (single underscores and lower case symbols) ? Thanks, Nick _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Mon Nov 11 21:13:36 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Mon, 11 Nov 2002 21:13:36 +0900 Subject: [SCore-users-jp] ネットワークトランキング(PM/Ethernet) の設定 In-Reply-To: Your message of "Mon, 11 Nov 2002 20:41:09 JST." Message-ID: <20021111121300.D574520045@neal.il.is.s.u-tokyo.ac.jp> 亀山です. すみません. mkpmetherenetconf に bug がありました. この mail のうしろの patch をあててください. In article "金城 尚志" wrotes: > まず、test_kinjoというファイルに上の記述をしました。 > $ cat test_kinjo > > 0 comp0 /dev/eth1 > 1 comp1 /dev/eth0 > 2 comp2 /dev/eth0 > 3 comp3 /dev/eth0 > > で、次に次のようなコマンドを入力しました。 > # mkpmethernetconf -g almond -unit 0 test_kinjo > # almond はグループ名 グループ名を指定せず, (patch をあててから) % kpmethernetconf -unit 0 test_kinjo > newfile のようにして newfile のほうにしてください. > あと、ここ(上のコマンド)でなぜがcomp0において以下のエラーメッセージが > 発生しています。 上記の起動方法ですと, group 指定のほうが優先されてしまい, すべての eth0 の MAC address を見にいってしまいます. > >2. etherpmctl の設定 > > /etc/rc.d/init.d/pm_ethernet を編集して, 必要なだけ etherpmctl > > を起動します. > > 多分, comp0 は > > /sbin/etherpmctl eth0 -pm on -ir on unit 0 > > /sbin/etherpmctl eth1 -pm on -ir on unit 1 > > /sbin/etherpmctl eth2 -pm on -ir on unit 2 > > その他は > > /sbin/etherpmctl eth1 -pm on -ir on unit 0 > > /sbin/etherpmctl eth2 -pm on -ir on unit 1 > > /sbin/etherpmctl eth3 -pm on -ir on unit 2 > > のようになると思います. > > > > これは、ホストサーバの/etc/rc.d/init.d/pm_ethernet > を編集するのでしょうか? > それとも、それぞれの計算ホストの/etc/rc.d/init.d/pm_ethernet > を編集するのでしょうか? compute host の /etc/rc.d/init.d/pm_ethernet です. > >3. scoreboard データベースを編集する. > > trunking 用の network を登録し, 各ホストの network 部分も更新します. > > これは、 > /etc/rc.d/init.d/scoreboardでしょうか? > それとも、 > /opt/score5.0.0/sbin/scoreboard > なのでしょうか? /opt/score/etc/scorehosts.db です. > また、具体的にどのように記述したらよいのでしょうか。 生成したファイルを pm-ethernet-0.conf, pm-ethernet-1.conf, pm-ethernet-2.conf とすると, ethernet-x3 type=ethernet \ -config:file=/opt/score/etc/pm-ethernet-2.conf \ -trunk0:file=/opt/score/etc/pm-ethernet-1.conf \ -trunk1:file=/opt/score/etc/pm-ethernet-0.conf comp1.sci.u-ryukyu.ac.jp cpugen=i686 speed=500 network=ethernet-x3 ... comp2.sci.u-ryukyu.ac.jp cpugen=i686 speed=500 network=ethernet-x3 ... comp3.sci.u-ryukyu.ac.jp cpugen=i686 speed=500 network=ethernet-x3 ... comp4.sci.u-ryukyu.ac.jp cpugen=i686 speed=500 network=ethernet-x3 ... のようになります. from Kameyama Toyohisa ---------------------------------------cut here--------------------------------- --- mkpmethernetconf.exe Mon Nov 11 21:33:01 2002 +++ mkpmethernetconf.exe.new Mon Nov 11 21:33:24 2002 @@ -20,7 +20,7 @@ GetOptions('group=s', \$group, 'speed=i', \$speed, "mbps", \$speed, "unit=i", \$unit_num, "device=s", \$device, "maxnsend=s", \$maxnsend, "backoff=s", \$backoff, "checksum=i", \$checksum); -if (!defined($group) || $#ARGV < -1) { +if (!defined($group) && $#ARGV < -1) { print STDERR "Usage: mkpmethernetconf [options] -g group [output_file]\n", " or mkpmethernetconf [options] host_list_file [output_file]\n"; exit(1); ---------------------------------------cut here--------------------------------- From hermann.lauer @ iwr.uni-heidelberg.de Tue Nov 12 02:00:33 2002 From: hermann.lauer @ iwr.uni-heidelberg.de (Hermann Lauer) Date: Mon, 11 Nov 2002 18:00:33 +0100 Subject: [SCore-users-jp] [SCore-users] sc_watch did'nt recognize crash of scored.exe on one node Message-ID: <20021111180033.B12371@lemon.iwr.uni-heidelberg.de> Dear Score Users, score-5.0.1 stopped with the following error in sc_watch: <194> ULT: Exception Signal (11) SCOUT: Session done. [10/Nov/2002,00:37:45] System failure detected. [10/Nov/2002,00:37:45] System has been shutdown. [10/Nov/2002,00:37:45] Local Action: /opt/score/etc/replace.sh [10/Nov/2002,00:37:57] Rebooting System [3 times, second retry]: /opt/score/deploy/bin.i386-debian-linux2_4/scored.exe As you can see, sc_watch restarted the scored. But then, immediately again appeared the same error message in sc_watch: <194> ULT: Exception Signal (11) I checked the the node with the score number <194>, and the only score related processes are "scoutd.exe" and "scremote.exe". So "scored.exe" indeed seems to have got a "signal 11, segmentation fault" - if that's the right interpretation of "ULT: Exception Signal (11)". But sc_watch didn't notice that error - it simply does nothing. So the question is: How is sc_watch monitoring all the score daemons, that it didn't notice the immediate crash of one of them ? The node is now in the defected list, but if I get some hints how to determine why the scored.exe is crashing immidiately on that node or somebody want to look a it, I'll try to debug that further. On the node there are no related messages in the syslog file and on the server in "scored.messages" I didn't find anything interesting, too. But just tell me what additional info is needed. Many thanks, greetings Hermann -- Netzwerkadministration/Zentrale Dienste, Interdiziplinaeres Zentrum fuer wissenschaftliches Rechnen der Universitaet Heidelberg IWR; INF 368; 69120 Heidelberg; Tel: (06221)54-8236 Fax: -5224 Email: Hermann.Lauer @ iwr.uni-heidelberg.de _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Tue Nov 12 10:13:54 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Tue, 12 Nov 2002 10:13:54 +0900 Subject: [SCore-users-jp] SCore5.2をインストールしたらXが起動せず In-Reply-To: Your message of "Mon, 11 Nov 2002 17:43:19 JST." <20021111084245.8B6242004B@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <20021112011354.6506B20045@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <20021111084245.8B6242004B @ neal.il.is.s.u-tokyo.ac.jp> kameyama @ pccluster.org wrotes: > > Linux agpgart interface v0.99 (c) Jeff Hartmann > > agpgart: Maximum main memory to use for agp memory: 320M > > agpgart: no supported devices found. > > これはその driver を入れようとしているのですが, > kernel 側でサポートしているものではないということを意味しています. > kernel のほうは 810E はサポートしているはずなのですが... 815 chipset のホストの kernel を SCore 5.2 付属の 2.4.18-3SCORE に変更してみました. (redhat 8.0 ですが, XFree86 の version は 4.2.0 なので X 関係は そんなに変わっていないと思います.) こちらでは agpgart のロードに成功し, X もきちんと立ち上がっています. (現在, その環境でこの mail を書いています.) 多分, 810E でも問題無いと思いますけど... from Kameyama Toyohisa From kameyama @ pccluster.org Tue Nov 12 11:27:56 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Tue, 12 Nov 2002 11:27:56 +0900 Subject: [SCore-users-jp] Re: [SCore-users] Absoft V7 f77 and f90 In-Reply-To: Your message of "Mon, 11 Nov 2002 10:42:47 JST." <200211111042.gABAglr03954@zeralda.streamline.com> Message-ID: <20021112022756.9045920024@neal.il.is.s.u-tokyo.ac.jp> In article <200211111042.gABAglr03954 @ zeralda.streamline.com> Nick Birkett wrotes: > Hi I have the Absoft V 7.5 compiler. I think the absoft compiler stuff in > SCore 5.0.1 is not up to date. We update absoft compiler option on SCore 5.2. > Can someone tell me axactly what I need to change to get absoft f77 and f90 > to work (single underscores and lower case symbols) ? The contents of /opt/score/etc/compilers/absoft on SCore 5.2 is following: options{"absoft"} = sub { if ($lang eq "f90") { $addoptions = "-YEXT_NAMES=LCS -YEXT_SFX=_"; } else { $addoptions = "-f -N15"; } }; from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Tue Nov 12 13:21:04 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Tue, 12 Nov 2002 13:21:04 +0900 Subject: [SCore-users-jp] Re: [SCore-users] Absoft V7 f77 and f90 In-Reply-To: Your message of "Tue, 12 Nov 2002 11:27:56 JST." <20021112022756.9045920024@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <20021112042104.B800020024@neal.il.is.s.u-tokyo.ac.jp> In article <20021112022756.9045920024 @ neal.il.is.s.u-tokyo.ac.jp> kameyama @ pccluster.org wrotes: > The contents of /opt/score/etc/compilers/absoft on SCore 5.2 is following: > > options{"absoft"} = sub { > if ($lang eq "f90") { > $addoptions = "-YEXT_NAMES=LCS -YEXT_SFX=_"; > } else { > $addoptions = "-f -N15"; > } > }; Sorry, this script include bug. I missing $. This is correct code: $options{"absoft"} = sub { if ($lang eq "f90") { $addoptions = "-YEXT_NAMES=LCS -YEXT_SFX=_"; } else { $addoptions = "-f -N15"; } }; from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From k-hayashiatsogo-eng.co.jp Tue Nov 12 16:34:01 2002 From: k-hayashiatsogo-eng.co.jp (Keizo Hayashi) Date: Tue, 12 Nov 2002 16:34:01 +0900 Subject: [SCore-users-jp] SCore5.2をインストールしたらXが起動せず References: <20021112011354.6506B20045@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <004001c28a1d$f18560d0$c500a8c0@0292hayashi> 林@綜合技術コンサルタントです。 亀山様、中田様、ありがとうございます。 現在、まだ解決には至っておりませんが、いろいろ試していますので とりあえず報告させていただきます。 中田様の指摘に関しては、やはりカーネルがドライバをサポートしてないようで、 modprobeでエラーが出ます。 そこで、亀山様が2度にわたり教えてくださったとおり、Intel 815で試してみました。 しかし、Redhat7.3は、グラフィックにi815を選択してもドライバはi810が選択されて しまうようです。 xf86configコマンドを投入し、ビデオカード選択部分でIntel815を選択したら、 Identifer : Intel 815 Chipset : Intel 815 Driver : i810 と表示されましたので、そうなのだと推測してます。 なお、i815eを選択しても、結果は同じでした。 (念のため、XFree86 4.2.0-8です。) この結果として、やはり、Redhat7.3のカーネルだとXが起動しても、カーネルを 差し替えると、Xが起動しなくなってしまうようです。 そこでこの件については、こちらにLinuxのドライバやカーネルを扱うスキルが無い ため(勉強不足で)、あきらめることにし、サーバホストのカーネルをRedhat7.3付属 のものに戻す方法にトライすることとしました。 ただ、この方法で計算ホストのHDDを再フォーマットするのは避けたい(Winと デュアルブートさせるため)ので、インストール途中に計算ホストをフォーマット してしまうEITの使用は避け、RPMインストールによるマシンセットアップを している途中です。 (この方法以外に、カーネル差し替えを防ぐ方法を知らない、というが正直な ところですが) 現在、サーバホストのセットアップがかなり難解で、PMがうまく動作しない などいろいろな壁にぶち当たっており、時間がかかりそうではありますが、 勉強の意味も含めて、試行錯誤していくつもりです。 EITで計算ホストのセットアップをすっ飛ばせると助かると思ったりもしますが... また進展がありましたら報告いたします。 何かアドバイスなどあればまたお願いします。 ================================= (株)綜合技術コンサルタント IT管理室 林 敬三 k-hayashi at sogo-eng.co.jp ================================= From kameyama @ pccluster.org Tue Nov 12 17:36:31 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Tue, 12 Nov 2002 17:36:31 +0900 Subject: [SCore-users-jp] SCore5.2をインストールしたらXが起動せず In-Reply-To: Your message of "Tue, 12 Nov 2002 16:34:01 JST." <004001c28a1d$f18560d0$c500a8c0@0292hayashi> Message-ID: <20021112083631.9E5BF20040@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <004001c28a1d$f18560d0$c500a8c0 @ 0292hayashi> "Keizo Hayashi" wrotes: > しかし、Redhat7.3は、グラフィックにi815を選択してもドライバはi810が選択されて > しまうようです。 こちらも Xfree86 の driver は i810 です. 多分, 処理にそんなに差がないため, 同じドライバが使用できるのだと思います. > ただ、この方法で計算ホストのHDDを再フォーマットするのは避けたい(Winと > デュアルブートさせるため)ので、インストール途中に計算ホストをフォーマット > してしまうEITの使用は避け、RPMインストールによるマシンセットアップを > している途中です。 > (この方法以外に、カーネル差し替えを防ぐ方法を知らない、というが正直な > ところですが) この場合, 入れ換えるのは server の kernel だけなので, SCore 全部 (まして redhat 7.3 全部) を入れ直す必要はありません. kernel rpm だけを入れ換えれば十分です. 基本的には http://www.pccluster.org/score/dist/score/html/ja/installation/kernel-binary.html のようにします. 但し, 指定するのは redhat の kernel になります. redhat の kernel rpm はどれかの CD-ROM の RedHat/RPMS/kernel* の下に入っています. (すみません, どの CD-ROM に入っているか分かりません. もしかすると, 複数の CD-ROM に分散しているのかも...) 普段 network install しているもので...) CD-ROM から探す代わりに, ftp://ftp.redhat.com/ や (ftp://ftp.lab.kdd.co.jp などの) mirror site から kernel rpm だけ おとしてきたり, この際 http://www.redhat.co.jp/support/errata/rh73/ から最新の kernel を持って来るのも良いかもしれません. 念のため, 手順を書いておきます. 1. kernel rpm ファイルを用意する. 多分, kernel-2.4.18-3.i686.rpm kernel-utils-2.4-7.4.i386.rpm kernel-source-2.4.18-3.i386.rpm kernel-doc-2.4.18-3.i386.rpm だけあれば良いです. (update kernel の場合は version 番号が違いますが... kernel-2.4* は複数ありますが, i686.rpm を使用してください. 2. rpm コマンドで kernel を update する. # rpm -Uvh --force kernel* を実行して上の 4 つの rpm を update します. 3. boot loader として lilo を使用している場合は lilo を更新します. /etc/lilo.conf を見てファイル名を変更します. image= および initrd= の部分を変更してください. 念のために, そこに指定したファイル /boot/vmlinuz* /boot/initrd* があるかどうかを確認してください. 確認したら # /sbin/lilo を実行します. 4. boot loader として GRUB を使用している場合は /boot/grub/grub.conf を確認します. このファイルは rpm が更新してくれるはずなんですが, 念のため kernel および initrd に指定したファイルが正しいかどうか確認してください. 5. server を reboot します. 大体, この順番で行えば良いです. compute host は触る必要はありません. すでに, server を入れ換えたあとだとすると... eit は使用せずに, ./Install を実行した後 http://www.pccluster.org/score/dist/score/html/ja/installation/sys-server.html の 2. 以降を実行することになります. 但し, pm-ethernet.conf の作成は # cd /opt/score/etc # /opt/score/deploy/mkpmethernetconf -speed 100 -g pcc > pm-ethernet.conf のように行ってください. (入れ換える前に /opt/score/etc の下を保存してあったら, それをそのまま 使用できたのですが...) from Kameyama Toyohisa From klaas @ ccrl-nece.de Tue Nov 12 19:38:25 2002 From: klaas @ ccrl-nece.de (Jens Klaas) Date: Tue, 12 Nov 2002 11:38:25 +0100 Subject: [SCore-users-jp] [SCore-users] 5.2 source doesn't compile for me Message-ID: <200211121138.25584.klaas@ccrl-nece.de> Dear all, I tried to compile the score source under RedHat Linux 7.3, but it failed. The score.build logfile sayes the following. ------------------------------------------------------------------------------- gcc attr.c -c -O2 -Wall -Winline -Wstrict-prototypes -Wwrite-strings -g -I../include -I. -I.. -I../libio -I../linuxthreads/sysdeps/unix/sysv/linux/i386 -I../linuxthreads/sysdeps/unix/sysv/linux -I../linuxthreads/sysdeps/pthread -I../linuxthreads/sysdeps/unix/sysv -I../linuxthreads/sysdeps/unix -I../linuxthreads/sysdeps/i386/i686 -I../linuxthreads/sysdeps/i386 -I../sysdeps/unix/sysv/linux/i386 -I../sysdeps/unix/sysv/linux -I../sysdeps/unix/sysv -I../sysdeps/unix -I../sysdeps/i386 -I../sysdeps/generic/elf -I../sysdeps/generic -D_LIBC_REENTRANT -include ../include/libc-symbols.h -o attr.o In file included from /usr/include/stdio.h:65, from /usr/include/resolv.h:63, from internals.h:23, from attr.c:23: /usr/include/libio.h:334: parse error before `attribute_hidden' /usr/include/libio.h:334: warning: data definition has no type or storage class /usr/include/libio.h:335: parse error before `attribute_hidden' /usr/include/libio.h:335: warning: data definition has no type or storage class /usr/include/libio.h:336: parse error before `attribute_hidden' /usr/include/libio.h:336: warning: data definition has no type or storage class -------------------------------------------------------------------------------------- It seems, that it is not possible to build the pthread libraries. What's wrong? Any Ideas? cu Jens _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Tue Nov 12 20:09:00 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Tue, 12 Nov 2002 20:09:00 +0900 Subject: [SCore-users-jp] [SCore-users] 5.2 source doesn't compile for me In-Reply-To: Your message of "Tue, 12 Nov 2002 11:38:25 JST." <200211121138.25584.klaas@ccrl-nece.de> Message-ID: <20021112110900.95A7B20040@neal.il.is.s.u-tokyo.ac.jp> In article <200211121138.25584.klaas @ ccrl-nece.de> Jens Klaas wrotes: > -- > gcc attr.c -c -O2 -Wall -Winline -Wstrict-prototypes -Wwrite-strings -g > -I../include -I. -I.. -I../libio > -I../linuxthreads/sysdeps/unix/sysv/linux/i386 > -I../linuxthreads/sysdeps/unix/sysv/linux -I../linuxthreads/sysdeps/pthread > -I../linuxthreads/sysdeps/unix/sysv -I../linuxthreads/sysdeps/unix > -I../linuxthreads/sysdeps/i386/i686 -I../linuxthreads/sysdeps/i386 > -I../sysdeps/unix/sysv/linux/i386 -I../sysdeps/unix/sysv/linux > -I../sysdeps/unix/sysv -I../sysdeps/unix -I../sysdeps/i386 > -I../sysdeps/generic/elf -I../sysdeps/generic -D_LIBC_REENTRANT -include > ../include/libc-symbols.h -o attr.o > In file included from /usr/include/stdio.h:65, > from /usr/include/resolv.h:63, > from internals.h:23, > from attr.c:23: > /usr/include/libio.h:334: parse error before `attribute_hidden' > /usr/include/libio.h:334: warning: data definition has no type or storage > class > /usr/include/libio.h:335: parse error before `attribute_hidden' > /usr/include/libio.h:335: warning: data definition has no type or storage > class > /usr/include/libio.h:336: parse error before `attribute_hidden' > /usr/include/libio.h:336: warning: data definition has no type or storage > class > ----------------------------------------------------------------------------- > --------- Please apply following patch: ---------------------------------------cut here--------------------------------- diff -u -r1.1.1.1 libc-symbols.h --- score-src/SCore/sclib/scwrap/example/pthread/glibc-i386-redhat7/include/libc-symbols.h 2 Aug 2001 10:14:28 -0000 1.1.1.1 +++ score-src/SCore/sclib/scwrap/example/pthread/glibc-i386-redhat7/include/libc-symbols.h 12 Nov 2002 11:04:33 -0000 @@ -321,4 +321,5 @@ strong_alias(real, name) #endif +# define attribute_hidden #endif /* libc-symbols.h */ ---------------------------------------cut here--------------------------------- from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From masa @ nssnet.co.jp Tue Nov 12 20:51:13 2002 From: masa @ nssnet.co.jp (MASA(tm)) Date: Tue, 12 Nov 2002 20:51:13 +0900 Subject: [SCore-users-jp] サーバホストを含まないネットワークを利用 Message-ID: <200211121158.UAA06403@nss-ntsv4.nssnet.co.jp> 菊池です。こんにちは。  以下の構成が可能だ、というようなことを聞いたのですが、可能 かどうか、可能ならば実際の構築法はどうするのか、どなたかご教 示ください。 環境:  SCore 5.2.0 + RedHat Linux 7.3  (サーバホストは計算ホストを兼ねません) 概要:   サーバホストが含まれない側のネットワークを利用した  SCore の構築・運用。 構成(現在): [100BASE Switch(16Port)] | | | ←On-board eepro100  [ServerHost] [Comp1] [Comp2] | | | ←e1000 [1000BASE Switch(8Port)]  100BASE のネットワークでインストールを済ませました。 1000BASE も含め、ネットワークのテストは済んでいます。  また、NIS, NFS 等のサービスは 100BASE 側で提供すればよいと 思っています。(運用時には e1000 には IP アドレスは振らない 予定です) 目論んでいること:  [S] |  [100(16Port)_____________________] | | | | | | [C1] [C2]...[C6] [C7] [C8]...[C12] | | | | | | [1000(8Port)___]==[1000(8Port)___] ↑Switch によるトランキング(2port)  1Gb Ether のSwitch が 8port*2台 となってしまい、Switch 間 をトランキングしたほうが良いだろうということになっています。 サーバホストのための e1000 は有りますが、ポートが足りないの で使用しない予定です。 気づいたこと: ・./etc/pm-*.conf を眺めて、サーバホストから直接見えないデバ  イスで通信できそうもないと思った。 ・PM-II デバイスは SCore のジョブが使用するので、サーバホス  トからは見えなくとも良い気もする。 機器構成:(全ホスト共通) M/B: ASUS P4T533-C +A/L  CPU: Pentium4 2.53GHz MEM: PC800 512MB VGA: Xpert98XL(PCI) (Mach64?) NIC: eepro100 相当(On-borad)   Intel PRO/1000MT HDD: IDE U-ATA100 40GB (?) HUB: CentreCOM FS716TX (100BASE-TX) SMC-EZ8508T (1000BASE-T) 以上です。よろしくお願いいたします。 --  エヌケーケー総合設計(株) ソリューションシステム部  菊池 匡洋 (内:6678) mailto:masa @ nssnet.co.jp From k-hayashiatsogo-eng.co.jp Tue Nov 12 21:16:54 2002 From: k-hayashiatsogo-eng.co.jp (Keizo Hayashi) Date: Tue, 12 Nov 2002 21:16:54 +0900 Subject: [SCore-users-jp] 解決しました References: <20021112083631.9E5BF20040@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <001901c28a45$785702e0$c500a8c0@0292hayashi> 林@綜合技術コンサルタントです。 亀山様 ていねいな解説、本当にありがとうございます。 自分の勉強不足を痛感するところですが、解説をていねいに書いて くださったおかげで、カーネルをRedhatオリジナルの状態へ戻すことが できましたっ。 サーバホストはRedhatを再インストールしましたが、教えていただいた ドキュメントを参照し、bininstall を使うやり方でうまくいきました。 またXが立ち上がらなくなった計算ホストでも、SCoreカーネルをRedhat オリジナルに戻す方法を試し、無事にXが立ち上がることを確認しました。 (またすぐにSCoreカーネルに戻しましたが) 結果、サーバホストできちんとXが立ち上がり、並列計算もきちんと走る 環境を実現することができました! これも亀山さんのていねいな説明のおかげです。大変感謝しております。 知識不足とはいえ、私もこのメーリングリストで知識を生かすことができれば、 ほかの方々の力になりたいと思っております。 どうもありがとうございました。 また今後ともよろしくお願いします。 ================================= (株)綜合技術コンサルタント IT管理室 林 敬三 k-hayashi at sogo-eng.co.jp ================================= From s-torii @ bl.jp.nec.com Tue Nov 12 21:20:55 2002 From: s-torii @ bl.jp.nec.com (=?iso-2022-jp?b?cy10b3JpaSAbJEIhdxsoQiBibC5qcC5uZWMuY29t?=) Date: Tue, 12 Nov 2002 21:20:55 +0900 Subject: [SCore-users-jp] PCクラスタセミナーについて Message-ID: <200211121132.UAA09434@godzilla.wsd.mt.nec.co.jp> TO:綜合技術コンサルタント 林様 CC:PCクラスタコンソーシアム    メーリングリスト参加者/普及部会関係各位 FM:NEC CAS販推 鳥井(普及部会)です。 SU:「PCクラスタセミナーについて」の件 PCCC普及部会の委員長を拝命しております 鳥井です。 先般、林様よりいただきました下記の件につきリプライ致します。 ・10月30日の「第1回SCore」セミナーについて  Webをご参照いただきました際、既に満員で締切済みであった  との由、誠に申し訳ありませんでした。  今回は、初めてのセミナーであり、当初どの程度申し込みがある  か読めない部分もあったのですが、会場を提供いただいたHP (コンパック)様のご協力もあり、当初想定の30%増しまで参加  申し込みを受け付けさせていただきました。  また、当日は(無料のセミナーであるにもかかわらず・・・)欠  席者がほとんど無いという状況で、PCクラスタに対する関心の  高さを実感すると共に、補助椅子まで出して対応するという、運  営側としては、誠に嬉しい悲鳴の出る事態でした。  今回の、セミナー資料、状況等については近日中にWeb公開を  計画しておりますのでその際にはご参照下さい。 ・セミナー(大阪開催等)へのご意見、ご要望について     先般のメールでいただきました、セミナーの追加開催、できれば  「大阪など別会場での開催」へのご希望に対してですが、ご指摘  のように、今後、同様なイベントを企画する際、検討させていた  だきたいと思います。  現状では、会員企業が東京地区に多く、実費(ボランティアベー  ス)で使える企業の施設等が東京地区に集中しているという事情  があります。  また、今年度この後は、当コンソーシアムの「シンポジウム」が  控えているため、実際には日程的、予算的にも追加は困難という  状況もあります。  しかしながら、もとより各地での開催に全く否定的と言うわけで  はなく、例えば昨年度は(経済産業省からのお声掛かりもあり)、  2月27,28日の「ビジネスフェア2002 in 関西」に  当コンソーシアムとして出展させていただいた経緯もあります。 以上、引き続き総合的に検討させていただきたいと思いますので、 今後もご意見を頂戴すると共に、御社にも会員企業としての加盟を ご検討いただけると幸いです。 −−−−− >メーリングリストの皆様、お世話になります。 >綜合技術コンサルタント 林と申します。 >このメーリングリストに流して良いものかどうか、迷いましたが、セミナー >案内もここで流れたことですし、あえてここに送信させていただきました。 > >以前にこのメーリングリストで亀山さんはじめ、住元さんなどいろいろな >方に大変お世話になりました。その後急なトラブルや開発が入り、 >しばらくご無沙汰してしまいましたが、PCクラスタ構築も少しずつ進めて >おります。 > >さて、10/30にセミナーが開催されるとの情報を見て、興味を持った >のですが、すでに締め切られた後でした。 >内容によっては、ぜひ参加させていただきたいと思っておりましたが、 >このセミナーは、追加開催、あるいは大阪など別会場での開催予定は >ないでしょうか。 >私事で恐縮ですが、こちらは会社が大阪にあり、大阪で開催されると >なれば喜んで参加させていただくのですが。 >今後同様な機会があれば、考慮していただけると助かります。 > >また厚かましいお願いで恐縮ですが、今回のセミナーの資料など、 >いただくことは・・・できませんでしょうか。 >Web公開などでも結構ですので、入手の機会をいただけると嬉しいです。 > >以上、厚かましいお願いばかりですが、どうぞ宜しくお願いします。 >==================================== >(株)綜合技術コンサルタント  IT管理室 > 林 敬三 k-hayashi at sogo-eng.co.jp >==================================== −−−−− ============================================================== Satoshi TORII (鳥井 聡) NEC ソリューションズ クライアント・サーバ販売推進本部 (商品マーケティンググループ) グループマネージャ NEC Corporation TOKYO 108-8424, JAPAN Tel: +3-3798-9547(direct) / Ext.20-21665 Fax: +3-3456-1409(direct) / Ext.20-21631 ============================================================== From klaas @ ccrl-nece.de Tue Nov 12 22:53:47 2002 From: klaas @ ccrl-nece.de (Jens Klaas) Date: Tue, 12 Nov 2002 14:53:47 +0100 Subject: [SCore-users-jp] [SCore-users] 5.2 source doesn't compile for me In-Reply-To: <20021112110900.95A7B20040@neal.il.is.s.u-tokyo.ac.jp> References: <20021112110900.95A7B20040@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <200211121453.47263.klaas@ccrl-nece.de> Dear Kameyama-san, thanks for the patch. Now I stuck some lines later. Do you have a patch for that as well? cu Jens Output of my scoure.build ----------------------------------------------------- make[5]: Entering directory `/opt/source/score-src/SCore/pm2/arch/composite/obj.i386-redhat7-linux2_4' /usr/bin/gcc `if grep Unportable /usr/include/asm/spinlock.h> /dev/null; then echo -I/usr/src/linux-2.4/include; fi` -O2 `case i386-unknown-linux in sparc-*-*) echo -Dsparc;; i386-*-*) echo -Di386 -m486;; alpha-*-*) echo -Dalpha;; esac` `case i386-unknown-linux in *-*-sunos4*) echo -Dsunos4;; *-*-netbsd*) echo -Dnetbsd;; *-*-linux*) echo -Dlinux;; *-*-osf*) echo -Dosf1_linux -I/usr/local/linux/linux.include;; esac` -Wall `case i386-unknown-linux in alpha-*-linux*) echo -pipe -ffixed-8 -mcpu=ev5 -Wa,-mev6 ;; esac` -I../../../include -o pm_composite.o -c ../pm_composite.c In file included from /usr/include/linux/spinlock.h:35, from ../../../include/pm_lock.h:79, from ../pm_composite.c:79: /usr/include/asm/spinlock.h: In function `read_lock': /usr/include/asm/spinlock.h:168: `LOCK' undeclared (first use in this function) /usr/include/asm/spinlock.h:168: (Each undeclared identifier is reported only once /usr/include/asm/spinlock.h:168: for each function it appears in.) /usr/include/asm/spinlock.h:168: parse error before string constant /usr/include/asm/spinlock.h:168: parse error before `:' /usr/include/asm/spinlock.h: In function `write_lock': /usr/include/asm/spinlock.h:177: `LOCK' undeclared (first use in this function) /usr/include/asm/spinlock.h:177: parse error before string constant /usr/include/asm/spinlock.h:177: parse error before `:' /usr/include/asm/spinlock.h: In function `write_trylock': /usr/include/asm/spinlock.h:186: warning: implicit declaration of function `atomic_sub_and_test' /usr/include/asm/spinlock.h:188: warning: implicit declaration of function `atomic_add' ../pm_composite.c: At top level: ../pm_composite.c:1: warning: `rcsid' defined but not used make[5]: *** [pm_composite.o] Error 1 make[5]: Leaving directory `/opt/source/score-src/SCore/pm2/arch/composite/obj.i386-redhat7-linux2_4' make[4]: *** [srcdir-all] Error 2 make[4]: Leaving directory `/opt/source/score-src/SCore/pm2/arch/composite' + old_pwd=/opt/source/score-src/SCore/pm2/arch + cd ethernet ----------------------------------------------------------------------------------- _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From e973220 @ eve.u-ryukyu.ac.jp Tue Nov 12 23:07:54 2002 From: e973220 @ eve.u-ryukyu.ac.jp (金城 尚志) Date: Tue, 12 Nov 2002 23:07:54 +0900 Subject: [SCore-users-jp] ネットワークトランキング(PM/Ethernet) の設定 In-Reply-To: <20021111121300.D574520045@neal.il.is.s.u-tokyo.ac.jp> Message-ID: 琉球大の金城です。 遅くなりました。すみません。 亀山さん、ありがとうございます。 ご指示の通りにpatchを当てる作業をしてみました。 が、 エラーメッセージがでしまいました。 実は、今回始めてpatch を当てる作業をしたもので、 稚拙なところで当方が間違いを起こしているのではないかと思います。 以下、patchまでの流れを示します。 #mkpmethernetconf.exe のあるディレクトリへ移動 # cd /opt/score5.2.0/deploy/bin.i386-redhat7-linux2_4/ #先のメールでのパッチファイルの中身を確認 # cat patch_mkpmethernetconf --- mkpmethernetconf.exe Mon Nov 11 21:33:01 2002 +++ mkpmethernetconf.exe.new Mon Nov 11 21:33:24 2002 @@ -20,7 +20,7 @@ GetOptions('group=s', \$group, 'speed=i', \$speed, "mbps", \$speed, "unit=i", \$unit_num, "device=s", \$device, "maxnsend=s", \$maxnsend, "backoff=s", \$backoff, "checksum=i", \$checksum); -if (!defined($group) || $#ARGV < -1) { +if (!defined($group) && $#ARGV < -1) { print STDERR "Usage: mkpmethernetconf [options] -g group [output_file]\n", " or mkpmethernetconf [options] host_list_file [output_file]\n"; exit(1); ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ # patch を行う【エラー発生】。 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ # patch < patch_mkpmethernetconf (Stripping trailing CRs from patch.) patching file mkpmethernetconf.exe patch unexpectedly ends in middle of line Hunk #1 FAILED at 20. 1 out of 1 hunk FAILED -- saving rejects to file mkpmethernetconf.exe.rej #とりあえず、そのまま次の作業(mkpmethernetconf)を行いました。 #しかしダメなようです。 # mkpmethernetconf -unit 0 teset_kinjo > newfile Usage: mkpmethernetconf [options] -g group [output_file] or mkpmethernetconf [options] host_list_file [output_file] お忙しいところ、お手数とは思いますが、 なにとぞアドバイスをよろしく御願いします。。 ━┛━┛━┛━┛━┛━┛━┛━┛━┛   琉球大学理学部 物質地球科学科   金城 尚志 (キンジョウヒサシ) ━┛━┛━┛━┛━┛━┛━┛━┛━┛ From kameyama @ pccluster.org Wed Nov 13 09:35:11 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Wed, 13 Nov 2002 09:35:11 +0900 Subject: [SCore-users-jp] [SCore-users] 5.2 source doesn't compile for me In-Reply-To: Your message of "Tue, 12 Nov 2002 14:53:47 JST." <200211121453.47263.klaas@ccrl-nece.de> Message-ID: <20021113003511.954C320040@neal.il.is.s.u-tokyo.ac.jp> In article <200211121453.47263.klaas @ ccrl-nece.de> Jens Klaas wrotes: > ----------------------------------------------------- > make[5]: Entering directory=20 > `/opt/source/score-src/SCore/pm2/arch/composite/obj.i386-redhat7-linux2_4= > ' > /usr/bin/gcc `if grep Unportable /usr/include/asm/spinlock.h> /dev/null; = > then=20 > echo -I/usr/src/linux-2.4/include; fi` -O2 `case i386-unknown-linux in=20 > sparc-*-*) echo -Dsparc;; i386-*-*) echo -Di386 -m486;; alpha-*-*) echo=20 > -Dalpha;; esac` `case i386-unknown-linux in *-*-sunos4*) echo -Dsunos4;;=20 > *-*-netbsd*) echo -Dnetbsd;; *-*-linux*) echo -Dlinux;; *-*-osf*) echo=20 > -Dosf1_linux -I/usr/local/linux/linux.include;; esac` -Wall `case=20 > i386-unknown-linux in alpha-*-linux*) echo -pipe -ffixed-8 -mcpu=3Dev5=20 > -Wa,-mev6 ;; esac` -I../../../include -o pm_composite.o -c=20 > =2E./pm_composite.c > In file included from /usr/include/linux/spinlock.h:35, > from ../../../include/pm_lock.h:79, > from ../pm_composite.c:79: If you want top compile SCore form source on redhat 7.3, you need to install kernel source code. (And pm_composite.c include /usr/src/linux-2.4/include/linux/spinlock.h instead of /usr/include/linux/spinlock.h.) Please install kernel source rpm to your host. from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Wed Nov 13 09:39:19 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Wed, 13 Nov 2002 09:39:19 +0900 Subject: [SCore-users-jp] ネットワークトランキング(PM/Ethernet) の設定 In-Reply-To: Your message of "Tue, 12 Nov 2002 23:07:54 JST." Message-ID: <20021113003919.AD17A20040@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article "金城 尚志" wrotes: > エラーメッセージがでしまいました。 > 実は、今回始めてpatch を当てる作業をしたもので、 > 稚拙なところで当方が間違いを起こしているのではないかと思います。 なんか patch の作り方をまちがったようです. 要するに > /opt/score5.2.0/deploy/bin.i386-redhat7-linux2_4/ の mkpmethernetconf.exe ファイルの中に if (!defined($group) || $#ARGV < -1) { という行があるのですが, そこの || を && に変更してください. 変更後は if (!defined($group) && $#ARGV < -1) { のようになります. from Kameyama Toyohisa From kameyama @ pccluster.org Wed Nov 13 10:17:36 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Wed, 13 Nov 2002 10:17:36 +0900 Subject: [SCore-users-jp] サーバホストを含まないネットワークを利用 In-Reply-To: Your message of "Tue, 12 Nov 2002 20:51:13 JST." <200211121158.UAA06403@nss-ntsv4.nssnet.co.jp> Message-ID: <20021113011736.72ACA20036@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <200211121158.UAA06403 @ nss-ntsv4.nssnet.co.jp> "MASA(tm)" wrotes: > 目論んでいること: >  [S] > | >  [100(16Port)_____________________] > | | | | | | > [C1] [C2]...[C6] [C7] [C8]...[C12] > | | | | | | > [1000(8Port)___]==[1000(8Port)___] > ↑Switch によるトランキング(2port) > >  1Gb Ether のSwitch が 8port*2台 となってしまい、Switch 間 > をトランキングしたほうが良いだろうということになっています。 > サーバホストのための e1000 は有りますが、ポートが足りないの > で使用しない予定です。 このような構成は可能です. SCore が EIT で install されている (eth0 で PM/ethernet が使用できる) こと を前提とすれば, 以下の手順でできると思います. 前提として, e100 は eth0 に e1000 は eth1 になっているものと仮定します. 1. config file の置き換え server で # cd /opt/score/etc # mkpmethernetconf -g pcc -device eth1 -speed 1000 > pm-ethernet.conf でできると思います. 2. compute host の /etc/rc.d/init.d/pm-ethernet の編集 この中の IF=eth0 を IF=eth1 に変更します. 3. compute host の eth1 を boot 時に up するようにする. /etc/sysconfig/network-scripts/ifcfg-eth1 の ONBOOT=no を ONBOOT=yes に変更します. IP を振らないのですから, DEVICE と ONBOOT 以外の行 (BOOTPROTO など) は 不要です. 4. compute host を reboot するか, 各 compute host で # /etc/rc.d/init.d/network restart # /etc/rc.d/init.d/pm-ethernet restart を実行します. もしくは server で # scout -g pcc # scout /etc/rc.d/init.d/network restart # scout /etc/rc.d/init.d/pm-ethernet restart を行うという手もあります. 5. pmtest などで動作確認を行います. > ・./etc/pm-*.conf を眺めて、サーバホストから直接見えないデバ >  イスで通信できそうもないと思った。 PM の通信は compute host 間でのみ使用します. scrun を実行する host は PM が見えている必要はありません. (そのため kernel を入れ換える必要はありません.) from Kameyama Toyohisa From k-hayashiatsogo-eng.co.jp Wed Nov 13 13:34:41 2002 From: k-hayashiatsogo-eng.co.jp (Keizo Hayashi) Date: Wed, 13 Nov 2002 13:34:41 +0900 Subject: [SCore-users-jp] Re: PCクラスタセミナーについて References: <200211121132.UAA09434@godzilla.wsd.mt.nec.co.jp> Message-ID: <001501c28acd$fffb8e40$c500a8c0@0292hayashi> 林敬三@綜合技術コンサルタントです。 鳥井様、クラスタセミナーに関する返信どうもありがとうございます。 私のほうもPCクラスタシステム、その中でも特にSCoreには非常に 注目しており、構造解析計算や地震応答解析、流体解析、音響解析 など、様々な計算にうまく応用できないかどうか、模索しているところです。 そのためにPCクラスタに関する情報が少しでも欲しい状態でしたので、 今回の返信は非常にうれしく思います。 ぜひとも、検討よろしくお願いします。 また現在、当社はSCoreシステムの評価・検証中でありますが、 前向きな結論を出せるようなすばらしい評価が得られれば、 会員としての加盟も積極的に考えたいと思っています。 では、今後ともよろしくお願いいたします。 いろいろとお気遣い、どうもありがとうございました。 ================================= (株)綜合技術コンサルタント IT管理室 林 敬三 k-hayashi at sogo-eng.co.jp ================================= From masa @ nssnet.co.jp Wed Nov 13 13:49:56 2002 From: masa @ nssnet.co.jp (MASA(tm)) Date: Wed, 13 Nov 2002 13:49:56 +0900 Subject: [SCore-users-jp] Re: サーバホストを含まないネットワークを利用 In-Reply-To: <20021113011736.72ACA20036@neal.il.is.s.u-tokyo.ac.jp> References: <200211121158.UAA06403@nss-ntsv4.nssnet.co.jp> <20021113011736.72ACA20036@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <200211130457.NAA06594@nss-ntsv4.nssnet.co.jp> 菊池です。こんにちは。  ご返答ありがとうございました。 kameyama @ pccluster.org wrote in <20021113011736.72ACA20036 @ neal.il.is.s.u-tokyo.ac.jp> at Wed, 13 Nov 2002 10:17:36 +0900 > > 目論んでいること: > >  [S] > > | > >  [100(16Port)_____________________] > > | | | | | | > > [C1] [C2]...[C6] [C7] [C8]...[C12] > > | | | | | | > > [1000(8Port)___]==[1000(8Port)___] > > ↑Switch によるトランキング(2port) > >  : > このような構成は可能です. > PM の通信は compute host 間でのみ使用します. > scrun を実行する host は PM が見えている必要はありません. > (そのため kernel を入れ換える必要はありません.)  了解しました。  現在はまだ計算ホスト(図中の C?)が少ないのでサーバホスト (同 S)にも e1000 を挿しています。が、テストを行なう限りで は上記構成が可能だろうな、という感触はあったのですが安心しま した。    ありがとうございました。 -- ---------------------------- 菊池 匡洋 mailto:masa @ nssnet.co.jp ---------------------------- From hori @ swimmy-soft.com Wed Nov 13 14:03:57 2002 From: hori @ swimmy-soft.com (Atsushi HORI) Date: Wed, 13 Nov 2002 14:03:57 +0900 Subject: [SCore-users-jp] Re: [SCore-users] sc_watch did'nt recognize crash of scored.exe on one node In-Reply-To: <20021111180033.B12371@lemon.iwr.uni-heidelberg.de> References: <20021111180033.B12371@lemon.iwr.uni-heidelberg.de> Message-ID: <3120041037.hori0003@swimmy-soft.com> Hi. >But sc_watch didn't notice that error - it simply does nothing. > >So the question is: How is sc_watch monitoring all the >score daemons, that it didn't notice the immediate crash of one of them ? Well, sc_watch samples scored activity, if it is working or not. The default interval is 10 minutes. >The node is now in the defected list, but if I get some hints >how to determine why the scored.exe is crashing immidiately on that >node or somebody want to look a it, I'll try to debug that further. The difficulty of watch dog timer, in general, is that the higher the frequency might not result in the higher the accuracy in time domain. Think about the case that Linux kernel is very busy (for swapping memory, for example) and has not enough time to schedule SCore processes. The sc_watch process may not have any response by the time of next sampling, and this results in rebooting SCore processes. But actually OS kernel is simlply but really heavy-loaded. >On the node there are no related messages in the syslog file and >on the server in "scored.messages" I didn't find anything interesting, >too. But just tell me what additional info is needed. The SCore-D syslog is output via network. If the network has some problem, no syslog is output. The current SCore high availability features can only recover from host (PC) failure. There is no network error recovery mechanism. ---- Atsushi HORI SCore Developer Swimmy Software, Inc. _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From uebayasi @ pultek.co.jp Wed Nov 13 20:30:48 2002 From: uebayasi @ pultek.co.jp (Masao Uebayashi) Date: Wed, 13 Nov 2002 20:30:48 +0900 (JST) Subject: [SCore-users-jp] Re: [SCore-users] Developing with PM In-Reply-To: <3118241825.hori0006@swimmy-soft.com> References: <3117691640.hori0000@swimmy-soft.com> <20021023.172026.09093020.uebayasi@pultek.co.jp> <3118241825.hori0006@swimmy-soft.com> Message-ID: <20021113.203048.84169502.uebayasi@pultek.co.jp> Hello, I have another dumb question. :-) > >As far as I read the code, an fd is accosiated with a context by the > >device number of the device file opened by a process. System calls > >like poll() can identify which context the fd (or `struct file' in the > >kernel) directs to only by knowing the fd's device number. > > No. This is true and untrue. In PM/Myrinet case, this is true. It > depends on implementation of a PM device. What is the supposed way to attach a context if the context can have multiple FDs in the device? (pmAttachContext() accepts only one fd.) Masao _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From e973220 @ eve.u-ryukyu.ac.jp Wed Nov 13 21:07:42 2002 From: e973220 @ eve.u-ryukyu.ac.jp (金城 尚志) Date: Wed, 13 Nov 2002 21:07:42 +0900 Subject: [SCore-users-jp] ネットワークトランキング(PM/Ethernet) の設定 In-Reply-To: <20021113003919.AD17A20040@neal.il.is.s.u-tokyo.ac.jp> Message-ID: 琉球大の金城です。 亀山さん、ありがとうございます。 ご指摘の通りに、 if (!defined($group) && $#ARGV < -1) { に変更することによって、うまく # mkpmethernetconf -unit 0 test_kinjo > newfile を成功することができました。 その後、先のメールと 「Network Trunking機構のシステム管理ガイド」を 参考にし設定をさせてもらいました。 そして、MPIのプログラミングを実行させたところ、 エラーメッセージが発生しました。 ~~~~~~~~~~~~~~~~~ ■■■■■■■■■■■■■■■■ SCore5.0.1のCD-ROMの中に 入っている、MPIのHELLOプログラミングを コンパイルし、実行させてみたところ、 エラーメッセージが発生 ■■■■■■■■■■■■■■■■ $ scrun ./hello <0> SCore-D:WARNING Unable to open a network configuration file (5): network='ethernet-x3', attribute='-trunk0:file' <0> SCore-D:ERROR No PM device opened. <2> SCore-D:WARNING Unable to open a network configuration file (5): network='ethernet-x3', attribute='-trunk0:file' <2> SCore-D:ERROR No PM device opened. <1> SCore-D:WARNING Unable to open a network configuration file (5): network='ethernet-x3', attribute='-trunk0:file' <1> SCore-D:ERROR No PM device opened. <3> SCore-D:WARNING Unable to open a network configuration file (5): network='ethernet-x3', attribute='-trunk0:file' <3> SCore-D:ERROR No PM device opened. ホストコンピュータから、 msgb -group almond もできました。 scout -g almond でロックもできました。 なので、ホストサーバ−計算ホスト間の 通信は確立しているようです。。 また、当方の環境と問題を改めて報告させてもらいます。 ■ ホストサーバ(scib134.sci.u-ryukyu.ac.jp ):1台 ■ 計算ホスト(comp0, comp1, comp2, comp3) :4台 ■ 計算ホストの一台(comp0)はオンボードNICを搭載 ■ comp0 では eth[1-3]を使用(eth0を無視) ■ comp[1-3]では、eth[0-2]を使用 ■ NIC三枚でのネットワークトランキングを実現したい ■ SCore5.2.0 どうかアドバイスを頂けないでしょうか、 よろしく御願いします。 以下に、非常に長い文章ですが、 当方の(設定の作業の)状況の説明を記述しておきます。 ━━━━━━━━状況━━━━━━━━ ■■■■■■■■■■■■■■■■ pm-ethernet-0.conf pm-ethernet-1.conf pm-ethernet-2.conf を作成しました。 pm-ethernet-2.confがきれいに作られているかを 確認してみたところ、Macアドレスが適合しているので OKでした。 他のpm-ethernet-1.conf , pm-ethernet-0.confも同様に OKでした。 ■■■■■■■■■■■■■■■■ # cat pm-ethernet-2.conf unit 2 # maxnsend 0 - 32 maxnsend 16 # backoff 1000 - 20000 (usec) backoff 4800 # checksum (0 if off, 1 is on) checksum 0 # PE MAC address base hostname # comment 0 02:00:08:E3:4C:9B comp0 # on eth3 1 02:00:08:E3:6D:8B comp1 # on eth2 2 02:00:08:E3:57:9B comp2 # on eth2 3 02:00:08:E3:58:9B comp3 # on eth2 ■■■■■■■■■■■■■■■■ 次に、 /opt/score5.2.0/etc/scorehosts.dbを Network Trunking機構(PM/Ethernet)のシステム管理者ガイド http://www.pccluster.org/score/dist/score/html/ja/reference/pm/ether-trunkin g.html を参考に編集しました。 ■■■■■■■■■■■■■■■■ $ cat scorehosts.db /* * SCore 5.0 scorehosts.db * generated by PCCC EIT 5.2 */ /* PM/Myrinet */ myrinet type=myrinet \ -firmware:file=/opt/score/share/lanai/lanai.mcp \ -config:file=/opt/score/etc/pm-myrinet.conf /* PM/Myrinet */ myrinet2k type=myrinet2k \ -firmware:file=/opt/score/share/lanai/lanaiM2k.mcp \ -config:file=/opt/score/etc/pm-myrinet.conf /* PM/Ethernet */ ethernet type=ethernet \ -config:file=/opt/score/etc/pm-ethernet.conf ethernet-0 type=ethernet \ -config:file=/opt/score/etc/pm-ethernet-0.conf ethernet-1 type=ethernet \ -config:file=/opt/score/etc/pm-ethernet-1.conf ethernet-2 type=ethernet \ -config:file=/opt/score/etc/pm-ethernet-2.conf ethernet-x2 type=ethernet \ -config:file=/opt/score/etc/pm-ethernet-1.conf \ -trunk0:file=/opt/score/etc/pm-ethernet-2.conf ethernet-x3 type=ethernet \ -config:file=/opt/score/etc/pm-ethernet-2.conf -trunk0:file=/opt/score/etc/pm-ethernet-1.conf -trunk1:file=/opt/score/etc/pm-ethernet-0.conf gigaethernet type=ethernet \ -config:file=/opt/score/etc/pm-ethernet.conf /* PM/Agent */ udp type=agent -agent=pmaudp \ -config:file=/opt/score/etc/pm-udp.conf /* RHiNET */ rhinet type=rhinet \ -firmware:file=/opt/score/share/rhinet/phu_top_0207a.hex \ -config:file=/opt/score/etc/pm-rhinet.conf ## ## #include "/opt/score//etc/ndconf/0" #include "/opt/score//etc/ndconf/1" #include "/opt/score//etc/ndconf/2" #include "/opt/score//etc/ndconf/3" ## #define MSGBSERV msgbserv=(scib134.sci.u-ryukyu.ac.jp:8764) comp0.sci.u-ryukyu.ac.jp NODE_0 \ network=ethernet,ethernet-0,ethernet-1,ethernet-2,ethernet-x2,ethernet-x3, group=_scoreall_,almond smp=1 MSGBSERV comp1.sci.u-ryukyu.ac.jp NODE_1 \ network=ethernet,ethernet-0,ethernet-1,ethernet-2,ethernet-x2,ethernet-x3,gr oup=_scoreall_,almond smp=1 MSGBSERV comp2.sci.u-ryukyu.ac.jp NODE_2 \ network=ethernet,ethernet-0,ethernet-1,ethernet-2,ethernet-x2,ethernet-x3,gr oup=_scoreall_,almond smp=1 MSGBSERV comp3.sci.u-ryukyu.ac.jp NODE_3 \ network=ethernet,ethernet-0,ethernet-1,ethernet-2,ethernet-x2,ethernet-x3, group=_scoreall_,almond smp=1 MSGBSERV ■■■■■■■■■■■■■■■■ 次にcompute hostの、 /etc/rc.d/init.d/pm_ethernetを編集します。 comp0において ■■■■■■■■■■■■■■■■ [root @ comp0 init.d]# cat pm_ethernet #!/bin/sh # # pm_ethernet: Starts the PM Ethernet driver # # Version: @(#) /etc/rc.d/init.d/pm_ethernet 1.00 # # Author: Shinji Sumimoto (Real World Computing Partnership) # chkconfig: 345 90 18 # description: PM Ethernet driver # probe: true IF=eth0 UNIT=0 INTERRUPT_REAPING=on # Source function library. . /etc/rc.d/init.d/functions # check module module=`modprobe -l pm_ethernet_dev.o | grep -v Note:` # See how we were called. case "$1" in start) echo n "Starting PM/Ethernet: " if [ x$module != x ]; then modprobe pm_ethernet_dev fi # /sbin/etherpmctl $IF -pm on -ir $INTERRUPT_REAPING -unit $UNIT /sbin/etherpmctl eth1 -pm on -ir $INTERRUPT_REAPING -unit 0 /sbin/etherpmctl eth2 -pm on -ir $INTERRUPT_REAPING -unit 1 /sbin/etherpmctl eth3 -pm on -ir $INTERRUPT_REAPING -unit 2 touch /var/lock/subsys/pm_ethernet ;; stop) echo -n "Stopping PM/Ethernet: " # /sbin/etherpmctl $IF -pm off /sbin/etherpmctl eth1 -pm off /sbin/etherpmctl eth2 -pm off /sbin/etherpmctl eth3 -pm off if [ x$module != x ]; then rmmod pm_ethernet_dev fi echo rm -f /var/lock/subsys/pm_ethernet ;; status) if [ x$module != x ]; then /sbin/lsmod fi ;; restart) $0 stop $0 start ;; *) echo "Usage: $0 {start|stop|status|restart}" exit 1 esac exit 0 ■■■■■■■■■■■■■■■■ comp[1-3]においての /etc/rc.d/init.d/pm_ethernet ■■■■■■■■■■■■■■■■ [root @ comp1 init.d]# cat pm_ethernet #!/bin/sh # # pm_ethernet: Starts the PM Ethernet driver # # Version: @(#) /etc/rc.d/init.d/pm_ethernet 1.00 # # Author: Shinji Sumimoto (Real World Computing Partnership) # chkconfig: 345 90 18 # description: PM Ethernet driver # probe: true IF=eth0 UNIT=0 INTERRUPT_REAPING=on # Source function library. . /etc/rc.d/init.d/functions # check module module=`modprobe -l pm_ethernet_dev.o | grep -v Note:` # See how we were called. case "$1" in start) echo n "Starting PM/Ethernet: " if [ x$module != x ]; then modprobe pm_ethernet_dev fi /sbin/etherpmctl $IF -pm on -ir $INTERRUPT_REAPING -unit $UNIT /sbin/etherpmctl eth1 -pm on -ir $INTERRUPT_REAPING -unit 1 /sbin/etherpmctl eth2 -pm on -ir $INTERRUPT_REAPING -unit 2 # /sbin/etherpmctl eth3 -pm on -ir $INTERRUPT_REAPING -unit 3 touch /var/lock/subsys/pm_ethernet ;; stop) echo -n "Stopping PM/Ethernet: " /sbin/etherpmctl $IF -pm off /sbin/etherpmctl eth1 -pm off /sbin/etherpmctl eth2 -pm off # /sbin/etherpmctl eth3 -pm off if [ x$module != x ]; then rmmod pm_ethernet_dev fi echo rm -f /var/lock/subsys/pm_ethernet ;; status) if [ x$module != x ]; then /sbin/lsmod fi ;; restart) $0 stop $0 start ;; *) echo "Usage: $0 {start|stop|status|restart}" exit 1 esac exit 0 ■■■■■■■■■■■■■■■■ comp0において、手動で ifconfig eth[1-3] up comp[1-3]において 手動で ifconfig eth[0-2] up ■■■■■■■■■■■■■■■■ ■■■■■■■■■■■■■■■■ comp[0-4]において # /etc/rc.d/init.d/pm_ethernet restartを実行。 すべてにおいてエラーメッセージなし。 ■■■■■■■■■■■■■■■■ ■■■■■■■■■■■■■■■■ /opt/score5.2.0//etc/scorehosts.dbを 亀山さんの先のメールのような記述を してみました。 ■■■■■■■■■■■■■■■■ [root @ scib134 etc]# cat scorehosts.db /* * SCore 5.0 scorehosts.db * generated by PCCC EIT 5.2 */ /* PM/Myrinet */ myrinet type=myrinet \ -firmware:file=/opt/score/share/lanai/lanai.mcp \ -config:file=/opt/score/etc/pm-myrinet.conf /* PM/Myrinet */ myrinet2k type=myrinet2k \ -firmware:file=/opt/score/share/lanai/lanaiM2k.mcp \ -config:file=/opt/score/etc/pm-myrinet.conf /* PM/Ethernet */ ethernet-x3 type=ethernet \ -config:file=/opt/score/etc/pm-ethernet-2.conf \ -trunk0:file=/opt/score/etc/pm-ethenret-1.conf \ -trunk1:file=/opt/score/etc/pm-ethernet-0.conf gigaethernet type=ethernet \ -config:file=/opt/score/etc/pm-ethernet.conf /* PM/Agent */ udp type=agent -agent=pmaudp \ -config:file=/opt/score/etc/pm-udp.conf /* RHiNET */ rhinet type=rhinet \ -firmware:file=/opt/score/share/rhinet/phu_top_0207a.hex \ -config:file=/opt/score/etc/pm-rhinet.conf ## ## #include "/opt/score//etc/ndconf/0" #include "/opt/score//etc/ndconf/1" #include "/opt/score//etc/ndconf/2" #include "/opt/score//etc/ndconf/3" ## #define MSGBSERV msgbserv=(scib134.sci.u-ryukyu.ac.jp:8764) comp0.sci.u-ryukyu.ac.jp cpugen=i686 speed=500 \ network=ethernet-x3 group=_scoreall_,almond smp=1 MSGBSERV comp1.sci.u-ryukyu.ac.jp cpugen=i686 speed=500 \ network=ethernet-x3 group=_scoreall_,almond smp=1 MSGBSERV comp2.sci.u-ryukyu.ac.jp cpugen=i686 speed=500 \ network=ethernet-x3 group=_scoreall_,almond smp=1 MSGBSERV comp3.sci.u-ryukyu.ac.jp cpugen=i686 speed=500 \ network=ethernet-x3 group=_scoreall_,almond smp=1 MSGBSERV ■■■■■■■■■■■■■■■■ # /etc/rc.d/init.d/scoreboard stop # /etc/rc.d/init.d/scoreboard start を実行。成功。 ■■■■■■■■■■■■■■■■ [root @ scib134 etc]# /etc/rc.d/init.d/scoreboard start Starting scoreboard services: [ OK ] ■■■■■■■■■■■■■■■■ SCore5.0.1のCD-ROMの中に 入っている、MPIのHELLOプログラミングを コンパイルし、実行させてみたところ、 エラーメッセージが発生 ■■■■■■■■■■■■■■■■ <0> SCore-D:WARNING Unable to open a network configuration file (5): network='ethernet-x3', attribute='-trunk0:file' <0> SCore-D:ERROR No PM device opened. <2> SCore-D:WARNING Unable to open a network configuration file (5): network='ethernet-x3', attribute='-trunk0:file' <2> SCore-D:ERROR No PM device opened. <1> SCore-D:WARNING Unable to open a network configuration file (5): network='ethernet-x3', attribute='-trunk0:file' <1> SCore-D:ERROR No PM device opened. <3> SCore-D:WARNING Unable to open a network configuration file (5): network='ethernet-x3', attribute='-trunk0:file' <3> SCore-D:ERROR No PM device opened. ━┛━┛━┛━┛━┛━┛━┛━┛━┛   琉球大学理学部 物質地球科学科   金城 尚志 (キンジョウヒサシ) ━┛━┛━┛━┛━┛━┛━┛━┛━┛ From e973220 @ eve.u-ryukyu.ac.jp Wed Nov 13 21:29:02 2002 From: e973220 @ eve.u-ryukyu.ac.jp (金城 尚志) Date: Wed, 13 Nov 2002 21:29:02 +0900 Subject: [SCore-users-jp] ネットワークトランキング(PM/Ethernet) の設定 In-Reply-To: <20021113121717.07DB72003E@neal.il.is.s.u-tokyo.ac.jp> Message-ID: 琉球大の金城です。 亀山さま、ありがとうございます。 > /opt/score/etc/pm-ethenret-1.conf >が存在するかどうかを確認してください. >また, scoreboard は nobody で動いているので, このファイルは >all readable である必要があります. はい。 lsコマンドで確認したところ、 /opt/score/etc/pm-ethenret-1.confは、 存在しているようです。 また、パーミッションについても、 すべてのユーザーが読み込み可能の状況になっています。 [root @ scib134 etc]# ls -la total 76 drwxr-xr-x 6 root root 4096 Nov 13 21:21 . drwxr-xr-x 22 root root 4096 Nov 12 22:14 .. drwxr-xr-x 2 root root 4096 Nov 12 20:44 compilers -rw-r--r-- 1 root root 205 Nov 12 21:01 hosts.equiv drwxr-xr-x 2 root root 4096 Nov 12 21:07 ndconf -rw-r--r-- 1 root root 27 Nov 12 22:14 pbs_server_name -rw-r--r-- 1 root root 310 Nov 13 19:00 pm-ethernet-0.conf -rw-r--r-- 1 root root 310 Nov 13 19:02 pm-ethernet-1.conf -rw-r--r-- 1 root root 310 Nov 13 19:07 pm-ethernet-2.conf -rw-r--r-- 1 root root 310 Nov 13 19:15 pm-ethernet.conf -rw-r--r-- 1 root root 108 Nov 12 20:58 pm-rhinet.conf -rw-r--r-- 1 root root 0 Nov 12 20:58 pm-udp.conf -rw-r--r-- 1 root root 1508 Nov 13 20:08 scorehosts.db -rw-r--r-- 1 root root 1320 Nov 13 19:16 scorehosts.db.bak -rw-r--r-- 1 root root 0 Oct 11 14:27 scorehosts.defects drwxr-xr-x 2 root root 4096 Nov 13 19:37 tmp-pm-ethernet.conf -rw-r--r-- 1 root root 6 Oct 11 14:26 version ━┛━┛━┛━┛━┛━┛━┛━┛━┛   琉球大学理学部 物質地球科学科   金城 尚志 (キンジョウヒサシ) ━┛━┛━┛━┛━┛━┛━┛━┛━┛ From kameyama @ pccluster.org Wed Nov 13 21:57:03 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Wed, 13 Nov 2002 21:57:03 +0900 Subject: [SCore-users-jp] ネットワークトランキング(PM/Ethernet) の設定 In-Reply-To: Your message of "Wed, 13 Nov 2002 21:29:02 JST." Message-ID: <20021113125703.BA1D02003E@neal.il.is.s.u-tokyo.ac.jp> 亀山です. この mail で string search した結果, In article "金城 尚志" wrotes: > lsコマンドで確認したところ、 > /opt/score/etc/pm-ethenret-1.confは、 > 存在しているようです。 は存在していませんでした. ethernet の r と n とが逆で, > -rw-r--r-- 1 root root 310 Nov 13 19:02 pm-ethernet-1.conf とはマッチしませんでした. scorehosts.db を修正すれば直ると思います. from Kameyama Toyohisa From e973220 @ eve.u-ryukyu.ac.jp Wed Nov 13 22:31:43 2002 From: e973220 @ eve.u-ryukyu.ac.jp (金城 尚志) Date: Wed, 13 Nov 2002 22:31:43 +0900 Subject: [SCore-users-jp] ネットワークトランキング(PM/Ethernet) の設定 Message-ID: 琉球大の金城です。 亀山さん、本当にありがとうございます。 すみません、入力ミスをしていたんですね。。。 早速scorehosts.dbのpm-ethernet-1.confを 訂正し、他に誤字がないかを確認いたしました。 ・・・・、誤字はないようでした。 その後、先のhelloを実行させましたが、 エラーメッセージがでてきました。 $ scrun ./hello <2> SCore-D:WARNING Unable to open a network configuration file (5): network='ethernet-x3', attribute='-trunk0:file' <2> SCore-D:ERROR No PM device opened. <0> SCore-D:WARNING Unable to open a network configuration file (5): network='ethernet-x3', attribute='-trunk0:file' <0> SCore-D:ERROR No PM device opened. <1> SCore-D:WARNING Unable to open a network configuration file (5): network='ethernet-x3', attribute='-trunk0:file' <1> SCore-D:ERROR No PM device opened. <3> SCore-D:WARNING Unable to open a network configuration file (5): network='ethernet-x3', attribute='-trunk0:file' <3> SCore-D:ERROR No PM device opened. すべて確認しましたが、 とりあえず再び、/opt/score5.2.0/etc/の中のファイル群と scorehosts.dbの一部を下にペーストしておきます。 $ ls -l total 68 drwxr-xr-x 2 root root 4096 Nov 12 20:44 compilers -rw-r--r-- 1 root root 205 Nov 12 21:01 hosts.equiv -rw-r--r-- 1 root root 0 Nov 13 22:16 ls drwxr-xr-x 2 root root 4096 Nov 12 21:07 ndconf -rw-r--r-- 1 root root 27 Nov 12 22:14 pbs_server_name -rw-r--r-- 1 root root 310 Nov 13 19:00 pm-ethernet-0.conf -rw-r--r-- 1 root root 310 Nov 13 19:02 pm-ethernet-1.conf -rw-r--r-- 1 root root 310 Nov 13 19:07 pm-ethernet-2.conf -rw-r--r-- 1 root root 310 Nov 13 19:15 pm-ethernet.conf -rw-r--r-- 1 root root 108 Nov 12 20:58 pm-rhinet.conf -rw-r--r-- 1 root root 0 Nov 12 20:58 pm-udp.conf -rw-r--r-- 1 root root 1508 Nov 13 22:04 scorehosts.db -rw-r--r-- 1 root root 1320 Nov 13 19:16 scorehosts.db.bak -rw-r--r-- 1 root root 0 Oct 11 14:27 scorehosts.defects -rw-r--r-- 1 root root 6 Oct 11 14:26 version $ cat scorehosts.db (略) /* PM/Ethernet */ ethernet-x3 type=ethernet \ -config:file=/opt/score/etc/pm-ethernet-2.conf \ -trunk0:file=/opt/score/etc/pm-ethernet-1.conf \ -trunk1:file=/opt/score/etc/pm-ethernet-0.conf (略) #define MSGBSERV msgbserv=(scib134.sci.u-ryukyu.ac.jp:8764) comp0.sci.u-ryukyu.ac.jp cpugen=i686 speed=500 \ network=ethernet-x3 group=_scoreall_,almond smp=1 MSGBSERV comp1.sci.u-ryukyu.ac.jp cpugen=i686 speed=500 \ network=ethernet-x3 group=_scoreall_,almond smp=1 MSGBSERV comp2.sci.u-ryukyu.ac.jp cpugen=i686 speed=500 \ network=ethernet-x3 group=_scoreall_,almond smp=1 MSGBSERV comp3.sci.u-ryukyu.ac.jp cpugen=i686 speed=500 \ network=ethernet-x3 group=_scoreall_,almond smp=1 MSGBSERV 本当に、お手数掛けております。申し訳ありませんが、 よろしく御願いします。 ━┛━┛━┛━┛━┛━┛━┛━┛━┛   琉球大学理学部 物質地球科学科   金城 尚志 (キンジョウヒサシ) ━┛━┛━┛━┛━┛━┛━┛━┛━┛ From e973220 @ eve.u-ryukyu.ac.jp Wed Nov 13 22:52:21 2002 From: e973220 @ eve.u-ryukyu.ac.jp (金城 尚志) Date: Wed, 13 Nov 2002 22:52:21 +0900 Subject: [SCore-users-jp] ネットワークトランキング(PM/Ethernet) の設定 In-Reply-To: Message-ID: 琉大の金城です。 たいへんたいへん、失礼いたしました。 先の件、解決いたしました。 とりあえず、報告まで。 後にまたメールさせてもらいます。。 From e973220 @ eve.u-ryukyu.ac.jp Wed Nov 13 23:05:46 2002 From: e973220 @ eve.u-ryukyu.ac.jp (金城 尚志) Date: Wed, 13 Nov 2002 23:05:46 +0900 Subject: [SCore-users-jp] ネットワークトランキング(PM/Ethernet) の設定 In-Reply-To: <20021113125703.BA1D02003E@neal.il.is.s.u-tokyo.ac.jp> Message-ID: 琉球大の金城です。 亀山様、ありがとうございます。 先の件ですが、 scorehosts.db の誤字の訂正後、 scoreboard の再起動をしておりませんでした。 大変、申し訳ありませんでした。 顔から火が出る思いです。 亀山様に、お手数をかけさせてしまい申し訳ありませんでした。 そして、本当にありがとうございます。 NIC三枚でのネットワークトランキングが完成したようです! これから、通信性能をテストしてみたいと思っております。 それでは、失礼します。 ━┛━┛━┛━┛━┛━┛━┛━┛━┛   琉球大学理学部 物質地球科学科   金城 尚志 (キンジョウヒサシ) ━┛━┛━┛━┛━┛━┛━┛━┛━┛ From hori @ swimmy-soft.com Wed Nov 13 23:50:36 2002 From: hori @ swimmy-soft.com (Atsushi HORI) Date: Wed, 13 Nov 2002 23:50:36 +0900 Subject: [SCore-users-jp] Re: [SCore-users] Developing with PM In-Reply-To: <20021113.203048.84169502.uebayasi@pultek.co.jp> References: <3117691640.hori0000@swimmy-soft.com> Message-ID: <3120076236.hori0001@swimmy-soft.com> Hi. >What is the supposed way to attach a context if the context can have >multiple FDs in the device? (pmAttachContext() accepts only one fd.) Just call the pmCreateAttachFd(pmContext *pmc, int *fdp) function. The pmGetFd() function returns the fds to wait with select() or poll(), not for attaching PM context. ---- Atsushi HORI SCore Developer Swimmy Software, Inc. _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From masa @ nssnet.co.jp Thu Nov 14 00:07:59 2002 From: masa @ nssnet.co.jp (MASA(tm)) Date: Thu, 14 Nov 2002 00:07:59 +0900 Subject: [SCore-users-jp] IFC にて mpif90 が利用できない Message-ID: <200211131515.AAA06815@nss-ntsv4.nssnet.co.jp> 菊池です。こんにちは。 やりたいこと:  ・Intel Fortran Compiler を F90 コンパイラとして利用したい。 現状:  SCore 4.x+TurboLinux6.x+PGIHPF にて稼動していたシステムを、 新規計算機の導入によって SCore5.2.0+RedHatLinux7.3+IFC 上で テストしています。  ソースをそのまま持ってきたところビルドできません。MPICH が 正常にインストールできていないらしいことを突き止めましたが、 ビルドできない原因がそれかどうかはわかっていません。  ML のログを参照しましたが、Intel コンパイラではまっている ような事例は見つかりませんでした。(当然か...) 構成:  SCore 5.2.0, RedHat Linux 7.3, Intel Fortran Compiler 6 やったこと:  0.サーバも EIT でインストールしたが、ソースの展開も行なっ   た。  1.以下の URL 等を参照して、mpif90 を設定した。   http://www.pccluster.org/score/dist/score/html/ja/howtouse/compilers.html   a.icc は持っていないので、site.sample.intel から、    intel=icc の記述を削除したものを site とする。   b.# cd /opt/score/score-src; ./configure; make    # score_compiler_list -all -path -check    するが、icc の記述が残っている。  2.ちらほらとエラーが出ているようなので   # make 2>&1 | tee make.log   とすると、無視されていないエラーがあり、詳細がたどれるも のについて見てみた。  3.runtime/mpi/mpich-1.2.[04] 以下でエラーがあるので   # make BUILD=/opt/score/lib/build/ \ host_nickname=\i386-redhat7-linux2_4 DIST= \ BUILD_CHSCORE2=yes BUILD_CHSCORE2_OPT_COMPILER=no all   としてみるがエラー(*:末尾に転記)。   /opt/score/include/score.h が見えるようにすればよいのか   とも思ったのですが、 # make -n (略)   この先は追えませんでした。 (4.gcc のオプションに「-compiler=intel」などとなっているの   もおかしい。ラッパーの設定がそもそも×?) まったく勘違いをしているような気もしますが、なにかアドバイス をいただけたらと思っています。よろしくお願いいたします。 (*) エラーメッセージ(適宜改行しています)   以下は mpich-1.2.0 ですが、mpich-1.2.4 でも同様です。 gcc -compiler=intel -DFORTRANUNDERSCORE -DHAVE_MPICHCONF_H \ -O4 -I/opt/score/score-src/runtime/mpi/mpich-1.2.0/src/mpid/ch2 \ -I/opt/score/score-src/runtime/mpi/mpich-1.2.0/src \ -I/opt/score/score-src/runtime/mpi/mpich-1.2.0/src/include \ -I/opt/score/score-src/runtime/mpi/mpich-1.2.0/build.i386-redhat7-linux2_4_intel/include \ -I/opt/score/score-src/runtime/mpi/mpich-1.2.0/build.i386-redhat7-linux2_4_intel/mpid/ch_score \ -I/opt/score/score-src/runtime/mpi/mpich-1.2.0/src/mpid/ch_score \ -I/opt/score/score-src/runtime/mpi/mpich-1.2.0/src/mpid/util \ -DHAVE_GETTIMEOFDAY -DMPID_DEVICE_CODE -DMPID_SCORE_ZEROCOPY \ -DMPID_PKT_MAX_DATA_SIZE=9216 -DHAVE_UNAME=1 -DHAVE_NETDB_H=1 \ -DHAVE_GETHOSTBYNAME=1 -DMPID_DEBUG_NONE -DMPID_STAT_NONE \ -c adi2recv.c gcc: unrecognized option `-compiler=intel' In file included from /opt/score/score-src/runtime/mpi/mpich-1.2.0/src/mpid/ch_score/chdef.h:68, from /opt/score/score-src/runtime/mpi/mpich-1.2.0/src/mpid/ch2/packets.h:375, from /opt/score/score-src/runtime/mpi/mpich-1.2.0/src/mpid/ch_score/mpiddev.h:23, from adi2recv.c:9: /opt/score/score-src/runtime/mpi/mpich-1.2.0/src/mpid/ch_score/chdef_rma.h:7:19: score.h: そのようなファイルやディレクトリはありません make[3]: *** [adi2recv.o] エラー 1 Exit status from make was 2 make[2]: *** [mpilib] エラー 1 make[1]: *** [mpi] エラー 2 make[1]: 出ます ディレクトリ `/opt/score5.2.0/score-src/runtime/mpi/mpich-1.2.0/ build.i386-redhat7-linux2_4_intel' -- ---------------------------- 菊池 匡洋 mailto:masa @ nssnet.co.jp ---------------------------- From janz @ phc.uni-kiel.de Thu Nov 14 02:49:44 2002 From: janz @ phc.uni-kiel.de (Andre Janz) Date: Wed, 13 Nov 2002 18:49:44 +0100 Subject: [SCore-users-jp] [SCore-users] Minor documentation bug in SCore 5.2.0 Message-ID: <3DD290B8.6070401@phc.uni-kiel.de> Hi, I just installed SCore 5.2.0 and finally everything worked. I noticed some things in the documentation, though: Instead of rpm -U kernel-source-2.4.18-*.rpm is should probably be rpm -U kernel-source-score-2.4.18-*.rpm right? And I couldn't find the mentioned kernel-headers-2.4.18-3SCORE.i686.rpm on the PCCluster web server or on the ISO image so I just left it out at the moment. André _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From nakata @ bestsystems.co.jp Thu Nov 14 08:12:22 2002 From: nakata @ bestsystems.co.jp (Hisaho Nakata) Date: Thu, 14 Nov 2002 08:12:22 +0900 Subject: [SCore-users-jp] IFC にて mpif90 が利用できない In-Reply-To: <200211131515.AAA06815@nss-ntsv4.nssnet.co.jp> References: <200211131515.AAA06815@nss-ntsv4.nssnet.co.jp> Message-ID: <20021114081222.5051b826.nakata@bestsystems.co.jp> 中田@ベストシステムズです。 Intel用のMPICHを使用したいのであれば、以下の作業で使用可能となります。 # rpm -ivh score-5.2.0-mpich-chscore-intel-5.2.0-3.i386.rpm # rpm -ivh score-5.2.0-mpich-oldchscore-intel-5.2.0-3.i386.rpm # cp /opt/score/etc/compiilers/site.sample.intel site 菊地様> やりたいこと: 菊地様>  ・Intel Fortran Compiler を F90 コンパイラとして利用したい。 ======================================================================== 株式会社 ベストシステムズ システムソリューション事業部テクニカルサポート 中田 寿穗 (nakata @ bestsystems.co.jp) 〒110-0016 東京都台東区台東2-18-8 台東K-1ビル 2,3F Tel: 03-5812-1350 Fax: 03-5812-1351 ======================================================================== From kameyama @ pccluster.org Thu Nov 14 09:40:47 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Thu, 14 Nov 2002 09:40:47 +0900 Subject: [SCore-users-jp] IFC にて mpif90 が利用できない In-Reply-To: Your message of "Thu, 14 Nov 2002 00:07:59 JST." <200211131515.AAA06815@nss-ntsv4.nssnet.co.jp> Message-ID: <20021114004047.4E3C32003E@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <200211131515.AAA06815 @ nss-ntsv4.nssnet.co.jp> "MASA(tm)" wrotes: >  ML のログを参照しましたが、Intel コンパイラではまっている > ような事例は見つかりませんでした。(当然か...) 結構, MPI の再コンパイラではまる事例が多いこともあって, SCore 5.2 では 3 つの商用コンパイラ用の binary をつけました. install 方法は中田さんの mail を参照してください. ソースからコンパイルしたい場合は以下を参考にしてください. >    # score_compiler_list -all -path -check >    するが、icc の記述が残っている。 これが怪しそうです. % score_compiler_list -env mpi -path |grep intel で mpif77 と mpif90 だけ出てくれば良いのですが, mpicc も出て来るようであれば, site ファイルの mpicc をみ直してみてください. > (*) エラーメッセージ(適宜改行しています) >   以下は mpich-1.2.0 ですが、mpich-1.2.4 でも同様です。 この場合, debug に必要な情報は 1. /opt/score/etc/compilers/site ファイルの内容 2. score_compiler_list -all -path -check の出力 3. エラーログの最初のほう configure に渡される引数と compiler の認識 あたりです. mpi_make は scorecc が起動されるのを前提として C compiler に -compiler オプションをつけるようにしていますが, mpi の configure は scorecc -cpmpiler=intel に失敗したので, 代わりに (fail safe として) gcc を使うことにしたという ことが 3 あたりから分かると思います. 結局疑うのは mpi_make か site ファイルということになります. from Kameyama Toyohisa From s-sumi @ flab.fujitsu.co.jp Thu Nov 14 11:09:29 2002 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Thu, 14 Nov 2002 11:09:29 +0900 (JST) Subject: [SCore-users-jp] [SCore-users] [[[ SCore demonstration at SC2002 Baltimore ]]] Message-ID: <20021114.110929.07624794.s-sumi@flab.fujitsu.co.jp> Dear SCore Users. PC Cluster Consortium(PCCC) will demonstrate SCore cluster system software at SC2002 conference, Baltimore. PCCC booth is in a booth R207 "Japanese Grid Cluster Federation". If you attend the SC2002, please come to our booth. We will distribute SCore Cluster system software 5.2 CD-ROM at the booth. Followings are our booth information. ======================================================================== Japanese Grid Cluster Federation: Booth # R207 * http://www.apgrid.org * http://ninf.apgrid.org * http://datafarm.apgrid.org * http://www.rccp.tsukuba.ac.jp * http://www.ehpc.jp * http://www.pccluster.org The Asia-Pacific Grid (APGrid) activities and Japanese major advanced HPC projects will show the latest research results at SC2002: * Demonstrations of Grid technologies on the Asia-Pacific Grid, * Demonstrations of Tokyo Institute of Technology "Titech Campus Grid", * HPC systems and applications for computational physics at the Center for Computational Physics, University of Tsukuba, * Status report of the EHPC (Embedded HPC) project, and * SCore cluster system and Omni OpenMP software developed at the PC cluster consortium which takes over those software developed at the Real World Computing Partnership (RWCP). Japanese Grid Cluster Federation http://www.gridcluster.jp/ ======================================================================== Thanks in advance. ------ Shinji Sumimoto, Fujitsu Labs _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From hagiwaya @ pst.fujitsu.com Thu Nov 14 13:30:43 2002 From: hagiwaya @ pst.fujitsu.com (hagiwara) Date: Thu, 14 Nov 2002 13:30:43 +0900 Subject: [SCore-users-jp] SCoreのLargeFile対応 Message-ID: <3DD326F3.50504@pst.fujitsu.com> 富士通プライムソフトテクノロジの萩原です。 2GBを越えるファイルの扱いについて質問があります。 2GBを越える(約6GB)ファイルを扱うアプリを SCore上で動かそうと思っています。 約6GBのファイルをローカルディスクに持つため、 compute host 内で2GBを越えるファイルを読み書きする 必要があります。 SCore は compute host のカーネルにてを加えてありますが、 LargeFile対応はどのようになっているのでしょうか。 環境は、RedHat Linux 7.2 + SCore5.0.0 を使用しています。 カーネルは、server host は、RedHat linux 7.2標準のものを、 compute host は、SCore5.0.0 に含まれているものを使用。 ファイルシステムは、server host・compute host 共にext2です。 以上、よろしくお願いします。 -- (株)富士通プライムソフトテクノロジ 1-3開発部 萩原 靖則 外線: 052-937-3782 内線:7677-3212 mail : hagiwaya @ pst.fujitsu.com From kameyama @ pccluster.org Thu Nov 14 14:01:32 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Thu, 14 Nov 2002 14:01:32 +0900 Subject: [SCore-users-jp] SCoreのLargeFile 対応 In-Reply-To: Your message of "Thu, 14 Nov 2002 13:30:43 JST." <3DD326F3.50504@pst.fujitsu.com> Message-ID: <20021114050132.725B62004C@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <3DD326F3.50504 @ pst.fujitsu.com> hagiwara wrotes: > SCore は compute host のカーネルにてを加えてありますが、 > LargeFile対応はどのようになっているのでしょうか。 SCore ではそのあたりの code には手を加えていません. kernel 2.4 は 2 GB 以上のファイルに対応していたはずですので, 使用可能だと思います. > 環境は、RedHat Linux 7.2 + SCore5.0.0 を使用しています。 > カーネルは、server host は、RedHat linux 7.2標準のものを、 > compute host は、SCore5.0.0 に含まれているものを使用。 > ファイルシステムは、server host・compute host 共にext2です。 redhat 7.3/SCore 5.2 の環境ですが, ext2 file system で dd によって 4 GB の file の作成に成功しました. from Kameyama Toyohisa From nakata @ bestsystems.co.jp Thu Nov 14 14:07:24 2002 From: nakata @ bestsystems.co.jp (Hisaho Nakata) Date: Thu, 14 Nov 2002 14:07:24 +0900 Subject: [SCore-users-jp] SCoreのLargeFile 対応 In-Reply-To: <3DD326F3.50504@pst.fujitsu.com> References: <3DD326F3.50504@pst.fujitsu.com> Message-ID: <20021114140724.6e7ef9fb.nakata@bestsystems.co.jp> 中田@ベストシステムズです。 > 2GBを越えるファイルの扱いについて質問があります。 > > 2GBを越える(約6GB)ファイルを扱うアプリを > SCore上で動かそうと思っています。 > 約6GBのファイルをローカルディスクに持つため、 > compute host 内で2GBを越えるファイルを読み書きする > 必要があります。 > SCore は compute host のカーネルにてを加えてありますが、 > LargeFile対応はどのようになっているのでしょうか。 ext2だとたしか4GBまでだったような気がします。 私は、XFSのパッチをあてて、SCoreカーネルでXFSを使用できるようにして います。XFSやJFSなど64bitのファイルシステムにすれば、このへんのリミット は回避できます。、 ======================================================================== 株式会社 ベストシステムズ システムソリューション事業部テクニカルサポート 中田 寿穗 (nakata @ bestsystems.co.jp) 〒110-0016 東京都台東区台東2-18-8 台東K-1ビル 2,3F Tel: 03-5812-1350 Fax: 03-5812-1351 ======================================================================== From kameyama @ pccluster.org Thu Nov 14 15:07:15 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Thu, 14 Nov 2002 15:07:15 +0900 Subject: [SCore-users-jp] SCoreのLargeFile 対応 In-Reply-To: Your message of "Thu, 14 Nov 2002 14:07:24 JST." <20021114140724.6e7ef9fb.nakata@bestsystems.co.jp> Message-ID: <20021114060715.9D35D2004C@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <20021114140724.6e7ef9fb.nakata @ bestsystems.co.jp> Hisaho Nakata wrotes: > > SCore は compute host のカーネルにてを加えてありますが、 > > LargeFile対応はどのようになっているのでしょうか。 > > ext2だとたしか4GBまでだったような気がします。 dd で 4.2 GB (4508876800 byte) の file の作成に成功しました. :-) kernel document (Documentation/filesystems/ext2.txt) によると ファイルシステムの制限は Filesystem block size: 1kB 2kB 4kB 8kB File size limit: 16GB 256GB 2048GB 2048GB Filesystem size limit: 2047GB 8192GB 16384GB 32768GB だそうです. 但し, kernel 2.4 では block device の容量が 2048GB までなので, ファイルシステムは 2 GB まで, block size が 8 KB にできるのは alpha のみだそうです. IA32 でも block size 4 KB にすれば 2 TB の file を作成できるようです. どっちみち, 6 GB でしたら (ドキュメントを信用すれば) どんな block size でも大丈夫みたいです. from Kameyama Toyohisa From masa @ nssnet.co.jp Thu Nov 14 15:11:41 2002 From: masa @ nssnet.co.jp (MASA(tm)) Date: Thu, 14 Nov 2002 15:11:41 +0900 Subject: [SCore-users-jp] Re: IFC にて mpif90 が利用できない In-Reply-To: <200211131515.AAA06815@nss-ntsv4.nssnet.co.jp> References: <200211131515.AAA06815@nss-ntsv4.nssnet.co.jp> Message-ID: <200211140618.PAA07032@nss-ntsv4.nssnet.co.jp> 菊池です。こんにちは。  ご返答ありがとうございました。ビルドそのものは成功したよう です。 Hisaho Nakata wrote in <20021114081222.5051b826.nakata @ bestsystems.co.jp> at Thu, 14 Nov 2002 08:12:22 +0900 > Intel用のMPICHを使用したいのであれば、以下の作業で使用可能となります。 > > # rpm -ivh score-5.2.0-mpich-chscore-intel-5.2.0-3.i386.rpm > # rpm -ivh score-5.2.0-mpich-oldchscore-intel-5.2.0-3.i386.rpm > # cp /opt/score/etc/compiilers/site.sample.intel site  失礼しました。作業者の手順を全て追っていませんでしたが、   $ rpm -qa | grep mpich   score5.2.0-mpich-common-5.2.0-3   score5.2.0-mpich-chscore-gnu-5.2.0-3   score5.2.0-mpich-chscore-intel-5.2.0-3   score5.2.0-mpich-oldchscore-gnu-5.2.0-3   score5.2.0-mpich-oldchscore-intel-5.2.0-3 となっておりました。 kameyama @ pccluster.org wrote in <20021114004047.4E3C32003E @ neal.il.is.s.u-tokyo.ac.jp> at Thu, 14 Nov 2002 09:40:47 +0900 > これが怪しそうです. > % score_compiler_list -env mpi -path |grep intel > で mpif77 と mpif90 だけ出てくれば良いのですが, > mpicc も出て来るようであれば, site ファイルの mpicc をみ直してみてください. $ cat /opt/score/etc/compilers/site # site file example for Intel compiler # PGI compiler mpicc gnu=gcc mpic++ gnu=g++ mpif77 intel=ifc gnu=g77 mpif90 intel=ifc mpc++ gnu=g++ omcc gnu=egcs omf77 intel=ifc gnu=egcs scorecc gnu=gcc scorec++ gnu=g++ scoref77 intel=ifc gnu=g77 scoref90 intel=ifc でした。  ところで、   /opt/score/etc/compiler/site.i386-redhat7-linux2_4 なるニックネームを含むファイルには「icc」を含んでいました。 作業者に確認しましたが、どのように作成されたものか不明でした のでリネームしておきました。 # cd /opt/score; make clean; ./configure; make とすると致命的なエラーは発生せずにビルドが完了しました。  # score_compiler_list -all -path -check しても「icc」は現れませんでした。 # 前述の(SCore4上で稼動していた)システムは、今度はコンパイ # ルエラーが発生するので、IFC と PGIHPF の差異を調整しなけれ # ばならないようです。  ありがとうございました。 -- ---------------------------- 菊池 匡洋 mailto:masa @ nssnet.co.jp ---------------------------- From hagiwaya @ pst.fujitsu.com Thu Nov 14 16:58:49 2002 From: hagiwaya @ pst.fujitsu.com (hagiwara) Date: Thu, 14 Nov 2002 16:58:49 +0900 Subject: [SCore-users-jp] SCoreのLargeFile対応 References: <20021114050132.725B62004C@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <3DD357B9.9060306@pst.fujitsu.com> 富士通プライムソフトテクノロジの萩原です。 亀山殿、中田殿 ご返答ありがとうございます。 kameyama @ pccluster.org wrote: > 亀山です. > > In article <3DD326F3.50504 @ pst.fujitsu.com> hagiwara wrotes: > >>SCore は compute host のカーネルにてを加えてありますが、 >>LargeFile対応はどのようになっているのでしょうか。 >> > > SCore ではそのあたりの code には手を加えていません. > kernel 2.4 は 2 GB 以上のファイルに対応していたはずですので, > 使用可能だと思います. > > >>環境は、RedHat Linux 7.2 + SCore5.0.0 を使用しています。 >>カーネルは、server host は、RedHat linux 7.2標準のものを、 >>compute host は、SCore5.0.0 に含まれているものを使用。 >>ファイルシステムは、server host・compute host 共にext2です。 >> > > redhat 7.3/SCore 5.2 の環境ですが, ext2 file system で > dd によって 4 GB の file の作成に成功しました. > > from Kameyama Toyohisa Cプログラム(非並列)で約6GBのプログラムを作成し、 NFSからext2にコピーできました。 XFSのパッチを当てて、カーネルに手を加えることは 極力控えようと思っています。 RedhatがLFSに対応していれば、SCoreも大丈夫というこですね。 以上、ありがとうございました。 -- (株)富士通プライムソフトテクノロジ 1-3開発部 萩原 靖則 外線: 052-937-3782 内線:7677-3212 mail : hagiwaya @ pst.fujitsu.com From emile.carcamo @ nec.fr Wed Nov 13 23:46:06 2002 From: emile.carcamo @ nec.fr (Emile CARCAMO) Date: Wed, 13 Nov 2002 15:46:06 +0100 Subject: [SCore-users-jp] [SCore-users] OpenPBS and load balancing Message-ID: <200211131446.gADEk7i17237@emilepc.ess.nec.fr> Hello, With a very small configuration (only two nodes) I'm trying to setup 3 batch queues (one routing, and two others executing) to do some load balancing on my two PC's. Therefore, I've created 3 groups: ALL with both nodes, XP1 and XP2 with each single node. FYI, I've enclosed my configuration (see screen dumps enclosed) but unfortunatelly, everything only runs on node01 and nothing goes to node02. Please can someone explain me why ? Many thanks in advance, and best regards. -- Emile_CARCAMO NEC European http://www.ess.nec.de System Engineer Supercomputer mailto:emile.carcamo @ nec.fr Systems France GSM mailto:emile.carcamo @ orange.fr (+33)1-3930-6601 FAX (+33)1-3930-6613 PHONE / Your mouse has moved. Windows NT must be restarted \ (+33)6-8063-7003 GSM \ for the change to take effect. Reboot now? [ OK ] / -------------- next part -------------- テキスト形式以外の添付ファイルを保管しました... ファイル名: top-nodes.gif 型: image/gif サイズ: 22256 バイト 説明: top-nodes.gif URL: -------------- next part -------------- テキスト形式以外の添付ファイルを保管しました... ファイル名: runs.jpg 型: image/jpeg サイズ: 121433 バイト 説明: runs.jpg URL: -------------- next part -------------- テキスト形式以外の添付ファイルを保管しました... ファイル名: qmgr.gif 型: image/gif サイズ: 14736 バイト 説明: qmgr.gif URL: From pi_gleich_drei @ web.de Thu Nov 14 21:26:28 2002 From: pi_gleich_drei @ web.de (Christian Winkler) Date: Thu, 14 Nov 2002 13:26:28 +0100 Subject: [SCore-users-jp] [SCore-users] EIT problem Message-ID: <5.1.1.6.2.20021114115011.00a6e060@pop3.web.de> Dear SCore Users, i have a big problem with the installation of SCore using the EIT. i even made a fresh installation of redhat7.3 and configuered the appropriate files. But i still get the message "can not resolve hostname from ip" or "can not resolve ip from hostname". is there anyone who can explain me how to set up the /etc/hosts file and the dns and nis server? i am familiar with using a linux/unix system but administration is in some cases kind of hard for me ;-)) thanks for your support regards christian winkler _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From e973220 @ eve.u-ryukyu.ac.jp Thu Nov 14 21:45:26 2002 From: e973220 @ eve.u-ryukyu.ac.jp (?? ??) Date: Thu, 14 Nov 2002 21:45:26 +0900 Subject: [SCore-users-jp] [SCore-users] EIT problem In-Reply-To: <5.1.1.6.2.20021114115011.00a6e060@pop3.web.de> Message-ID: Hi. Have you written hostnames with small letter? ~~~~~~~~ Capital letter is not good. $ cat /etc/hosts # IPADDR # HOSTNAME 111.111.111.111 aaa.aaa.com KINJO Hisashi -----Original Message----- From: score-users-jp-admin @ pccluster.org [mailto:score-users-jp-admin @ pccluster.org]On Behalf Of Christian Winkler Sent: Thursday, November 14, 2002 9:26 PM To: score-users @ pccluster.org Subject: [SCore-users-jp] [SCore-users] EIT problem Dear SCore Users, i have a big problem with the installation of SCore using the EIT. i even made a fresh installation of redhat7.3 and configuered the appropriate files. But i still get the message "can not resolve hostname from ip" or "can not resolve ip from hostname". is there anyone who can explain me how to set up the /etc/hosts file and the dns and nis server? i am familiar with using a linux/unix system but administration is in some cases kind of hard for me ;-)) thanks for your support regards christian winkler _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users _______________________________________________ SCore-users-jp mailing list SCore-users-jp @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users-jp --- Incoming mail is certified Virus Free. Checked by AVG anti-virus system (http://www.grisoft.com). Version: 6.0.408 / Virus Database: 230 - Release Date: 2002/10/24 _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Fri Nov 15 10:18:46 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Fri, 15 Nov 2002 10:18:46 +0900 Subject: [SCore-users-jp] Re: [SCore-users] EIT problem In-Reply-To: Your message of "Thu, 14 Nov 2002 13:26:28 JST." <5.1.1.6.2.20021114115011.00a6e060@pop3.web.de> Message-ID: <20021115011846.971E62004C@neal.il.is.s.u-tokyo.ac.jp> In article <5.1.1.6.2.20021114115011.00a6e060 @ pop3.web.de> Christian Winkler wrotes: > is there anyone who can explain me how to set up the /etc/hosts file and > the dns and nis server? /etc/hosts file contain IP address and hostname. Syntax for /etc/hosts is: IP_address canonical_hostname aliases For more datail, please read: % man 5 hosts If you want to set up NIS server on server, you can use configNIS command. Please read 3 NIS set up in EIT document: /opt/score/doc/html/en/installation/eit.html You don't need to use DNS, if you don't use DNS, please exec RIT with -nisonly # /opt/score/bin/eit -nisonly from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From e973220 @ eve.u-ryukyu.ac.jp Fri Nov 15 12:36:10 2002 From: e973220 @ eve.u-ryukyu.ac.jp (金城 尚志) Date: Fri, 15 Nov 2002 12:36:10 +0900 Subject: [SCore-users-jp] 【Kernel panic】計算ホストブート時にエラー Message-ID: こんにちわ。 琉球大の金城です。 今回質問がありまして、メールをさせてもらって おります。どうかアドバイスを御願いします。 【問題点】 計算ホストのブート時に、エラーメッセージが でてブートが成功しない。 【状況】 4台ある計算ホストにおいて、 3台(comp[1-3]は通常にブートを成功するのですが、 1台(comp0)だけ、ブートに成功しません。 ------------------------ comp[0-3] はホストネーム ------------------------ 【エラーメッセージ】 (略) NET4: Unix domain sockets 1.0/SMP for Linux NET4.0 EXT2-fs error (device ide013.5)): ext2_check_descriptors: Block bitmap for group 34 not in group (block 16877) ! EXT2-fs: group descriptors corrupted ! kernel panic: VFS: Unable to mount root fs on 03:05 以上のメッセージがでたあと、 動きません。 【環境】 ・ Red Hat Linux 7.3 (フルインストール・ファイルシステム ext3 ) ・ SCore 5.2.0 以上です。 説明が不足している点があるかもしれませんが、 どうかよろしく御願いします。。。 【追伸】 当方で、インターネットや書籍(Linux大全)などを利用して 調べてみましたが、よくわかりませんでした。 (comp0 のHDDが壊れているのでしょうか・・・・?) ━┛━┛━┛━┛━┛━┛━┛━┛━┛   琉球大学理学部 物質地球科学科   金城 尚志 (キンジョウヒサシ) ━┛━┛━┛━┛━┛━┛━┛━┛━┛ From kameyama @ pccluster.org Fri Nov 15 13:21:57 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Fri, 15 Nov 2002 13:21:57 +0900 Subject: [SCore-users-jp] 【Kernel panic 】計算ホストブート時にエラー In-Reply-To: Your message of "Fri, 15 Nov 2002 12:36:10 JST." Message-ID: <20021115042157.582E32004C@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article "金城 尚志" wrotes: > EXT2-fs error (device ide013.5)): ext2_check_descriptors: Block bitmap for > group > 34 not in group (block 16877) ! > EXT2-fs: group descriptors corrupted ! > kernel panic: VFS: Unable to mount root fs on 03:05 root file system が壊れているようです. とりあえず,レスキューモード http://www.redhat.co.jp/manual/Doc73/RH-DOCS/rhl-cg-ja/ch-rescuemode.html で起動して root file sustem が fsck で復活するか試してみるのでしょうか? それでもだめなら, 再 install しか無いかも... > (comp0 のHDDが壊れているのでしょうか・・・・?) その可能性もありますが, 物理的には壊れていない可能性もあります. 本当に壊れていたら, ディスクが読めないというエラーが出ますし... from Kameyama Toyohisa From e973220 @ eve.u-ryukyu.ac.jp Fri Nov 15 20:07:58 2002 From: e973220 @ eve.u-ryukyu.ac.jp (金城 尚志) Date: Fri, 15 Nov 2002 20:07:58 +0900 Subject: [SCore-users-jp] 【Kernel panic 】計算ホストブート時にエラー In-Reply-To: <20021115042157.582E32004C@neal.il.is.s.u-tokyo.ac.jp> Message-ID: 琉球大の金城です。 亀山さまありがとうございます。 結論を言えば、僕の知識の足りなさで、 comp0を復活(ブートの完了)させることはできませんでした。 失敗したこととはいえ一応、行った作業を 残しておきます。 > http://www.redhat.co.jp/manual/Doc73/RH-DOCS/rhl-cg-ja/ch-rescuemode.html を参考に、linux rescueをしてみました。 (Red Hat 7.3 のCD-ROM 1を利用) 【Continue】を選択すると、 「hda5がおかしいですよ」といった感じのメッセージがでてきました。 それなので、 sh-2.05a# fsck /dev/hda5 を打ち込みました。 そうすると、 「y or n ? 」といったメッセージがでてきたので、 ひたすら y を入力しました。 その後、 sh-2.05a# exit とし、再起動させました。 が、やはり kernel panicを起こしたままでした。 なので、再び linux rescue で、 すべての hda** においてしらみつぶしに sh-2.05a# fsck /dev/hda** を行ったあと、再起動しましたが、 やはり Kernel panicを起こしたままでした。 ・・・・・でその後、 結局再インストールを行うことにしました。 comp0 は再インストールに成功したので、 やはり亀山さんのおっしゃる通り、 HDDは物理的に壊れていないようでした。 それでは。 ━┛━┛━┛━┛━┛━┛━┛━┛━┛   琉球大学理学部 物質地球科学科   金城 尚志 (キンジョウヒサシ) ━┛━┛━┛━┛━┛━┛━┛━┛━┛ From master.of.brainless.things @ gmx.net Sat Nov 16 01:07:16 2002 From: master.of.brainless.things @ gmx.net (=?iso-2022-jp?b?bWFzdGVyLm9mLmJyYWlubGVzcy50aGluZ3MgGyRCIXcbKEIgZ214Lm5l?= =?iso-2022-jp?b?dA==?=) Date: Fri, 15 Nov 2002 17:07:16 +0100 Subject: [SCore-users-jp] [SCore-users] Re: Re: EIT problem References: <20021115030001.3276.40273.Mailman@www.pccluster.org> Message-ID: <003601c28cc1$1198d280$6400a8c0@leqoq> perhaps i can help you: from your name, i suppose you are german, too. and your linux is running with german language. we had the same problem, same error messages. after a long time checking the scripts, we got it: just set the language to german (i dont remind the exact call) like: export lang=C for english, or american. don't know, why "C". export, because eit is executed in a sub-shell. it's, because the scripts search for the string "address", and in the german "ifconfig" you'll find "Adresse". hope this solves you problem. regards Alex Golks _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From amik @ cfdlab.mcgill.ca Sat Nov 16 04:56:02 2002 From: amik @ cfdlab.mcgill.ca (Amik St-Cyr CFD Lab) Date: 15 Nov 2002 14:56:02 -0500 Subject: [SCore-users-jp] [SCore-users] [Fwd: ULT:] Message-ID: <1037390163.3123.16.camel@stan.cfdlab.mcgill.ca> -- _____________________________________________________ Dr. A. St-Cyr Research Associate, CFD Lab Department of Mechanical Engineering McGill University 688 Sherbrooke Street West, 7th floor Montreal, Qc, Canada H3A 2S6 Tel: +1 (514) 398-1710, Admin. Fax : 2203 amik @ cfdlab.mcgill.ca _____________________________________________________ -------------- next part -------------- 添付メールを保管しました... 送信者: Amik St-Cyr CFD Lab 件名: ULT: 日付: 15 Nov 2002 13:15:48 -0500 サイズ: 1112 バイト URL: From amik @ cfdlab.mcgill.ca Sat Nov 16 07:41:28 2002 From: amik @ cfdlab.mcgill.ca (Amik St-Cyr CFD Lab) Date: 15 Nov 2002 17:41:28 -0500 Subject: [SCore-users-jp] [SCore-users] ULT (bis) Message-ID: <1037400093.4139.1.camel@stan.cfdlab.mcgill.ca> While reading the mail archive somebody already had that problem but no solutione were proposed: | amik @ stokes 17:43:23 proc> scout "ls -l /opt/score/deploy/bin.i386-redhat7-linux2_4/ " [cn1-9,cn10-9,cn20-9,cn30-9,cn40-9,cn50-9,cn60-9,cn70-9,cn80-9,cn90-9,cn100-9,cn110-9,cn120-8]: total 20488 -rwxr-xr-x 1 root root 692502 Oct 11 10:00 bustest.exe -rwxr-xr-x 1 root root 692502 Oct 11 10:00 bustest2k.exe -rwxr-xr-x 1 root root 716448 Oct 11 10:00 cstest.exe -rwxr-xr-x 1 root root 4004 Oct 11 10:00 cstest_scboard.exe -rwxr-xr-x 1 root root 488926 Oct 11 10:00 etherpmdump.exe -rwxr-xr-x 1 root root 942 Oct 11 10:00 ipcrmm.exe -rwxr-xr-x 1 root root 4816 Oct 11 10:00 mkpmethernetconf.exe -rwxr-xr-x 1 root root 631890 Oct 11 10:00 pmaudp.exe -rwxr-xr-x 1 root root 682885 Oct 11 10:00 pminit.exe -rwxr-xr-x 1 root root 663351 Oct 11 10:00 pmroute.exe -rwxr-xr-x 1 root root 663353 Oct 11 10:00 pmroute2k.exe -rwxr-xr-x 1 root root 745845 Oct 11 10:00 pmtest.exe -rwxr-xr-x 1 root root 589994 Oct 11 10:00 pmudpd.exe -rwxr-xr-x 1 root root 777 Oct 11 10:00 pskill.exe -rwxr-xr-x 1 root root 35265 Oct 11 10:00 scbfile.exe -rwxr-xr-x 1 root root 39507 Oct 11 10:00 scbinfo.exe -rwxr-xr-x 1 root root 4022 Oct 11 10:00 scbpmexec.exe -rwxr-xr-x 1 root root 6301641 Oct 11 10:00 scored.exe -rwxr-xr-x 1 root root 6994680 Oct 11 10:00 scored_dev.exe -rwxr-xr-x 1 root root 68820 Oct 11 10:00 scoutd.exe -rwsr-xr-x 1 root root 109929 Oct 11 10:00 scremote.exe -rwxr-xr-x 1 root root 717914 Oct 11 10:00 scstest.exe -rwxr-xr-x 1 root root 5030 Oct 11 10:00 skill.exe | amik @ stokes 17:43:29 proc> exit SCOUT: Session done. | amik @ stokes 17:45:46 proc> -- _____________________________________________________ Dr. A. St-Cyr Research Associate, CFD Lab Department of Mechanical Engineering McGill University 688 Sherbrooke Street West, 7th floor Montreal, Qc, Canada H3A 2S6 Tel: +1 (514) 398-1710, Admin. Fax : 2203 amik @ cfdlab.mcgill.ca _____________________________________________________ _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From munakata @ itg.hitachi.co.jp Sun Nov 17 13:33:52 2002 From: munakata @ itg.hitachi.co.jp (Munakata Yoshihisa) Date: Sun, 17 Nov 2002 13:33:52 +0900 Subject: [SCore-users-jp] zerocopy=on Message-ID: <001d01c28df2$882dcc20$a1691fac@P77800200> 宗像と申します。お世話になります。初めてメールします。 SCore 5.0.1上のPMのZeroCopy通信について、お教え頂ければ幸い です。 CPU   Xeon2.4GHz×2SMP チップセットはE7500(Plamus) Memory 4GB NICはMyrinet2000 のマシンを2台構成でHPL(HighPerformanceLinpack)を試験的に流し ています。 この構成で、scrun時、zerocopy通信をOFF(デフォルト)では特に問題 なく計測できるのですが、zerocopy通信をONにして計測しようとすると、 MPIの通信がAbortするか、あるいは何らかの通信エラーが出て、正 常に終了しません。これはHPLの問題規模を小さく(N=1000)しても、中 規模(N=15000程度)にしても状況は変わりませんでした。 PMのZeroCopy通信というものは、ある程度ZeroCopy通信の構造を 理解して、それを意識したプログラミング作法に則ったプログラミング をしていないと利用できないオプションなのでしょうか。 それとも何らかの設定で回避できるものなのでしょうか。申し訳ありま せんが、可能であればどなたかお教えください。 -  以上 − From s-sumi @ bd6.so-net.ne.jp Mon Nov 18 01:43:45 2002 From: s-sumi @ bd6.so-net.ne.jp (=?iso-2022-jp?b?cy1zdW1pIBskQiF3GyhCIGJkNi5zby1uZXQubmUuanA=?=) Date: Mon, 18 Nov 2002 01:43:45 +0900 (JST) Subject: [SCore-users-jp] zerocopy=on In-Reply-To: <001d01c28df2$882dcc20$a1691fac@P77800200> References: <001d01c28df2$882dcc20$a1691fac@P77800200> Message-ID: <20021118.014345.730563224.s-sumi@bd6.so-net.ne.jp> 富士通研の住元@Baltimoreです。 MPIプログラムからはPMのZerocopy通信は透過的に見えますので、 オプションをつけてもプログラム実行は変わらないはずです。 問題があるとすれば、おそらくメモリが4GBであるからだと思いますが どのようなエラーが出ているでしょうか? メモリは全て認識されているでしょうか? From: "Munakata Yoshihisa" Subject: [SCore-users-jp] zerocopy=on Date: Sun, 17 Nov 2002 13:33:52 +0900 Message-ID: <001d01c28df2$882dcc20$a1691fac @ P77800200> munakata> munakata> 宗像と申します。お世話になります。初めてメールします。 munakata> munakata> SCore 5.0.1上のPMのZeroCopy通信について、お教え頂ければ幸い munakata> です。 munakata> munakata> CPU   Xeon2.4GHz×2SMP munakata> チップセットはE7500(Plamus) munakata> Memory 4GB munakata> NICはMyrinet2000 munakata> munakata> munakata> のマシンを2台構成でHPL(HighPerformanceLinpack)を試験的に流し munakata> ています。 munakata> munakata> この構成で、scrun時、zerocopy通信をOFF(デフォルト)では特に問題 munakata> なく計測できるのですが、zerocopy通信をONにして計測しようとすると、 munakata> MPIの通信がAbortするか、あるいは何らかの通信エラーが出て、正 munakata> 常に終了しません。これはHPLの問題規模を小さく(N=1000)しても、中 munakata> 規模(N=15000程度)にしても状況は変わりませんでした。 munakata> munakata> PMのZeroCopy通信というものは、ある程度ZeroCopy通信の構造を munakata> 理解して、それを意識したプログラミング作法に則ったプログラミング munakata> をしていないと利用できないオプションなのでしょうか。 munakata> それとも何らかの設定で回避できるものなのでしょうか。申し訳ありま munakata> せんが、可能であればどなたかお教えください。 munakata> munakata> -  munakata> 以上 − munakata> munakata> munakata> munakata> munakata> munakata> _______________________________________________ munakata> SCore-users-jp mailing list munakata> SCore-users-jp @ pccluster.org munakata> http://www.pccluster.org/mailman/listinfo/score-users-jp munakata> ----- Shinji Sumimoto Fujitsu Labs From emile.carcamo @ nec.fr Mon Nov 18 17:02:16 2002 From: emile.carcamo @ nec.fr (Emile CARCAMO) Date: Mon, 18 Nov 2002 09:02:16 +0100 Subject: [SCore-users-jp] [SCore-users] OpenPBS 2.2p7 accounting question Message-ID: <200211180802.gAI82GX03178@emilepc.ess.nec.fr> Hello, On the master host of my SCore cluster, I looked at the files listed below : [root @ sparepc]# pwd /var/scored/pbs/server_priv/accounting [root @ sparepc]# ls -l total 212 -rw-r--r-- 1 root root 0 Nov 1 17:54 20021101 -rw-r--r-- 1 root root 0 Nov 5 08:13 20021105 -rw-r--r-- 1 root root 0 Nov 6 12:31 20021106 -rw-r--r-- 1 root root 22361 Nov 7 18:14 20021107 -rw-r--r-- 1 root root 107853 Nov 8 17:16 20021108 -rw-r--r-- 1 root root 32977 Nov 12 17:56 20021112 -rw-r--r-- 1 root root 3387 Nov 13 16:04 20021113 -rw-r--r-- 1 root root 2025 Nov 14 11:11 20021114 -rw-r--r-- 1 root root 677 Nov 15 13:59 20021115 [root @ sparepc]# and I noticed the field called "resources_used.cput" is always marked empty (00:00:00). Just let me know if I've missed something in my settings ? I'm running 5.2.0 on top of a freshly installed RedHat 7.3. Best regards, -- Emile_CARCAMO NEC European http://www.ess.nec.de System Engineer Supercomputer mailto:emile.carcamo @ nec.fr Systems France GSM mailto:emile.carcamo @ orange.fr (+33)1-3930-6601 FAX (+33)1-3930-6613 PHONE / Your mouse has moved. Windows NT must be restarted \ (+33)6-8063-7003 GSM \ for the change to take effect. Reboot now? [ OK ] / _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Mon Nov 18 17:23:59 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Mon, 18 Nov 2002 17:23:59 +0900 Subject: [SCore-users-jp] Re: [SCore-users] OpenPBS 2.2p7 accounting question In-Reply-To: Your message of "Mon, 18 Nov 2002 09:02:16 JST." <200211180802.gAI82GX03178@emilepc.ess.nec.fr> Message-ID: <20021118082359.AF03520049@neal.il.is.s.u-tokyo.ac.jp> In article <200211180802.gAI82GX03178 @ emilepc.ess.nec.fr> Emile CARCAMO wrotes: > and I noticed the field called "resources_used.cput" is > always marked empty (00:00:00). pbs execute scout (or scrun) pogram to run SCore program. But scout only controls SCore programs, doesn't spend CPU time. (Reay job execute other host, but pbs doesnot known about these job.) So pbs always arked CPU time to empty. from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From munakata @ itg.hitachi.co.jp Mon Nov 18 19:16:44 2002 From: munakata @ itg.hitachi.co.jp (Munakata Yoshihisa) Date: Mon, 18 Nov 2002 19:16:44 +0900 Subject: [SCore-users-jp] zerocopy=on References: <001d01c28df2$882dcc20$a1691fac@P77800200> <20021118.014345.730563224.s-sumi@bd6.so-net.ne.jp> Message-ID: <006801c28eeb$98523ba0$a1691fac@P77800200> 富士通研 住元様 宗像です。早速のリプライ有難う御座います。 ご返事が遅れ申し訳ありません。 > 問題があるとすれば、おそらくメモリが4GBであるからだと思いますが > のご指摘に対して、カーネルのオプションで、メモリを制限してブートして みて、確認しました。 mem=512m mem=3000m の時は、確かにZeroCopy=ONで問題なくHPLは動作するようです。 どうもメモリの大きさが31ビット〜32ビットアドレスの大きいところ近辺 になってくると、動作がおかしくなるようです。(<−ここは推測です。) PM周りで、この辺の動作について、何か心当たりはおありでしょうか。 ご意見を伺いたく、よろしくお願い致します。 From ia4004 @ fh-wedel.de Tue Nov 19 02:30:29 2002 From: ia4004 @ fh-wedel.de (Nils Plohmann) Date: Mon, 18 Nov 2002 18:30:29 +0100 Subject: [SCore-users-jp] [SCore-users] SCore History Message-ID: <3DD923B4.55D41F41@fh-wedel.de> Hello, I want to ask you, whether you know, if there is a site in the internet about the history of SCore Cluster. Do you any sites know? Or do you know some important dates? I have to build a elaboration about installing and conf. a score cluster in our University of Applied Sciences. Yours, Nils Plohmann -- Physikalisch-technische Lehranstalt Wedel Technischer Assistent für Informatik _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Tue Nov 19 09:11:25 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Tue, 19 Nov 2002 09:11:25 +0900 Subject: [SCore-users-jp] zerocopy=on In-Reply-To: Your message of "Mon, 18 Nov 2002 19:16:44 JST." <006801c28eeb$98523ba0$a1691fac@P77800200> Message-ID: <20021119001125.9412820049@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <006801c28eeb$98523ba0$a1691fac @ P77800200> "Munakata Yoshihisa" wrotes: > > 問題があるとすれば、おそらくメモリが4GBであるからだと思いますが > > > > のご指摘に対して、カーネルのオプションで、メモリを制限してブートして > みて、確認しました。 > > mem=512m > mem=3000m > > の時は、確かにZeroCopy=ONで問題なくHPLは動作するようです。 もし, kernel が 2.4.18-2SCOREenterprise を使用しているのでしたら 2.4.18-2SCOREsmp に変更してみてください. また, 自分でカスタマイズした kernel を使用しているのでしたら, High Memory Support のところで 4GB を選択してコンパイルしてみてください. 多分, 4 GB - 128 MB 程度は使用できると思います. > どうもメモリの大きさが31ビット〜32ビットアドレスの大きいところ近辺 > になってくると、動作がおかしくなるようです。(<−ここは推測です。) > > PM周りで、この辺の動作について、何か心当たりはおありでしょうか。 i386 の場合 PM の driver ではアドレスを 32 bit しかみていません. また, myrinet の DMA 転送も 32 bit しか使用していません. このため, 仮想アドレスもしくは物理アドレスが 32 bit で表せなくなった場合, その領域にはアクセスできないことになります. 少なくても仮想アドレスには I/O を map したものも含まれるので, memory を 4 GB 積んだ場合, 32 bit で表せない部分が出てしまうため おかしくなってしまうのだと思います. from Kameyama Toyohisa From t-kanamori @ pb.jp.nec.com Tue Nov 19 13:48:40 2002 From: t-kanamori @ pb.jp.nec.com (T.Kanamori) Date: Tue, 19 Nov 2002 13:48:40 +0900 Subject: [SCore-users-jp] SCore4.0でのオプションコンパイラ Message-ID: <20021119125550.79DE.T-KANAMORI@pb.jp.nec.com> 金森と申します。お世話になります。 はじめてメールします。 組み込みオプションコンパイラがうまく動作しません。 RHL7.0.1(カーネル 2.2.16-22enterprise) という環境下において SCore4.0を構築しています。(RPMファイルのインストール) そこで、オプションコンパイラとして Absoft Fortran Ver8を組み込み、mpif90に対応しようとしました。 SCore5.Xとは組み込み手順がかなり異なっているようなのですが、 以下の手順で作業を進めました。 ・Score4.0ソースをインストールし展開 ・ /opt/score/deploy/config.nicknameを実行 i386-redhat-linux ・/opt/score/src/build/config/i386-redhat-linuxを編集 # G77 = /usr/bin/g77 G77LIBDIR = /usr/lib/gcc-lib/i386-redhat-linux/egcs-2.91.66 G77LIB = -lg2c # Other fortran 77 compiler for MPI # OPT_F77 = pgi:pgf77 fujitsu:frt OPT_F77 = absoft:/opt/absoft/bin/f77 # Fortran 90 Compiler for MPI # OPT_F90 = pgi:pgf90 fujitsu:f90 OPT_F90 = absoft:/opt/absoft/bin/f90 ・SCoreシステムをmake (opt/score/src配下) ・ソースのmpiディレクトリ配下でmake install (opt/score/src/mpi配下)  ※mpi関連モジュールを置換 ・mpif90を実行 bash-2.04$ mpif90 Compiler absoft not found. following compiler is available: pgi: pgf90 fujitsu: f90 ・mpif90を-compilerオプションをつけて実行 bash-2.04$ mpif90 -compiler absoft Compiler absoft not found. following compiler is available: pgi: pgf90 fujitsu: f90 ちなみに(重要な)ログを採取忘れましたが、 実際入っていないですが、pgiなどをオプションで指定すると following compiler としてabsoft f90 が表示されました。 ・mpif77を-compilerオプションをつけて実行 bash-2.04$ mpif77 -compiler absoft Compiler absoft not found. following compiler is available: gnu: /usr/bin/g77 pgi: pgf77 fujitsu: frt gnu1ul: /usr/bin/g77 となり、バックエンドコンパイラとしてabsoft fortranが動作しません。 直接コンパイラを実行した場合、正常に起動します。 # /opt/absoft/bin/f90 /opt/absoft/bin/f90 [options] file [file] ... なにか手順上誤りがあるでしょうか。また、調査ポイント等 以後の進め方のアドバイスをよろしくお願いします。 From kameyama @ pccluster.org Tue Nov 19 14:05:55 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Tue, 19 Nov 2002 14:05:55 +0900 Subject: [SCore-users-jp] SCore4.0でのオプションコンパイラ In-Reply-To: Your message of "Tue, 19 Nov 2002 13:48:40 JST." <20021119125550.79DE.T-KANAMORI@pb.jp.nec.com> Message-ID: <20021119050555.24EF320045@neal.il.is.s.u-tokyo.ac.jp> m> "T.Kanamori" wrotes: > ・SCoreシステムをmake (opt/score/src配下) > > ・ソースのmpiディレクトリ配下でmake install (opt/score/src/mpi配下) >  ※mpi関連モジュールを置換 SCore 4.0 の場合はどのコ黹闥繙祁?ぢに埋め込まれているので, すべてを install してください. from Kameyama Toyohisa From a347802r @ tobata.isc.kyutech.ac.jp Tue Nov 19 17:16:12 2002 From: a347802r @ tobata.isc.kyutech.ac.jp (iida ryousuke) Date: Tue, 19 Nov 2002 17:16:12 +0900 Subject: [SCore-users-jp] Scoreとアプリケーションについて Message-ID: <3DD9F34C.80107@tobata.isc.kyutech.ac.jp> 九州工業大学の飯田と申します。下記のようなプログラム(一部)を用いてファイ ル作成のプログラムを実行させてもファイルが作成されません。 MPI_File_open( MPI_COMM_WORLD, filename, MPI_MODE_CREATE | MPI_MODE_RDWR, MPI_INFO_NULL, &fh ); MPI_File_seek( fh, myrank*NBYTES, MPI_SEEK_SET ); MPI_File_write( fh, buf, NBYTES, MPI_BYTE, &status ); MPI_File_close( &fh ); Score5.0の中に入っているアプリケーションだけでは、実行できなことがあるの ですか。 九州工業大学 界面科学研究室 飯田良介 メールアドレス a347802r @ tobata.isc.kyutech.ac.jp From kameyama @ pccluster.org Tue Nov 19 17:30:07 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Tue, 19 Nov 2002 17:30:07 +0900 Subject: [SCore-users-jp] Scoreとアプリケーションについて In-Reply-To: Your message of "Tue, 19 Nov 2002 17:16:12 JST." <3DD9F34C.80107@tobata.isc.kyutech.ac.jp> Message-ID: <20021119083007.B2AB020045@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <3DD9F34C.80107 @ tobata.isc.kyutech.ac.jp> iida ryousuke wrotes: > 九州工業大学の飯田と申します。下記のようなプログラム(一部)を用いてファイ > ル作成のプログラムを実行させてもファイルが作成されません。 > > MPI_File_open( MPI_COMM_WORLD, > filename, > MPI_MODE_CREATE | MPI_MODE_RDWR, > MPI_INFO_NULL, > &fh ); そのプログラムをどこの directory で動かして, filename にどのような 値を入れたかに依存しそうです. SCore では compute host に存在しない directory でプログラムを 実行したとき, /var/scored のしたに適当な directory を作成してそこを current directory とします. その directory はプログラムの実行が終了した時点で削除されます. また, /tmp など compute host に存在する directory で実行した場合, ファイルは compute host のその directory に作成することになります. EIT で install した場合は, server の /home が NFS mount されていますので, /home のどこかで実行すればうまく行くと思います. > Score5.0の中に入っているアプリケーションだけでは、実行できなことがあるの > ですか。 全部を試しているわけではありませんので bug のある可能性はありますが, SCore 5.2 相当の環境で /opt/score/mpi/mpich-1.2.4/i386-redhat7-linux2_4_gnu/examples/simpleio.c が動くことを確認しましたので, 多分動くと思います. from Kameyama Toyohisa From munakata @ itg.hitachi.co.jp Tue Nov 19 20:40:41 2002 From: munakata @ itg.hitachi.co.jp (Munakata Yoshihisa) Date: Tue, 19 Nov 2002 20:40:41 +0900 Subject: [SCore-users-jp] zerocopy=on References: <20021119001125.9412820049@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <002001c28fc0$7d8360d0$a1691fac@P77800200> 亀山様 宗像です。ご回答有難う御座います。 > > もし, kernel が > 2.4.18-2SCOREenterprise > を使用しているのでしたら > 2.4.18-2SCOREsmp > に変更してみてください. > また, 自分でカスタマイズした kernel を使用しているのでしたら, > High Memory Support > のところで > 4GB > を選択してコンパイルしてみてください. > 多分, 4 GB - 128 MB 程度は使用できると思います. ご指摘の通りにしたところ、確かに動作しました。有難う御座いました。 もし、可能であれば、以下の点についても、後学の為にお教え頂ければ と思います。 > i386 の場合 PM の driver ではアドレスを 32 bit しかみていません. > また, myrinet の DMA 転送も 32 bit しか使用していません. > このため, 仮想アドレスもしくは物理アドレスが 32 bit で表せなくなった場合, > その領域にはアクセスできないことになります. > > 少なくても仮想アドレスには I/O を map したものも含まれるので, > memory を 4 GB 積んだ場合, 32 bit で表せない部分が出てしまうため > おかしくなってしまうのだと思います. > 確かEnterprise KernelというのはIA-32でも最大64GBの物理メモリを 認識するようにしたカーネルだと思います。 これが使えるとすると、IA-32の1プロセスの仮想アドレス空間が4G (カーネル1G+ユーザ3G)という制限は別にあると思いますが、4G B超の物理メモリを積んだIA-32マシンでLinuxを動かすという構成も あるのかと思います。 その場合、上記のMyrinet2000+PMの制限に引っかかってしまうと 思うのですが、それはPMドライバの改変をしない限り対応できない ものなのでしょうか。 仮定の話で、余計なことをお聞きして申し訳ありません。もし気が向 けば、ご意見を頂ければと思います。兎に角、結果のご報告まで。 以上 From kameyama @ pccluster.org Tue Nov 19 21:03:33 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Tue, 19 Nov 2002 21:03:33 +0900 Subject: [SCore-users-jp] zerocopy=on In-Reply-To: Your message of "Tue, 19 Nov 2002 20:40:41 JST." <002001c28fc0$7d8360d0$a1691fac@P77800200> Message-ID: <20021119120333.EEB4F20045@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <002001c28fc0$7d8360d0$a1691fac @ P77800200> "Munakata Yoshihisa" wrotes: > 確かEnterprise KernelというのはIA-32でも最大64GBの物理メモリを > 認識するようにしたカーネルだと思います。 はい,そうです. > これが使えるとすると、IA-32の1プロセスの仮想アドレス空間が4G > (カーネル1G+ユーザ3G)という制限は別にあると思いますが、4G > B超の物理メモリを積んだIA-32マシンでLinuxを動かすという構成も > あるのかと思います。 はい, そのとおりです. > その場合、上記のMyrinet2000+PMの制限に引っかかってしまうと > 思うのですが、それはPMドライバの改変をしない限り対応できない > ものなのでしょうか。 SCore 5.2 では pmGetSendBuffer() などで割り当てるバッファは 32 bit に収まるようにしてありますので, PM の remote read/remote write を使用しなければ (mpi の場合, zerocopy モードでなければ), 現在でも大丈夫だと思います. SCore 5.0.1 でも HIGHMEM に割り当ててはいないので, 多分大丈夫だと 思います. remote read/remote write を使用する場合はこのようなことができませんので, kernel の PM ドライバおよび user library, myrinet のファームウエア を変更する必要があります. また, Myrinet カードも LANai 4 の card は 32 bit しかアクセスできないので, LANai 7 以降のものが必要になります. (すでにそんなに古いカードは売っていませんけど...) SCore 5.2 では IA64 に関してはそのような変更を行って, 4 GB 以上のアドレス にアクセスできるようになっているのですが, i386 についてはそのような変更を 行いませんでした. from Kameyama Toyohisa From munakata @ itg.hitachi.co.jp Wed Nov 20 20:19:41 2002 From: munakata @ itg.hitachi.co.jp (Munakata Yoshihisa) Date: Wed, 20 Nov 2002 20:19:41 +0900 Subject: [SCore-users-jp] zerocopy=on References: <20021119120333.EEB4F20045@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <00c301c29086$b85ac8d0$a1691fac@P77800200> 亀山様 宗像です。お世話になります。ご回答非常に有難う御座います。 ----- Original Message ----- > > SCore 5.2 では pmGetSendBuffer() などで割り当てるバッファは > 32 bit に収まるようにしてありますので, > PM の remote read/remote write を使用しなければ (mpi の場合, > zerocopy モードでなければ), 現在でも大丈夫だと思います. > SCore 5.0.1 でも HIGHMEM に割り当ててはいないので, 多分大丈夫だと > 思います. > > remote read/remote write を使用する場合はこのようなことができませんので, > kernel の PM ドライバおよび user library, myrinet のファームウエア > を変更する必要があります. > また, Myrinet カードも LANai 4 の card は 32 bit しかアクセスできないので, > LANai 7 以降のものが必要になります. > (すでにそんなに古いカードは売っていませんけど...) > > SCore 5.2 では IA64 に関してはそのような変更を行って, 4 GB 以上のアドレス > にアクセスできるようになっているのですが, i386 についてはそのような変更を > 行いませんでした. > 亀山様をSCore開発者のお一人とお見受けして、大変失礼かとも思い ましたが、教えていただければと思い、あえてお聞きします。 将来、IA-32でも物理メモリ4GB超+PM-ZeroCopy=ONがOKのような、 PMドライバ、ユーザライブラリの拡張の予定は、あるのでしょうか? (オープンソースなんだから、そんなに聞くなら自分でみてみろといわ れるような気はするのですが。) 以上 From k-hayashiatsogo-eng.co.jp Fri Nov 22 11:50:50 2002 From: k-hayashiatsogo-eng.co.jp (Keizo Hayashi) Date: Fri, 22 Nov 2002 11:50:50 +0900 Subject: [SCore-users-jp] 計算ホストの台数によって計算誤差が変わる? Message-ID: <000f01c291d2$00296df0$c500a8c0@0292hayashi> 林敬三@綜合技術コンサルタントと申します。 よろしくお願いします。 SCore5.2で並列計算を実行させたとき、計算ホストの台数に よって計算結果が変わることがあり、疑問に思いましたので 質問させていただきます。 具体的には、共立出版の「Linuxで並列処理をしよう」という 書籍で紹介されている、2次元ラプラス方程式を差分法で解く プログラムを実行したとき、 計算ホストが1台の場合、計算結果(計算回数)は 1324、 計算ホストが2台の時も同様に結果は 1324 となりますが、 計算ホストが3台の場合だと、結果が 1323 となります。 それから、三角関数やべき乗を多用した計算を繰り返す簡易な テストプログラムでも検証してみたところ、倍精度型の場合、 有効数字11〜12桁のレベルですが計算ホストの台数によって 計算結果がわずかに異なることがありました。 そこで質問というのは、 ・ 計算ホストの台数に起因する計算誤差はあるのだろうか ・ 台数が増えれば増えるほど、誤差も大きくなってしまうのだろうか というものです。 上記の内容によっては、大規模な計算を行ったとき、誤差が蓄積 されて、単一CPU+普通のプログラムの計算結果とSCoreクラスタ システム+並列化(mpi化された)プログラムの計算結果がかけ離 れてしまう可能性があるのではないか? という点が気になります。 原因として、ハードウェア、OS、コンパイラ、MPIライブラリ、プログラム の書き方、などいろいろありそうですが、どのような情報でも結構です ので、ぜひ教えていただきたく思います。 簡単ですが使用環境は以下の通りです。 サーバ専用ホスト1台+計算ホスト3台(全4台) 計算ホスト台数は、scrunコマンドでノード数を指定することにより 切り替えています。 ソフトウェアは、Redhat Linux7.3+SCore5.2の構成です。 では、以上よろしくお願いいたします。 ================================= (株)綜合技術コンサルタント IT管理室 林 敬三 k-hayashi at sogo-eng.co.jp ================================= From kameyama @ pccluster.org Fri Nov 22 13:27:23 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Fri, 22 Nov 2002 13:27:23 +0900 Subject: [SCore-users-jp] 計算ホストの台数によって計算誤差が変わる? In-Reply-To: Your message of "Fri, 22 Nov 2002 11:50:50 JST." <000f01c291d2$00296df0$c500a8c0@0292hayashi> Message-ID: <20021122042723.BAE402003E@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <000f01c291d2$00296df0$c500a8c0 @ 0292hayashi> "Keizo Hayashi" wrotes: > 具体的には、共立出版の「Linuxで並列処理をしよう」という > 書籍で紹介されている、2次元ラプラス方程式を差分法で解く > プログラムを実行したとき、 > 計算ホストが1台の場合、計算結果(計算回数)は 1324、 > 計算ホストが2台の時も同様に結果は 1324 となりますが、 > 計算ホストが3台の場合だと、結果が 1323 となります。 その本の 82 ページのプログラムの説明を読めば分かると思いますが, このプログラムは配列の大きさで割り切れるプロセス数で実行することを想定 しています. 配列の大きさが 1024 (2 の 10 乗) ですので, 2 のべき乗以外のプロセス数で 実行した場合, 配列の中で計算を行わない部分が出て来てしまうため, 計算結果がおかしくなると思います. ちなみに, size を 900 にしたら同じ計算回数になりました. > そこで質問というのは、 > ・ 計算ホストの台数に起因する計算誤差はあるのだろうか > ・ 台数が増えれば増えるほど、誤差も大きくなってしまうのだろうか > というものです。 結局, プログラム次第ということになると思いますが... from Kameyama Toyohisa From msato @ is.tsukuba.ac.jp Sat Nov 23 01:13:48 2002 From: msato @ is.tsukuba.ac.jp (Mitsuhisa Sato) Date: Sat, 23 Nov 2002 01:13:48 +0900 Subject: [SCore-users-jp] 計算ホストの台数によって計算誤差が変わる? In-Reply-To: <000f01c291d2$00296df0$c500a8c0@0292hayashi> Message-ID: <5.0.2.5.2.20021123010430.00b9c168@jones.hpcs.is.tsukuba.ac.jp> さとう@筑波大です。 後者のことはわかりかねねますが、ラプラス方程式はステップごとに 残差を計算して、それが適当な値になるまで繰り返すプログラムだと おもいます。その残差を計算するのにMPIReduceというMPIの関数を つかいますが、そのときに計算の順序が不定になるのは結構知られた 話で、計算の順序が違うと計算結果が若干違うためこのような結果になります。 解としては、自分でReductionのルーチンをかく(つまり、全部集めて、 きて、それを一定の順序で計算する)か、この程度のことは気にしない ということですね。 このReductionの順序については、結構MPIでも議論されましたが、 結局は、不定のままということになっているようですね。 さとう。 At 11:50 02/11/22 +0900, Keizo Hayashi wrote: >林敬三@綜合技術コンサルタントと申します。 >よろしくお願いします。 > >SCore5.2で並列計算を実行させたとき、計算ホストの台数に >よって計算結果が変わることがあり、疑問に思いましたので >質問させていただきます。 > >具体的には、共立出版の「Linuxで並列処理をしよう」という >書籍で紹介されている、2次元ラプラス方程式を差分法で解く >プログラムを実行したとき、 >計算ホストが1台の場合、計算結果(計算回数)は 1324、 >計算ホストが2台の時も同様に結果は 1324 となりますが、 >計算ホストが3台の場合だと、結果が 1323 となります。 > >それから、三角関数やべき乗を多用した計算を繰り返す簡易な >テストプログラムでも検証してみたところ、倍精度型の場合、 >有効数字11〜12桁のレベルですが計算ホストの台数によって >計算結果がわずかに異なることがありました。 > >そこで質問というのは、 >・ 計算ホストの台数に起因する計算誤差はあるのだろうか >・ 台数が増えれば増えるほど、誤差も大きくなってしまうのだろうか >というものです。 > >上記の内容によっては、大規模な計算を行ったとき、誤差が蓄積 >されて、単一CPU+普通のプログラムの計算結果とSCoreクラスタ >システム+並列化(mpi化された)プログラムの計算結果がかけ離 >れてしまう可能性があるのではないか? >という点が気になります。 > >原因として、ハードウェア、OS、コンパイラ、MPIライブラリ、プログラム >の書き方、などいろいろありそうですが、どのような情報でも結構です >ので、ぜひ教えていただきたく思います。 > >簡単ですが使用環境は以下の通りです。 >サーバ専用ホスト1台+計算ホスト3台(全4台) >計算ホスト台数は、scrunコマンドでノード数を指定することにより >切り替えています。 >ソフトウェアは、Redhat Linux7.3+SCore5.2の構成です。 > >では、以上よろしくお願いいたします。 >================================= >(株)綜合技術コンサルタント IT管理室 >林 敬三 k-hayashi at sogo-eng.co.jp >================================= >_______________________________________________ >SCore-users-jp mailing list >SCore-users-jp @ pccluster.org >http://www.pccluster.org/mailman/listinfo/score-users-jp From sgnmtkn @ ybb.ne.jp Sat Nov 23 10:56:28 2002 From: sgnmtkn @ ybb.ne.jp (Sugano, Mitsukuni) Date: Sat, 23 Nov 2002 10:56:28 +0900 Subject: [SCore-users-jp] PM ethernet/ethernet device already opened Message-ID: <3DDEE04C.A35DE2E4@ybb.ne.jp> 住商エレクトロニクスの菅野と申します。 お世話になります。 SCore5.0.1のクラスタシステムのうち計算ノードの1台が HD故障で交換したため、正常なノードからddでHD丸ごと システムをコピーし、IPアドレスとhostnameにかかわる 部分のみを手動で編集し、復旧させました。 ところが、そのシステムを含めてpm-etherの1対1テスト は、正常に動作するもののトータルテストに失敗します。 以下は、そのテストの結果ですが、丸ごと他のノードの システムをコピーした場合、何か他に変更すべきファイル があるのでしょうか? また、特別変更する必要のあるファイルがない場合、この 現象の原因がどこにあるか教えていただければ幸いです。 以上、よろしくお願いいたします。 −−−slave23がHD交換をしたシステムです−−− [root @ master sbin]# ./rpmtest slave23 ethernet -reply In another window; [root @ master sbin]# ./rpmtest slave01 ethernet -dest 22 -ping 8 9.44502e-05 [root @ master sbin]# ./rpmtest slave32 ethernet -dest 22 -ping 8 9.44093e-05 (ちなみに、HOST0=slave01,...,HOST22=slave23,...です。) [root @ master sbin]# cd /opt/score/deploy [root @ master deploy]# scout -g pcc SCOUT: Spawning done. SCOUT: session started. [root @ master deploy]# ./scstest -network ethernet SCSTEST: BURST on ethernet(chan=0,ctx=0,len=16) PM ethernet/ethernet device already opened. 上記エラーが表示されます。 そこで、slave23をscorehosts.defectsに追加 [root @ master etc]# more scorehosts.defects slave23.pccluster.org [root @ master init.d]# ./msgbserv stop [root @ master init.d]# ./scoreboard stop [root @ master init.d]# ./scoreboard start [root @ master init.d]# ./msgbserv start [root @ master deploy]# cd /opt/score/deploy [root @ master deploy]# scout -g pcc SCOUT: Spawning done. SCOUT: session started. [root @ master deploy]# ./scstest -network ethernet SCSTEST: BURST on ethernet(chan=0,ctx=0,len=16) 50 K packets. 100 K packets. 150 K packets. 200 K packets. 250 K packets. 300 K packets. 350 K packets. 400 K packets. slave23を除くと正常動作します。 −−− 以上、テスト結果です−−− From nrcb @ streamline-computing.com Sat Nov 23 22:28:15 2002 From: nrcb @ streamline-computing.com (Nick Birkett) Date: Sat, 23 Nov 2002 13:28:15 +0000 Subject: [SCore-users-jp] [SCore-users] mpich 1.2.4 Message-ID: <200211231328.gANDSFo04643@zeralda.streamline.com> Dear Score users, I see SCore 5.2 supports mpich 1.2.4 but the compiler interface has changed. Can anyone tell me if/how it is possible to add mpich 1.2.4 support to SCore 5.0.1 systems ? I know SCore is already enabled for multiple mpi support. Is there a patch we can apply to the 5.0.1 mpi source code ? We have a large customer base with 1000's of users currently running 5.0.1 so upgrade to 5.2 is not an option we will consider currently. Regards, Nick _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Mon Nov 25 09:36:04 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Mon, 25 Nov 2002 09:36:04 +0900 Subject: [SCore-users-jp] PM ethernet/ethernet device already opened In-Reply-To: Your message of "Sat, 23 Nov 2002 10:56:28 JST." <3DDEE04C.A35DE2E4@ybb.ne.jp> Message-ID: <20021125003605.09F0E20024@neal.il.is.s.u-tokyo.ac.jp> 亀山です. とりあえず, 基本的なチェックですが... In article <3DDEE04C.A35DE2E4 @ ybb.ne.jp> "Sugano, Mitsukuni" wrotes: > [root @ master sbin]# ./rpmtest slave23 ethernet -reply (中略) > [root @ master deploy]# scout -g pcc > SCOUT: Spawning done. > SCOUT: session started. > [root @ master deploy]# ./scstest -network ethernet > SCSTEST: BURST on ethernet(chan=0,ctx=0,len=16) > PM ethernet/ethernet device already opened. > > 上記エラーが表示されます。 rpmtest のテストのときに起動した -reply のプロセスは停止したでしょうか? from Kameyama Toyohisa From kameyama @ pccluster.org Mon Nov 25 10:13:41 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Mon, 25 Nov 2002 10:13:41 +0900 Subject: [SCore-users-jp] Re: [SCore-users] mpich 1.2.4 In-Reply-To: Your message of "Sat, 23 Nov 2002 13:28:15 JST." <200211231328.gANDSFo04643@zeralda.streamline.com> Message-ID: <20021125011341.CB4C720024@neal.il.is.s.u-tokyo.ac.jp> In article <200211231328.gANDSFo04643 @ zeralda.streamline.com> Nick Birkett wrotes: > Dear Score users, I see SCore 5.2 supports mpich 1.2.4 > but the compiler interface has changed. > > Can anyone tell me if/how it is possible to add mpich 1.2.4 > support to SCore 5.0.1 systems ? I know SCore is already > enabled for multiple mpi support. > Is there a patch we can apply to the 5.0.1 mpi source code ? Please copy score-src/runtime/mpich-1.2.4 from SCore 5.2. And please apply following patch to mpi_make.sh for mpich 1.2.4. (But I don't test this patch.) from Kameyama Toyohisa ---------------------------------------cut here--------------------------------- --- mpi_make.sh Fri Sep 20 12:11:32 2002 +++ mpi_make.5.0.sh Mon Nov 25 10:04:40 2002 @@ -80,12 +80,15 @@ else BUILDDIR=${NICKNAME}.${POST_NICKNAME} fi -BUILDDIR=${BUILDDIR}_${COMPILER} +if [ $COMPILER != "gnu" ]; then + BUILDDIR=${BUILDDIR}_${COMPILER} +fi + # # get spec # -SPEC=`$INSTALL_ROOT/bin/score_compiler_list -e mpi| grep "^${COMPILER}[ ]" | sed "s/^${COMPILER}[ ]*//"` +SPEC=`$INSTALL_ROOT/bin/score_compiler_list | grep "^${COMPILER}[ ]" | sed "s/^${COMPILER}[ ]*//"` # # get compiler path ---------------------------------------cut here--------------------------------- _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From sgnmtkn @ yahoo.co.jp Mon Nov 25 10:50:39 2002 From: sgnmtkn @ yahoo.co.jp (菅野 光邦) Date: Mon, 25 Nov 2002 10:50:39 +0900 (JST) Subject: [SCore-users-jp] PM ethernet/ethernet device already opened In-Reply-To: <20021125003605.09F0E20024@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <20021125015039.87175.qmail@web403.mail.yahoo.co.jp> 亀山様: 菅野です。 お世話になります。 > rpmtest のテストのときに起動した -reply > のプロセスは停止したでしょうか? 停止しました。 また、念のため、全計算ノードをshutdownし、 管理ノードをreboot後、全計算ノードを起動 してから、pm-etherの総合テストおよびmandel のdemoを実行しましたが、やはりslave23を含める と、このエラーがでてしまうのです。 そこで、前回のメールの内容の質問をさせていただ きました。 以上、宜しくお願い致します。 --- kameyama @ pccluster.org からのメッセージ: > 亀山です. > とりあえず, 基本的なチェックですが... > > In article <3DDEE04C.A35DE2E4 @ ybb.ne.jp> "Sugano, > Mitsukuni" wrotes: > > [root @ master sbin]# ./rpmtest slave23 ethernet > -reply > (中略) > > > [root @ master deploy]# scout -g pcc > > SCOUT: Spawning done. > > SCOUT: session started. > > [root @ master deploy]# ./scstest -network ethernet > > SCSTEST: BURST on ethernet(chan=0,ctx=0,len=16) > > PM ethernet/ethernet device already opened. > > > > 上記エラーが表示されます。 > > rpmtest のテストのときに起動した -reply > のプロセスは停止したでしょうか? > > from Kameyama Toyohisa __________________________________________________ Do You Yahoo!? Yahoo! BB is Broadband by Yahoo! http://bb.yahoo.co.jp/ From kameyama @ pccluster.org Mon Nov 25 11:01:00 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Mon, 25 Nov 2002 11:01:00 +0900 Subject: [SCore-users-jp] PM ethernet/ethernet device already opened In-Reply-To: Your message of "Mon, 25 Nov 2002 10:50:39 JST." <20021125015039.87175.qmail@web403.mail.yahoo.co.jp> Message-ID: <20021125020100.5305120024@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <20021125015039.87175.qmail @ web403.mail.yahoo.co.jp> 菅野 光邦 wrotes: > また、念のため、全計算ノードをshutdownし、 > 管理ノードをreboot後、全計算ノードを起動 > してから、pm-etherの総合テストおよびmandel > のdemoを実行しましたが、やはりslave23を含める > と、このエラーがでてしまうのです。 > そこで、前回のメールの内容の質問をさせていただ > きました。 環境変数 PM_DEBUG を 1 に設定して scstest を 実行してみてください. 多分もう少し情報が得られると思います. from Kameyama Toyohisa From sgnmtkn @ yahoo.co.jp Mon Nov 25 11:47:23 2002 From: sgnmtkn @ yahoo.co.jp (菅野 光邦) Date: Mon, 25 Nov 2002 11:47:23 +0900 (JST) Subject: [SCore-users-jp] PM ethernet/ethernet device already opened In-Reply-To: <20021125020100.5305120024@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <20021125024723.50054.qmail@web401.mail.yahoo.co.jp> 亀山様: 菅野です。 ご回答ありがとうございます。 手元にマシンがないため、すぐには試せないのですが、 以下のようにすればよろしいのでしょうか? $ cd /opt/score/deploy $ scout -g pcc SCOUT: Spawn done. SCOUT: session started $ export PM_DEBUG=1 $ ./scstest -network ethernet また、先日のメールで、 ・ddで交換したHDを正常な他の計算ノードから、  丸ごとコピーした際に、ipアドレスやhostname  を変更する以外にSCoreで変更する部分はないの  でしょうか?(HDだけの交換で、MACアドレス  等の変更はありません) という質問をさせていただきましたが、これに関し ては、特にSCoreで変更しなければならない、ノード 固有の情報は、計算ノードには無いと考えてよろしい でしょうか? 以上、宜しくお願い致します。 --- kameyama @ pccluster.org からのメッセージ: > 亀山です. > > In article > <20021125015039.87175.qmail @ web403.mail.yahoo.co.jp> > 菅野 光邦 wrotes: > > また、念のため、全計算ノードをshutdownし、 > > 管理ノードをreboot後、全計算ノードを起動 > > してから、pm-etherの総合テストおよびmandel > > のdemoを実行しましたが、やはりslave23を含める > > と、このエラーがでてしまうのです。 > > そこで、前回のメールの内容の質問をさせていただ > > きました。 > > 環境変数 PM_DEBUG を 1 に設定して scstest を > 実行してみてください. > 多分もう少し情報が得られると思います. > > from Kameyama Toyohisa > _______________________________________________ > SCore-users-jp mailing list > SCore-users-jp @ pccluster.org > http://www.pccluster.org/mailman/listinfo/score-users-jp __________________________________________________ Do You Yahoo!? Yahoo! BB is Broadband by Yahoo! http://bb.yahoo.co.jp/ From kameyama @ pccluster.org Mon Nov 25 12:02:46 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Mon, 25 Nov 2002 12:02:46 +0900 Subject: [SCore-users-jp] PM ethernet/ethernet device already opened In-Reply-To: Your message of "Mon, 25 Nov 2002 11:47:23 JST." <20021125024723.50054.qmail@web401.mail.yahoo.co.jp> Message-ID: <20021125030246.45C6A20024@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <20021125024723.50054.qmail @ web401.mail.yahoo.co.jp> 菅野 光邦 wrotes: > 以下のようにすればよろしいのでしょうか? > > $ cd /opt/score/deploy > $ scout -g pcc > SCOUT: Spawn done. > SCOUT: session started > $ export PM_DEBUG=1 > $ ./scstest -network ethernet はい, それで大丈夫だと思います. > また、先日のメールで、 > > ・ddで交換したHDを正常な他の計算ノードから、 >  丸ごとコピーした際に、ipアドレスやhostname >  を変更する以外にSCoreで変更する部分はないの >  でしょうか?(HDだけの交換で、MACアドレス >  等の変更はありません) > > という質問をさせていただきましたが、これに関し > ては、特にSCoreで変更しなければならない、ノード > 固有の情報は、計算ノードには無いと考えてよろしい > でしょうか? 多分, 大丈夫だと思います. 当然, disk は同じ種類でないと問題になる可能性がありますが... また, EIT を使用して compute host について変更していなければ, 再び EIT を使用するという手もあります. http://www.pccluster.org/score/dist/score/html/ja/installation/eit.html の 6. 設定終了後追加コンピュートホストの設定方法 を参照してください. この場合, 3. の新しい compute host の設定は不要です. その host の MAC address は覚えているので, 5. の画面にきおつけて install 画面まで行き, 該当 host に floppy をさせば install を 行ってくれます. install が終ったら Setup Server Host も省略して EIT を止めても 構いません. from Kameyama Toyohisa From s-sumi @ flab.fujitsu.co.jp Mon Nov 25 12:16:29 2002 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Mon, 25 Nov 2002 12:16:29 +0900 (JST) Subject: [SCore-users-jp] Re: [SCore-users] SCore History In-Reply-To: <3DD923B4.55D41F41@fh-wedel.de> References: <3DD923B4.55D41F41@fh-wedel.de> Message-ID: <20021125.121629.71114919.s-sumi@flab.fujitsu.co.jp> Hi. Sorry for late response. From: Nils Plohmann Subject: [SCore-users] SCore History Date: Mon, 18 Nov 2002 18:30:29 +0100 Message-ID: <3DD923B4.55D41F41 @ fh-wedel.de> ia4004> Hello, ia4004> ia4004> I want to ask you, whether you know, if there is a site in the internet ia4004> about the history of SCore Cluster. Do you any sites know? Or do you ia4004> know some important dates? Some distibution history is on the web. http://www.pccluster.org/score/dist/index_e.php Here are distributed date information. SCore 1.x was developed on NetBSD not Linux in 1996-1997?. I forgot dates. SCore 2.0 was distributed in 1998. SCore 3.0 was distributed at SC99. SCore 3.3 was distributed at SC2000. SCore 4.0 was distributed at ISC2001. SCore 4.2 was distributed at SC2001. SCore 5.0 was distributed in 2002 March, PC cluster consortium version. SCore 5.2 has been distributed in SC2002. Shinji. ia4004> I have to build a elaboration about installing and conf. a score cluster ia4004> in our University of Applied Sciences. ia4004> ia4004> Yours, ia4004> Nils Plohmann ia4004> ia4004> -- ia4004> Physikalisch-technische Lehranstalt Wedel ia4004> Technischer Assistent für Informatik ia4004> _______________________________________________ ia4004> SCore-users mailing list ia4004> SCore-users @ pccluster.org ia4004> http://www.pccluster.org/mailman/listinfo/score-users ia4004> ia4004> ------ Shinji Sumimoto, Fujitsu Labs _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From s-sumi @ flab.fujitsu.co.jp Mon Nov 25 12:32:36 2002 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Mon, 25 Nov 2002 12:32:36 +0900 (JST) Subject: [SCore-users-jp] zerocopy=on In-Reply-To: <00c301c29086$b85ac8d0$a1691fac@P77800200> References: <20021119120333.EEB4F20045@neal.il.is.s.u-tokyo.ac.jp> <00c301c29086$b85ac8d0$a1691fac@P77800200> Message-ID: <20021125.123236.104059175.s-sumi@flab.fujitsu.co.jp> 富士通研の住元です。 From: "Munakata Yoshihisa" Subject: Re: [SCore-users-jp] zerocopy=on Date: Wed, 20 Nov 2002 20:19:41 +0900 Message-ID: <00c301c29086$b85ac8d0$a1691fac @ P77800200> munakata> 亀山様 munakata> munakata> 宗像です。お世話になります。ご回答非常に有難う御座います。 munakata> munakata> ----- Original Message ----- munakata> > munakata> > SCore 5.2 では pmGetSendBuffer() などで割り当てるバッファは munakata> > 32 bit に収まるようにしてありますので, munakata> > PM の remote read/remote write を使用しなければ (mpi の場合, munakata> > zerocopy モードでなければ), 現在でも大丈夫だと思います. munakata> > SCore 5.0.1 でも HIGHMEM に割り当ててはいないので, 多分大丈夫だと munakata> > 思います. munakata> > munakata> > remote read/remote write を使用する場合はこのようなことができませんので, munakata> > kernel の PM ドライバおよび user library, myrinet のファームウエア munakata> > を変更する必要があります. munakata> > また, Myrinet カードも LANai 4 の card は 32 bit しかアクセスできないので, munakata> > LANai 7 以降のものが必要になります. munakata> > (すでにそんなに古いカードは売っていませんけど...) munakata> > munakata> > SCore 5.2 では IA64 に関してはそのような変更を行って, 4 GB 以上のアドレス munakata> > にアクセスできるようになっているのですが, i386 についてはそのような変更を munakata> > 行いませんでした. munakata> > munakata> munakata> 亀山様をSCore開発者のお一人とお見受けして、大変失礼かとも思い munakata> ましたが、教えていただければと思い、あえてお聞きします。 munakata> munakata> 将来、IA-32でも物理メモリ4GB超+PM-ZeroCopy=ONがOKのような、 munakata> PMドライバ、ユーザライブラリの拡張の予定は、あるのでしょうか? munakata> (オープンソースなんだから、そんなに聞くなら自分でみてみろといわ munakata> れるような気はするのですが。) IA-32については、もともとのアーキテクチャの制約から、4GBを超えるメモリ をネットワークインターフェイスからアクセスできるかの規定がありませんの で、できるかどうかはハードウェアの実装に依存します。(実際、チップセッ トの仕様書を見るとできるものとできないものがあるのがわかっています。) いずれにしろ4GBを超える物理メモリ上でのZero-copy通信についてはサポート する予定です。ただ、通信性能的に有利になるのは、Myrinet 2XPより高速な ネットワークになるでしょう。 ------ Shinji Sumimoto, Fujitsu Labs From hidaka @ sse.co.jp Mon Nov 25 13:59:28 2002 From: hidaka @ sse.co.jp ([SSE] - HIDAKA) Date: Mon, 25 Nov 2002 13:59:28 +0900 Subject: [SCore-users-jp] SCore PBS Message-ID: <3DE1AE30.2030002@sse.co.jp> From kameyama @ pccluster.org Mon Nov 25 14:53:49 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Mon, 25 Nov 2002 14:53:49 +0900 Subject: [SCore-users-jp] Re: [SCore-users] SCore History In-Reply-To: Your message of "Mon, 25 Nov 2002 12:16:29 JST." <20021125.121629.71114919.s-sumi@flab.fujitsu.co.jp> Message-ID: <20021125055349.6C8FB20024@neal.il.is.s.u-tokyo.ac.jp> In article <20021125.121629.71114919.s-sumi @ flab.fujitsu.co.jp> Shinji Sumimoto wrotes: > ia4004> > ia4004> I want to ask you, whether you know, if there is a site in the intern > et > ia4004> about the history of SCore Cluster. Do you any sites know? Or do you > ia4004> know some important dates? > > Some distibution history is on the web. > > http://www.pccluster.org/score/dist/index_e.php > > Here are distributed date information. > SCore 1.x was developed on NetBSD not Linux in 1996-1997?. > I forgot dates. SCore 1.0 was developed on NetBSD and Sun os 4.x. It was distributed at Jan. 16, 1998. > SCore 2.0 was distributed in 1998. SCore 2.0 was not released. SCore 2.1 was distributed at May 22, 1998. > SCore 3.0 was distributed at SC99. SCore 3.0 was not released at SC99. (These is still beta.) SCore 3.0 was released at March 10, 2000. Here are SCore release dates. PM 1.0 1997/06/12 SCore 1.0 1998/01/16 SCore 2.0 not released SCore 2.1 1998/05/22 SCore 2.2 1998/06/17 SCore 2.3 1998/07/07 SCore 2.4 1998/11/07 SCore 2.4.1 1999/06/08 SCore 2.4.2 1999/08/25 SCore 3.0 2000/3/10 SCore 3.1 2000/6/12 SCore 3.2 2000/10/3 SCore 3.3 2000/11/6 SCore 3.3.1 2000/11/30 SCore 3.3.2 2001/04/5 SCore 4.0 2001/06/20 SCore 4.0.1 2991/07/06 SCore 4.1 2001/09/18 SCore 4.2 2001/10/17 SCore 4.2.1 2001/11/13 SCore 5.0.0 2002/03/19 SCore 5.0.1 2002/04/23 SCore 5.2.0 2002/10/31 from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From k-hayashiatsogo-eng.co.jp Mon Nov 25 15:30:58 2002 From: k-hayashiatsogo-eng.co.jp (Keizo Hayashi) Date: Mon, 25 Nov 2002 15:30:58 +0900 Subject: [SCore-users-jp] Re: 計算ホストの台数によって計算誤差が変わる? References: <000f01c291d2$00296df0$c500a8c0@0292hayashi> Message-ID: <006c01c2944c$3ab85720$c500a8c0@0292hayashi> 林敬三@綜合技術コンサルタントです。 返信遅れまして申し訳ありません。 亀山様、さとう様、解答ありがとうございます。 亀山様よりのアドバイス: > > その本の 82 ページのプログラムの説明を読めば分かると思いますが, > このプログラムは配列の大きさで割り切れるプロセス数で実行することを想定 > しています. > > 配列の大きさが 1024 (2 の 10 乗) ですので, 2 のべき乗以外のプロセス数で > 実行した場合, 配列の中で計算を行わない部分が出て来てしまうため, > 計算結果がおかしくなると思います. > > ちなみに, size を 900 にしたら同じ計算回数になりました. > 確かにその通りでした。これは私の確認不足でした。 よく確認せずに質問してしまって申し訳ありませんでした。 誤差が出るかどうかはプログラム次第、という点、納得しました。 さとう様よりのアドバイス: > > 後者のことはわかりかねねますが、ラプラス方程式はステップごとに > 残差を計算して、それが適当な値になるまで繰り返すプログラムだと > おもいます。その残差を計算するのにMPIReduceというMPIの関数を > つかいますが、そのときに計算の順序が不定になるのは結構知られた > 話で、計算の順序が違うと計算結果が若干違うためこのような結果になります。 > > 解としては、自分でReductionのルーチンをかく(つまり、全部集めて、 > きて、それを一定の順序で計算する)か、この程度のことは気にしない > ということですね。 > あっ、なるほど! 確かに今までいろいろとプログラム試行してみて、計算順序がてんで ばらばらになるのは知っていましたが、実際に誤差として現れるん ですね、言われてみれば確かにその通りです。 なぜもっと早く気づかなかったのでしょう! 誤差としては小さく、当社の計算環境では問題ないレベルのため、 この誤差は気にしないこにとしますが、これからはプログラムの書き方も 少し注意するようにします。 それから現在、自動的に並列化してくれるコンパイラ(インテル製品など) にも注目しているのですが、これは誤差への対処はどのようにしている のでしょうか? (すみません、これはまだこちらもよく調べずに質問を投げているため、 回答いただかなくてもけっこうですが、ご存じの方がおられましたら 教えてくださると助かります) おかげさまで並列計算における誤差についてよくわかりました。 どうもありがとうございました。 ================================= (株)綜合技術コンサルタント IT管理室 林 敬三 k-hayashi at sogo-eng.co.jp ================================= From hidaka @ sse.co.jp Mon Nov 25 16:35:47 2002 From: hidaka @ sse.co.jp ([SSE] - HIDAKA) Date: Mon, 25 Nov 2002 16:35:47 +0900 Subject: [SCore-users-jp] SCore PBS Message-ID: <3DE1D2D3.5090301@sse.co.jp> 住商エレクトロニクス 日高と申します。 SCore PBS について質問があります。 障害のあるマシンを etc/scorehosts.defects に登録したばあい、 SCore PBS の server_priv/nodes には自動的に反映されないものでしょうか? やはり、 /opt/score/sbin/scbd2pbs pcc > /var/scored/pbs/server_priv/nodes を行う必要があるでしょうか? また、 server_priv/nodes ファイルの直接の編集は避けた方が良いのでしょうか? PBSによる計算ノードの認識は、qmgrを通して行うのが良いのでしょうか? SCOUT環境下にて正常に計算ノードとして認識しているノードに対して、PBSからの ジョブ投入が行えない場合は、PBSのデータベースに問題があると考えて宜しい でしょうか? ご回答頂けると幸いです。 宜しくお願い申し上げます。 以上 From kameyama @ pccluster.org Mon Nov 25 16:57:12 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Mon, 25 Nov 2002 16:57:12 +0900 Subject: [SCore-users-jp] SCore PBS In-Reply-To: Your message of "Mon, 25 Nov 2002 16:35:47 JST." <3DE1D2D3.5090301@sse.co.jp> Message-ID: <20021125075712.E4C3820040@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <3DE1D2D3.5090301 @ sse.co.jp> "[SSE] - HIDAKA" wrotes: > 障害のあるマシンを etc/scorehosts.defects に登録したばあい、 > SCore PBS の server_priv/nodes には自動的に反映されないものでしょうか? 反映されません. > やはり、 > /opt/score/sbin/scbd2pbs pcc > /var/scored/pbs/server_priv/nodes > を行う必要があるでしょうか? 長期的に停止する場合はそのほうが良いかも知れません. PBS は pbs_mon の反応があるかどうかでその host が生きているかどうか 決めていますので, 短期的には 該当 host の pbs_mom を down しておけば, その host は使用 しないと思います. > また、 server_priv/nodes ファイルの直接の編集は避けた方が良いのでしょうか? > PBSによる計算ノードの認識は、qmgrを通して行うのが良いのでしょうか? フォーマットを理解しているのでしたら問題無いと思います. > SCOUT環境下にて正常に計算ノードとして認識しているノードに対して、PBSからの > ジョブ投入が行えない場合は、PBSのデータベースに問題があると考えて宜しい > でしょうか? pbs_mom が起動していないなども考えられますので, 原因究明のために server_logs, sched_logs, mom_logs のしたの logfile を 見てみたほうが良いと思います. from Kameyama Toyohisa From mitsuru.ikei @ intel.com Mon Nov 25 17:20:02 2002 From: mitsuru.ikei @ intel.com (Ikei, Mitsuru) Date: Mon, 25 Nov 2002 00:20:02 -0800 Subject: [SCore-users-jp] Re: 計算ホストの台数によって計算誤差が変わる? Message-ID: <21ADC6D1B7A3D411B4DF00A0C96B5401027D7B5E@jpsmsx32.jp.intel.com> 林 様 インテルのコンパイラ(IA-32)の並列化には大きく分けて次2つがあります。 (1)ベクトル化 (2)自動並列化 (1)はプログラム中のループが適当な条件を満足すれば、ループ中の演算をSIMD命 令を用いて書き直してくれるもので、インテルでは(ベクトル計算機との類似性か ら)ベクトル化と呼んでいます。Pentium 4等で利用することが可能です。この場合 の演算誤差は、80ビットの拡張倍精度形式で演算される従来のx87命令と、倍精度な らば64ビットで演算されるSSE系命令との差異が発生します。 林様がご興味あるのは(2)の自動並列化だと思われますが、これはOpenMPのディレ クティブを自動生成するものです。従って、リダクション等の演算順序はユーザ OpenMPで指定したスレッドのスケジュール方法に依存します。 ここまではすべて、メモリ空間が1つの場合のお話です。インテルのコンパイラでは これ以上の処理は行いません。従って、さらに他の何らかの方法でMPI命令を生成さ れるような場合はすべて採用された方法の処理系に依存します。 - 池井 インテル(株) -----Original Message----- From: Keizo Hayashi [mailto:k-hayashi at sogo-eng.co.jp] Sent: Monday, November 25, 2002 3:31 PM To: score-users-jp @ pccluster.org Cc: ? ?? Subject: [SCore-users-jp] Re: 計算ホストの台数によって計算誤差が変わる? ... deleted. それから現在、自動的に並列化してくれるコンパイラ(インテル製品など) にも注目しているのですが、これは誤差への対処はどのようにしている のでしょうか? (すみません、これはまだこちらもよく調べずに質問を投げているため、 回答いただかなくてもけっこうですが、ご存じの方がおられましたら 教えてくださると助かります) おかげさまで並列計算における誤差についてよくわかりました。 どうもありがとうございました。 ================================= (株)綜合技術コンサルタント IT管理室 林 敬三 k-hayashi at sogo-eng.co.jp ================================= _______________________________________________ SCore-users-jp mailing list SCore-users-jp @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users-jp From fujimori @ ns.fujimori.cache.waseda.ac.jp Mon Nov 25 21:29:02 2002 From: fujimori @ ns.fujimori.cache.waseda.ac.jp (Yoriaki FUJIMORI) Date: Mon, 25 Nov 2002 21:29:02 +0900 Subject: [SCore-users-jp] some questions on SCore Message-ID: <200211251228.gAPCSjS24422@pccluster.org> 藤森@早稲田大学といいます. 書籍版の Score5.0.1 とかを入手して,install してみましたが,幾つか 疑問点が出て来たので,質問させて下さい. (1) SuSE8.1 を入れてある機械に install したが,nfsd が動いている事を /opt/score/bin/eit が認識しないのか,nfs のserver を入れろと云うエラーが出 ます. # 因みに該当の機械では nfsd が動いていて,/opt/ 以下を FreeBSD の機械に 現実に export している.RedHat 7.x は手元に無いので.... (2) 書籍添付の 5.0.0 の source を FreeBSD 4.7R 上で compile したが, compile 以前の configure 段階でうまく動いていないらしい.compiler の 所在その他を見付けられないようです.porting 用の説明は何処かに無いで しょうか. (3) install 自体に X が必要なようですが,text 画面(console)ベースで server に install/動作 check できると良いと思います. # 私の所では X は端末側でしか動かさないので,ロクな vga カードは server に挿していないもので. (4) server ホスト 1 台で,正常に install できたか否か判定する 方法はあるでしょうか. (5) 最新版を 600MB 程,先程 download しましたが,生憎 CD/RW は 手元に無いので,... *.tar.gz の形式のものは何処かにありませんか. 後教示頂けると幸いです. 藤森 頼明 From nils @ plomi-online.de Mon Nov 25 23:56:36 2002 From: nils @ plomi-online.de (Nils) Date: Mon, 25 Nov 2002 15:56:36 +0100 Subject: [SCore-users-jp] Re: [SCore-users] SCore History References: <20021125055349.6C8FB20024@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <002f01c29492$e5c8e6c0$c89227d5@harry> > In article <20021125.121629.71114919.s-sumi @ flab.fujitsu.co.jp> Shinji Sumimoto wrotes: > > ia4004> > > ia4004> I want to ask you, whether you know, if there is a site in the intern > > et > > ia4004> about the history of SCore Cluster. Do you any sites know? Or do you > > ia4004> know some important dates? > > > > Some distibution history is on the web. > > > > http://www.pccluster.org/score/dist/index_e.php > > > > Here are distributed date information. > > > SCore 1.x was developed on NetBSD not Linux in 1996-1997?. > > I forgot dates. > > SCore 1.0 was developed on NetBSD and Sun os 4.x. > It was distributed at Jan. 16, 1998. > > > SCore 2.0 was distributed in 1998. > > SCore 2.0 was not released. > SCore 2.1 was distributed at May 22, 1998. > > > SCore 3.0 was distributed at SC99. > > SCore 3.0 was not released at SC99. > (These is still beta.) > SCore 3.0 was released at March 10, 2000. > > Here are SCore release dates. > [...] > > from Kameyama Toyohisa Thank you for this many information! Yours, Nils _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From emile.carcamo @ nec.fr Tue Nov 26 02:22:24 2002 From: emile.carcamo @ nec.fr (Emile CARCAMO) Date: Mon, 25 Nov 2002 18:22:24 +0100 Subject: [SCore-users-jp] [SCore-users] help with gm-1.6.3 port to Score 5.2.0 Message-ID: <200211251722.gAPHMOi06045@emilepc.ess.nec.fr> Dear All, I'm desperately fighting with this issue :-(( Please can someone indicate WHERE to find a 2.4.18-3SCORE (SMP and UP) kernel source that fits my needs. I'm not "interested" in applying so many patches as I've seen on the M.L few weeks ago. Can we get a "ready to plug" /usr/src directory tree for version 5.2.0 ??? Many thanks, and best regards. -- Emile_CARCAMO NEC European http://www.ess.nec.de System Engineer Supercomputer mailto:emile.carcamo @ nec.fr Systems France GSM mailto:emile.carcamo @ orange.fr (+33)1-3930-6601 FAX (+33)1-3930-6613 PHONE / Your mouse has moved. Windows NT must be restarted \ (+33)6-8063-7003 GSM \ for the change to take effect. Reboot now? [ OK ] / _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From nakata @ bestsystems.co.jp Tue Nov 26 07:14:47 2002 From: nakata @ bestsystems.co.jp (Hisaho Nakata) Date: Tue, 26 Nov 2002 07:14:47 +0900 Subject: [SCore-users-jp] some questions on SCore In-Reply-To: <200211251228.gAPCSjS24422@pccluster.org> References: <200211251228.gAPCSjS24422@pccluster.org> Message-ID: <20021126071447.1569c7ff.nakata@bestsystems.co.jp> 早稲田大学 藤森様 中田@ベストシステムズです。 > (1) SuSE8.1 を入れてある機械に install したが,nfsd が動いている事を > /opt/score/bin/eit が認識しないのか,nfs のserver を入れろと云うエラーが出 > ます. > # 因みに該当の機械では nfsd が動いていて,/opt/ 以下を FreeBSD の機械に > 現実に export している.RedHat 7.x は手元に無いので.... SuSE自体一応サポートはされているみたいですが、あまりテストされていませんので、 RedHatで行うのが一番無難です。 > (2) 書籍添付の 5.0.0 の source を FreeBSD 4.7R 上で compile したが, > compile 以前の configure 段階でうまく動いていないらしい.compiler の > 所在その他を見付けられないようです.porting 用の説明は何処かに無いで > しょうか. SCore自体、PMv2という独自のプロトコルを用いて通信を行っているため、 Linuxでもカーネルにパッチを当てる必要があります。無論FreeBSDでも これらのドライバを移植すれば、動く可能性はありますが....。 (初期のSCoreはNetBSDで動いていたし) > (3) install 自体に X が必要なようですが,text 画面(console)ベースで > server に install/動作 check できると良いと思います. > # 私の所では X は端末側でしか動かさないので,ロクな vga カードは > server に挿していないもので. RPMファイルのバイナリインストールで行えます。 # cd /opt/score/score.rpms # ./bininstall -server|-compute 具体的には、http://www.pccluster.org/のドキュメントを御覧ください。 > (5) 最新版を 600MB 程,先程 download しましたが,生憎 CD/RW は > 手元に無いので,... *.tar.gz の形式のものは何処かにありませんか. Linuxであれば、loopbackデバイスを用いてisoイメージをマウントすることが できます。具体的には # mount -o loop SCore-5.2.iso /mnt/cdrom といった風にです。 ======================================================================== 株式会社 ベストシステムズ システムソリューション事業部テクニカルサポート 中田 寿穗 (nakata @ bestsystems.co.jp) 〒110-0016 東京都台東区台東2-18-8 台東K-1ビル 2,3F Tel: 03-5812-1350 Fax: 03-5812-1351 ======================================================================== From kameyama @ pccluster.org Tue Nov 26 08:37:02 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Tue, 26 Nov 2002 08:37:02 +0900 Subject: [SCore-users-jp] Re: [SCore-users] help with gm-1.6.3 port to Score 5.2.0 In-Reply-To: Your message of "Mon, 25 Nov 2002 18:22:24 JST." <200211251722.gAPHMOi06045@emilepc.ess.nec.fr> Message-ID: <20021125233703.0DED320040@neal.il.is.s.u-tokyo.ac.jp> In article <200211251722.gAPHMOi06045 @ emilepc.ess.nec.fr> Emile CARCAMO wrotes: > I'm desperately fighting with this issue :-(( Please can > someone indicate WHERE to find a 2.4.18-3SCORE (SMP and > UP) kernel source that fits my needs. I'm not "interested" > in applying so many patches as I've seen on the M.L few > weeks ago. Can we get a "ready to plug" /usr/src directory > tree for version 5.2.0 ??? Many thanks, and best regards. > kernel source code is not installed automtically on SCore 5.2. Please install score.rpm/kernel-source-score-2.4.18-3SCORE.i386.rpm in SCore 5.2 CD-ROM image, and please look at /usr/src/linux-2.4.18score and please apply following patch: http://www.pccluster.org/score/dist/pub/score-5.2.0/rpm.redhat7.3.i386/kernel-source-score.efi.patch from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Tue Nov 26 09:17:37 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Tue, 26 Nov 2002 09:17:37 +0900 Subject: [SCore-users-jp] some questions on SCore In-Reply-To: Your message of "Tue, 26 Nov 2002 07:14:47 JST." <20021126071447.1569c7ff.nakata@bestsystems.co.jp> Message-ID: <20021126001737.52D9920040@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <20021126071447.1569c7ff.nakata @ bestsystems.co.jp> Hisaho Nakata wrotes: > > (1) SuSE8.1 を入れてある機械に install したが,nfsd が動いている事を > > /opt/score/bin/eit が認識しないのか,nfs のserver を入れろと云うエラーが出 > > ます. > > # 因みに該当の機械では nfsd が動いていて,/opt/ 以下を FreeBSD の機械に > > 現実に export している.RedHat 7.x は手元に無いので.... > > SuSE自体一応サポートはされているみたいですが、あまりテストされていませんので SuSE は SCore 4.0.1 で SuSE 7.1 をサポートしたのが最後です. 現在はサポートしていません. また, EIT は SuSE をサポートしていません. > > (2) 書籍添付の 5.0.0 の source を FreeBSD 4.7R 上で compile したが, > > compile 以前の configure 段階でうまく動いていないらしい.compiler の > > 所在その他を見付けられないようです.porting 用の説明は何処かに無いで > > しょうか. > > SCore自体、PMv2という独自のプロトコルを用いて通信を行っているため、 > Linuxでもカーネルにパッチを当てる必要があります。無論FreeBSDでも > これらのドライバを移植すれば、動く可能性はありますが....。 > (初期のSCoreはNetBSDで動いていたし) NetBSD で動いていたのは SCore 2.x までです. SCore 3.0 で特に PM 周りが大幅に変更になっています. (SCore 2.x までは PM は複数のデバイスをサポートしておらず, NetBSD でサポートしていたのは Myrinet だけだったと思います.) あと, checkpoint の関係で system call を wrap していたりしていますので, linux 以外に porting するのは結構大変かも知れません. 残念ながら porting の document は作成していません. user land に関しては以下のような手順になると思います. 1. Score-src/SCore のしたで % ./build/deploy/config.nickname を実行して適切な値になっているか確認する. 以下 bintype とします. この値が SCore の binary type になります. 2. SCore/build/config/bintype を作成する. i386-redhat7-linux2_4 あたりを参考にしてコマンドなどを登録します. 3. 最初は SCore/build/config/score をいじって checkpoint を使用しない 設定にしておいたほうが良いかも知れません. 4. とりあえず, configure/make してみてエラーがあったら直す. > > (4) server ホスト 1 台で,正常に install できたか否か判定する > > 方法はあるでしょうか. # ソフトウエアの性格上, 1 台に install できたとしても, それが # "正常" かと考えると... server と compute host を兼用して install したとすると... install document の SCOUT Test Procedure はテストできると思います. その host の CPU が複数あれば PM テスト手順の shmem はテストできます. 多分, score のテストは CPU が一つでも nodes=1 を指定したものは 動くと思います. CPU が複数あるのでしたら, デモプログラムは動くと思います. > > (5) 最新版を 600MB 程,先程 download しましたが,生憎 CD/RW は > > 手元に無いので,... *.tar.gz の形式のものは何処かにありませんか. > > Linuxであれば、loopbackデバイスを用いてisoイメージをマウントすることが > できます。具体的には > # mount -o loop SCore-5.2.iso /mnt/cdrom > といった風にです。 source, SCore 関係の rpm だけでしたら個別に download できます. download ページの 2. To obtain the SCore i386 binary rpm for redhat 7.2 or redhat 7.3, please click here. 3. To obtain the SCore source, please click here. を参照してください. from Kameyama Toyohisa From k-hayashiatsogo-eng.co.jp Tue Nov 26 11:10:18 2002 From: k-hayashiatsogo-eng.co.jp (Keizo Hayashi) Date: Tue, 26 Nov 2002 11:10:18 +0900 Subject: [SCore-users-jp] Re: インテル製コンパイラについて References: <21ADC6D1B7A3D411B4DF00A0C96B5401027D7B5E@jpsmsx32.jp.intel.com> Message-ID: <001f01c294f0$fa7c0990$c500a8c0@0292hayashi> 池井様 綜合技術コンサルタント 林です。 コンパイラについての説明ありがとうございます。 インテル製のコンパイラにおける計算結果の差異は、64ビットと80ビットの 差、ということですね。ありがとうございます。 これなら、誤差は許容範囲内となりますので、計算結果はそれほど神経質 にならなくても良さそうです。 自動並列化はやはり、自分でそれなりに意識してプログラミングした方が 良さそうですね。 これについてはこちらでもう少し調べてみようと思います。 ただ、少し気になったのが、 > > ここまではすべて、メモリ空間が1つの場合のお話です。インテルのコンパイラでは > これ以上の処理は行いません。従って、さらに他の何らかの方法でMPI命令を生成さ > れるような場合はすべて採用された方法の処理系に依存します。 > という記述ですが、メモリ空間が1つ、というのは、マルチプロセッサ システムなどのことでしょうか。 SCoreは分散メモリ型PCクラスタシステムということなので、ふつうの パソコン、すなわち単一CPUのマシンで構成したSCoreシステムは、 並列化するように記述されていないソースプログラムは、インテル製 コンパイラの並列化効果を得ることができないのではないか?と 思いました。 メモリ空間の考え方について、思いっきりはずしているかもしれませんが、 この部分を疑問に思いましたので書かせていただきました。 もし良ければ教えてください。 ================================= (株)綜合技術コンサルタント IT管理室 林 敬三 k-hayashi at sogo-eng.co.jp ================================= From fujimori @ ns.fujimori.cache.waseda.ac.jp Tue Nov 26 17:46:54 2002 From: fujimori @ ns.fujimori.cache.waseda.ac.jp (Yoriaki FUJIMORI) Date: Tue, 26 Nov 2002 17:46:54 +0900 Subject: [SCore-users-jp] Re: some questions on SCore Message-ID: <200211260846.gAQ8kbS30226@pccluster.org> 中田さん,亀山さん reply を頂き有難う御座いました. score は RedHat local な色彩が強い事が判りました. 時間を見て,source を compile してみようと思います. # 私も以前は linux を使用していましたが,nfs の遅さと virtual memory の不具合に愛想をつかし,最近は主要な 機械類は全部 FreeBSD になりました.1 台だけ,/opt/intel を展開するため,linux を動かしています.linux binary は FreeBSD 上の emulator で動かす事になってます. 藤森 頼明 From emile.carcamo @ nec.fr Wed Nov 27 03:29:56 2002 From: emile.carcamo @ nec.fr (Emile CARCAMO) Date: Tue, 26 Nov 2002 19:29:56 +0100 Subject: [SCore-users-jp] Re: [SCore-users] help with gm-1.6.3 port to Score 5.2.0 In-Reply-To: Your message of "Tue, 26 Nov 2002 07:27:33 GMT." <200211260727.gAQ7RYt02463@zeralda.streamline.com> Message-ID: <200211261829.gAQITuk04294@emilepc.ess.nec.fr> nrcb @ streamline-computing.com said: > Bonjour Emile. > I have patched the kernel source using Kameyama's patches and it seems > fine (2.4.18-3SCORE). > > You can download it from: > > ftp://ftp.u-net.net/local/kernel-source-2.4.18-3SCORE_xeon.tgz > > (anonymous ftp). > Hi Nick, Thanks for your proposal, I got the RPM installed from the CDROM and then once doing : cd /usr/src/linux-2.4.18score cat kernel-source-score.efi.patch | patch -p0 The kernel source tree is ready to go ;-) But then if I try to "./configure && make" under the gm-1.6.3 directo- ry (this stuff is for Myrinet-2k network driver) I get an error, too bad !!! BTW, I've seen in EIT that Myrinet-2k can be selected as an additional network but what does it install exactly ? What is the impact for my nodes, reinstall all of them from floppy ? How to check that Myrinet boards are avai- lable via ifconfig or whatever other command ? I would be glad to get any hints from any ML subscribers ( and readers ;-) TIA, and best regards. -- Emile_CARCAMO NEC European http://www.ess.nec.de System Engineer Supercomputer mailto:emile.carcamo @ nec.fr Systems France GSM mailto:emile.carcamo @ orange.fr (+33)1-3930-6601 FAX (+33)1-3930-6613 PHONE / Your mouse has moved. Windows NT must be restarted \ (+33)6-8063-7003 GSM \ for the change to take effect. Reboot now? [ OK ] / _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From emile.carcamo @ nec.fr Wed Nov 27 03:55:37 2002 From: emile.carcamo @ nec.fr (Emile CARCAMO) Date: Tue, 26 Nov 2002 19:55:37 +0100 Subject: [SCore-users-jp] Re: [SCore-users] help with gm-1.6.3 port to Score 5.2.0 In-Reply-To: Your message of "Tue, 26 Nov 2002 19:29:56 +0100." <200211261829.gAQITuk04294@emilepc.ess.nec.fr> Message-ID: <200211261855.gAQItbk04798@emilepc.ess.nec.fr> emile.carcamo @ nec.fr said: > BTW, I've seen in EIT that Myrinet-2k can be selected as > an additional network but what does it install exactly ? > What is the impact for my nodes, reinstall all of them > from floppy ? How to check that Myrinet boards are avai- > lable via ifconfig or whatever other command ? Hello again, By testing again my 100BT/myrinet2k network config here is what I get from a scout session : [ecarcamo @ sparepc run1]$ mpirun -np 14 ./laplace.exe <1> SCore-D:WARNING PM myrinet2k/myrinet2k Link down <1> SCore-D:ERROR No PM device opened. Then my shell session hangs, looks like I'll need to redeploy all the nodes, right ?? TIA, and best regards. -- Emile_CARCAMO NEC European http://www.ess.nec.de System Engineer Supercomputer mailto:emile.carcamo @ nec.fr Systems France GSM mailto:emile.carcamo @ orange.fr (+33)1-3930-6601 FAX (+33)1-3930-6613 PHONE / Your mouse has moved. Windows NT must be restarted \ (+33)6-8063-7003 GSM \ for the change to take effect. Reboot now? [ OK ] / _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From bogdan.costescu @ iwr.uni-heidelberg.de Wed Nov 27 04:19:23 2002 From: bogdan.costescu @ iwr.uni-heidelberg.de (Bogdan Costescu) Date: Tue, 26 Nov 2002 20:19:23 +0100 (CET) Subject: [SCore-users-jp] Re: [SCore-users] help with gm-1.6.3 port to Score 5.2.0 In-Reply-To: <200211261829.gAQITuk04294@emilepc.ess.nec.fr> Message-ID: On Tue, 26 Nov 2002, Emile CARCAMO wrote: > But then if I > try to "./configure && make" under the gm-1.6.3 directo- > ry (this stuff is for Myrinet-2k network driver) I get > an error, too bad !!! Well, I first thought that there was an error in your message title. What exactly are you trying to achieve by putting GM and PM together ? For what I know, only one of them can have control over the Myrinet card, meaning that if you have GM running, the whole SCore environment (which depends on PM) is gone; this would only be useful probably if you want to compare the two... > BTW, I've seen in EIT that Myrinet-2k can be selected as > an additional network but what does it install exactly ? You mean: modules vs. in-kernel drivers ? > How to check that Myrinet boards are avai- > lable via ifconfig or whatever other command ? First of all, a device present in the system is identified through its PCI id, so 'lspci' should help; the PCI utilities depend on a database for literal (= human friendly) identification of the device; if the device was not yet entered into the database, you get some "unknown device" along with the PCI id. Each manufacturer has its own Manufacturer id(s) and theoretically each device (even different versions of the same device) should have a different Product id. The identification based on PCI ids does not depend on any software (like a driver) being present; as soon as the device is out of sleep (as in low power mode) it should be visible on the PCI bus. In order for other (higher level) software to be able to identify a device, maybe along with some functional parameters, a driver should be running. The driver first checks that the device is on its own "supported" list, then sometimes asks the hardware for other parameters then finaly initializes the hardware. This part is of course device-specific and after the initialization is finished, other software using some API can query the driver for information. Another possibility (not used in SCore) is for the program to directly access the hardware which is first mapped into user-space by the driver. So, to come back to your question: you can find if the card is physically installed using 'lspci', but this won't tell you f.e. if the cable is connected - this info can only be obtained from a driver. 'ifconfig' and all other "normal" networking programs should be first taught about the API of the Myrinet driver; or the Myrinet driver should be made conform to the Linux network driver API. > I would be glad to get any hints from any ML subscribers > ( and readers ;-) TIA, and best regards. OK, you got it :-) -- Bogdan Costescu IWR - Interdisziplinaeres Zentrum fuer Wissenschaftliches Rechnen Universitaet Heidelberg, INF 368, D-69120 Heidelberg, GERMANY Telephone: +49 6221 54 8869, Telefax: +49 6221 54 8868 E-mail: Bogdan.Costescu @ IWR.Uni-Heidelberg.De _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From pi_gleich_drei @ web.de Wed Nov 27 06:07:36 2002 From: pi_gleich_drei @ web.de (Christian Winkler) Date: Tue, 26 Nov 2002 22:07:36 +0100 Subject: [SCore-users-jp] [SCore-users] Fluent 6.0.20 on SCore Message-ID: <5.1.1.6.2.20021126220249.00ac9540@pop3.web.de> Hi out there, dear SCore users, after we now have a working score cluster, we want to run Fluent (CFD) on it. It works fine with its own mpich implementation. i was wondering if there is any possibility to use the score mpich interface which is probably faster for communication. thanks and regards christian winkler _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From mitsuru.ikei @ intel.com Wed Nov 27 10:33:34 2002 From: mitsuru.ikei @ intel.com (Ikei, Mitsuru) Date: Tue, 26 Nov 2002 17:33:34 -0800 Subject: [SCore-users-jp] RE: インテル製コンパイラについて Message-ID: <21ADC6D1B7A3D411B4DF00A0C96B5401027D7B64@jpsmsx32.jp.intel.com> 林 様 ご指摘のとおり、インテル社の販売しているコンパイラは分散メモリクラスタ環境に おけるノード間の並列化は行いません。ノード内マルチプロセッサやマイクロアーキ テクチャへの最適化を行います。 - 池井 インテル -----Original Message----- From: Keizo Hayashi [mailto:k-hayashi at sogo-eng.co.jp] Sent: Tuesday, November 26, 2002 11:10 AM To: score-users-jp @ pccluster.org; Ikei, Mitsuru Subject: Re: インテル製コンパイラについて .... ただ、少し気になったのが、 .... という記述ですが、メモリ空間が1つ、というのは、マルチプロセッサ システムなどのことでしょうか。 SCoreは分散メモリ型PCクラスタシステムということなので、ふつうの パソコン、すなわち単一CPUのマシンで構成したSCoreシステムは、 並列化するように記述されていないソースプログラムは、インテル製 コンパイラの並列化効果を得ることができないのではないか?と 思いました。 .... ================================= (株)綜合技術コンサルタント IT管理室 林 敬三 k-hayashi at sogo-eng.co.jp ================================= From k-hayashiatsogo-eng.co.jp Wed Nov 27 13:14:19 2002 From: k-hayashiatsogo-eng.co.jp (Keizo Hayashi) Date: Wed, 27 Nov 2002 13:14:19 +0900 Subject: [SCore-users-jp] Re: インテル製コンパイラについて References: <21ADC6D1B7A3D411B4DF00A0C96B5401027D7B64@jpsmsx32.jp.intel.com> Message-ID: <000c01c295cb$76fd0bb0$c500a8c0@0292hayashi> 池井様 綜合技術コンサルタント 林です。 ご回答いただき、どうも有り難うございました。 > ご指摘のとおり、インテル社の販売しているコンパイラは分散メモリクラスタ環境に > おけるノード間の並列化は行いません。ノード内マルチプロセッサやマイクロアーキ > テクチャへの最適化を行います。 分散メモリ環境については少し残念な結果でしたが、マルチプロセッサ に対しては効果がある(自動並列化が効く)とのことで、ぜひ検討させて いただきます。 ありがとうございました。 ================================= (株)綜合技術コンサルタント IT管理室 林 敬三 k-hayashi at sogo-eng.co.jp ================================= From ishikawa @ is.s.u-tokyo.ac.jp Wed Nov 27 13:16:02 2002 From: ishikawa @ is.s.u-tokyo.ac.jp (Yutaka Ishikawa) Date: Wed, 27 Nov 2002 13:16:02 +0900 (JST) Subject: [SCore-users-jp] Announcement by an industrial member Message-ID: <20021127.131602.719890779.ishikawa@is.s.u-tokyo.ac.jp> score-users-jpの皆様、 PCクラスタコンソーシアムメンバ企業からのご案内を以下お送り致します。 石川@PCクラスタコンソーシアム会長 ------------------------------------------------------------------------------- *=*=*=*=*=*=*=*=*=*=*=*=*=*=*=*=*=*=*=*=*=*=*=*=*=*=*=*=*=*=* ベストシステムズ・クラスター・ソリューション・カンファレンス 2002 のご案内 - BestSystems Clustered Server Solution Conference 2002 - *=*=*=*=*=*=*=*=*=*=*=*=*=*=*=*=*=*=*=*=*=*=*=*=*=*=*=*=*=*=* 暮秋の候、ますます御健勝のこととお喜び申し上げます。平素は格別のご高 配を賜り、厚くお礼申し上げます。 この度、株式会社ベストシステムズと日本AMD株式会社は、共同でクラスタ ソリューションに関する技術セミナーを開催する運びとなりました。 AMDのサーバ/ワークステーション向けプロセッサ、AMD Athlon(tm) MPプロ セッサは、革新的なSmart MPテクノロジを武器に、その卓越した演算能力を各 方面で活用されております。 今回のセミナーでは、「クラスタリング・ソリューション」 に関します実践に活用されているご研究の紹介と製品についてご紹介いたします。 さらに、現在開発中のAMD 64-bitテクノロジ採用のサーバ/ワークステーシ ョン向けプロセッサ、AMDaOpteron(tm)プロセッサについて、その革新的なテ クノロジである、内蔵DDRメモリコントローラ、x86-64(tm)テクノロジ、 HyperTransport(tm) テクノロジなどに関して日本AMD殿より解説させて いただきます。 以下に参加申し込み専用アドレスと実施要綱をご紹介いたしますので、どう ぞ奮ってご参加下さい。また、会場スペースに限りがあるため、ご参加いただ ける方には開催日の数日前までに確認のメールを差し上げます。 なお、講演内容は予告なく変更する場合がございます。あらかじめご了承お 願いいたします。 お申し込み専用アドレス: http://www.amd.co.jp/seminar/svrform.html 平成14年11月吉日 株式会社ベストシステムズ 代表取締役 スイミー・ソフトウェア株式会社 代表取締役     西   克 也 *=*=* 記 *=*=* 主 催 株式会社ベストシステムズ、日本AMD株式会社 日 時 平成 14年 12月 10日(火) 13:00 - 17:00 場 所 新宿 ホテル・センチュリーハイアット東京 地下1階 センチュリー・ルーム 電 話 03-3349-0111(代) 定 員 400名様(先着順) 参加費 無料 *=*=* 講演内容 *=*=* 12:30 - 13:00 受付 (場所: 地下1階 「センチュリールーム」) 13:05 - 13:20 AMDプロセッサ ロードマップ 概説: AMD米国本社 コンピューテーション製品グループ上級副社長 ダーク・マイヤー 13:20 - 14:00 AMD Opteron(tm) プロセッサ サーバー技術 概説 AMD米国本社 シニア AMD フェロー スティーブ・ポルジン 14:00 - 14:40 大規模 AMD Athlonクラスタへの道程: 東京工業大学 学術国際情報センター 教授 松岡 聡 様 14:40 - 15:00 休憩(コーヒー・タイム) 15:00 - 15:40 PCクラスタの構築とギャロッピング振動問題への適用: 東京大学工学系研究科 社会基盤工学専攻  助教授 石原 孟 様 フルーエントアジアパシフィック 岡 新一 様 15:40 - 16:20 PGIコンパイラシステム製品概要とロードマップ: STマイクロエレクトロニクス  ASTポートランドラボ ディレクター Vince Schuster 様 16:20 - 16:50 アプロ製品概説: アプロ・インターナショナル社 プロダクト・マーケティング部 ディレクタ ジョン・リー 様 16:50 - 17:00 質疑応答 17:00 - 19:00 懇親会 (立食形式) (場所: 地下1階「桃山」) 19:00 終了 株式会社ベストシステムズ -- Katsuya Nishi Chairman of BestSystems Group. Best Systems Inc Swimmy Software Inc Grid Research Inc TEL +81-298-60-7080 FAX +81-298-60-7081 From RStorm @ deltacomputer.de Wed Nov 27 17:53:08 2002 From: RStorm @ deltacomputer.de (=?iso-8859-1?Q?Ren=E9_Storm?=) Date: Wed, 27 Nov 2002 09:53:08 +0100 Subject: [SCore-users-jp] [SCore-users] AW: SCore-users digest, Vol 1 #133 - 4 msgs Message-ID: Hi all, in my opinion, the only reason why anyone should use a configuration with gm and pm could be bechmarking or trouble with ch_score. Nevertheless, rebuild and make the Score kernel with pm_myrinet, pm_ethernet, pm_memory as modules. (maybe you need pm_shmem and others too) Write a little script, which rmmod's gm and insmod's these modules (on all nodes) and have a look at scoreboard script in /etc/init.d/ etc. You also have to install an own gm-mpich beside your ch_score mpich. After having fun with "export PATH" you will be able to switch between gm and score. Have fun, René > -----Ursprüngliche Nachricht----- >Von: score-users-request @ pccluster.org >[mailto:score-users-request @ pccluster.org] >Gesendet: Mittwoch, 27. November 2002 04:00 >An: score-users @ pccluster.org >Betreff: SCore-users digest, Vol 1 #133 - 4 msgs > > << Datei: ATT00191.txt; charset = iso-2022-jp >> _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From nrcb @ streamline-computing.com Wed Nov 27 19:29:46 2002 From: nrcb @ streamline-computing.com (Nick Birkett) Date: Wed, 27 Nov 2002 10:29:46 +0000 Subject: [SCore-users-jp] Re: [SCore-users] help with gm-1.6.3 port to Score 5.2.0 In-Reply-To: References: Message-ID: <200211271029.gARATlR01748@zeralda.streamline.com> On Tuesday 26 November 2002 07:19 pm, you wrote: > Well, I first thought that there was an error in your message title. What > exactly are you trying to achieve by putting GM and PM together ? Hi Bogdan. Yes our Score kernels are always compiled with modules pm_myrinet, pm_memory, pm_shem,pm_ethernet and gm. There are 2 reason. First not all our customers use SCore and it saves supporting 2 kernels. The pm and gm modules can be interchanged quite easily via our pm and gmm startup scripts (/etc/init.d/pm stop; ./etc/init.d/gm start ). Secondly we alway need to run the gm utility packages if there is a problem with a Myrinet card. - Myricom require information if a card has to be sent back. I hope having pm and gm didn't confuse anybody. You don't need the gm module to run Score over Myrinet. Nick _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From bogdan.costescu @ iwr.uni-heidelberg.de Wed Nov 27 20:56:05 2002 From: bogdan.costescu @ iwr.uni-heidelberg.de (Bogdan Costescu) Date: Wed, 27 Nov 2002 12:56:05 +0100 (CET) Subject: [SCore-users-jp] Re: [SCore-users] help with gm-1.6.3 port to Score 5.2.0 In-Reply-To: <200211271029.gARATlR01748@zeralda.streamline.com> Message-ID: On Wed, 27 Nov 2002, Nick Birkett wrote: > The pm and gm modules can be interchanged quite easily via our pm and > gmm startup scripts (/etc/init.d/pm stop; ./etc/init.d/gm start ). ... which means that you do this in prologue/epilogue of the batch system ? Or the whole cluster is switched between GM and PM ? The fact that the same hardware can be used with 2 different software suites generally raises the problem of switching between them. Somebody on the beowulf list mentioned some time ago that after finishing a long job, the nodes are rebooted to be brought back into a known state. However, different software could interact in unknown (and usually bad) ways. For example, I understood that GM at init time tries to find nodes through some broadcast which might disturb PM. > Secondly we alway need to run the gm utility packages if there is > a problem with a Myrinet card. - Myricom require information if a card > has to be sent back. I can't comment on this, I personally never sent any Myrinet card back :-) -- Bogdan Costescu IWR - Interdisziplinaeres Zentrum fuer Wissenschaftliches Rechnen Universitaet Heidelberg, INF 368, D-69120 Heidelberg, GERMANY Telephone: +49 6221 54 8869, Telefax: +49 6221 54 8868 E-mail: Bogdan.Costescu @ IWR.Uni-Heidelberg.De _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From hermann.lauer @ iwr.uni-heidelberg.de Wed Nov 27 21:56:17 2002 From: hermann.lauer @ iwr.uni-heidelberg.de (Hermann Lauer) Date: Wed, 27 Nov 2002 13:56:17 +0100 Subject: [SCore-users-jp] Re: [SCore-users] help with gm-1.6.3 port to Score 5.2.0 In-Reply-To: ; from bogdan.costescu@iwr.uni-heidelberg.de on Wed, Nov 27, 2002 at 12:56:05PM +0100 References: <200211271029.gARATlR01748@zeralda.streamline.com> Message-ID: <20021127135617.A24108@lemon.iwr.uni-heidelberg.de> Hello, On Wed, Nov 27, 2002 at 12:56:05PM +0100, Bogdan Costescu wrote: > On Wed, 27 Nov 2002, Nick Birkett wrote: > > Secondly we alway need to run the gm utility packages if there is > > a problem with a Myrinet card. - Myricom require information if a card > > has to be sent back. > > I can't comment on this, I personally never sent any Myrinet card back :-) Myricom has told us at the SC2002 last week they indeed require some gm output before sending a card back. Who has already expiriences with sending cards back, esp. Myrinet 2000 Fiber switch line & spine cards ? Greetings Hermann -- Netzwerkadministration/Zentrale Dienste, Interdiziplinaeres Zentrum fuer wissenschaftliches Rechnen der Universitaet Heidelberg IWR; INF 368; 69120 Heidelberg; Tel: (06221)54-8236 Fax: -5224 Email: Hermann.Lauer @ iwr.uni-heidelberg.de _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From arpiruk @ yahoo.com Wed Nov 27 22:07:15 2002 From: arpiruk @ yahoo.com (=?iso-2022-jp?b?YXJwaXJ1ayAbJEIhdxsoQiB5YWhvby5jb20=?=) Date: Wed, 27 Nov 2002 05:07:15 -0800 (PST) Subject: [SCore-users-jp] [SCore-users] Library Helps needed In-Reply-To: <20021127030000.2734.20701.Mailman@www.pccluster.org> Message-ID: <20021127130715.13247.qmail@web13908.mail.yahoo.com> Please I've tried to install SCORE 5.2 on SUSE 2.4.19 cluster we did not install everything so we lack some of required programs/library anyway most of them have been solved, only these two I can not overcome it. 1. In function try_both_dlsym: XlcDL.o undefined to dlsym, dlopen and dlclose 2. can't locat /SCore/Compiler.pm in @INC Compiler.pm should be in my computer before, or it is built during the compilation ? Regards, Arpiruk Hokpunna CSE student TU-Munich __________________________________________________ Do you Yahoo!? Yahoo! Mail Plus - Powerful. Affordable. Sign up now. http://mailplus.yahoo.com _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From arpiruk @ yahoo.com Wed Nov 27 22:10:52 2002 From: arpiruk @ yahoo.com (=?iso-2022-jp?b?YXJwaXJ1ayAbJEIhdxsoQiB5YWhvby5jb20=?=) Date: Wed, 27 Nov 2002 05:10:52 -0800 (PST) Subject: [SCore-users-jp] [SCore-users] Library Helps needed In-Reply-To: <20021127030000.2734.20701.Mailman@www.pccluster.org> Message-ID: <20021127131052.90639.qmail@web13907.mail.yahoo.com> I was mistaken, my kernel is 2.4.18-4GB __________________________________________________ Do you Yahoo!? Yahoo! Mail Plus - Powerful. Affordable. Sign up now. http://mailplus.yahoo.com _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Thu Nov 28 09:09:41 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Thu, 28 Nov 2002 09:09:41 +0900 Subject: [SCore-users-jp] Re: [SCore-users] Library Helps needed In-Reply-To: Your message of "Wed, 27 Nov 2002 05:07:15 JST." <20021127130715.13247.qmail@web13908.mail.yahoo.com> Message-ID: <20021128000941.59D7D20040@neal.il.is.s.u-tokyo.ac.jp> In article <20021127130715.13247.qmail @ web13908.mail.yahoo.com> wrotes: > 1. In function try_both_dlsym: > XlcDL.o undefined to dlsym, dlopen and dlclose Please add following line in score-src/SCore/build/config/i386-suse-linux: XLIB = -lXext -lX11 -ldl > 2. can't locat /SCore/Compiler.pm in @INC > > Compiler.pm should be in my computer before, or it is > built during the compilation ? Compiler.pm file is in following directory: score-src/SCore/driver/lib This file will be installed during SCore is installed. from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From yinhw @ LANGCHAO.COM.CN Thu Nov 28 09:39:43 2002 From: yinhw @ LANGCHAO.COM.CN (=?gb2312?B?0vy66s6w?=) Date: Thu, 28 Nov 2002 08:39:43 +0800 Subject: [SCore-users-jp] [SCore-users] (no subject) Message-ID: <002b01c29676$a683ad70$460010ac@yinhw> 尹宏? 浪潮(北京)?子信息??有限公司高性能服?器?品部 地址:北京市海淀区上地信息路2号??园C?一? ??:010-62988886-6729 Email:yinhw @ langchao.com.cn -------------- next part -------------- HTMLの添付ファイルを保管しました... URL: From s-sumi @ flab.fujitsu.co.jp Thu Nov 28 14:29:21 2002 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Thu, 28 Nov 2002 14:29:21 +0900 (JST) Subject: [SCore-users-jp] Re: [SCore-users] Fluent 6.0.20 on SCore In-Reply-To: <5.1.1.6.2.20021126220249.00ac9540@pop3.web.de> References: <5.1.1.6.2.20021126220249.00ac9540@pop3.web.de> Message-ID: <20021128.142921.98887492.s-sumi@flab.fujitsu.co.jp> Hi. Sorry for late response. From: Christian Winkler Subject: [SCore-users] Fluent 6.0.20 on SCore Date: Tue, 26 Nov 2002 22:07:36 +0100 Message-ID: <5.1.1.6.2.20021126220249.00ac9540 @ pop3.web.de> pi_gleich_drei> Hi out there, dear SCore users, pi_gleich_drei> pi_gleich_drei> after we now have a working score cluster, we want to run pi_gleich_drei> Fluent (CFD) on it. It works fine with its own mpich implementation. pi_gleich_drei> i was wondering if there is any possibility to use the score mpich interface pi_gleich_drei> which is probably faster for communication. If Fluent program is distributed as .o(object) or .a (arhieve) modules that are able to link mpich library, you can easily to build SCore binary. If not, please ask Fluent to distribute as .o(object) or .a (arhieve) modules. Executable modules are depend on mpich run-time. Shinji. ------ Shinji Sumimoto, Fujitsu Labs _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From suga @ sse.co.jp Thu Nov 28 15:30:58 2002 From: suga @ sse.co.jp (Sugano, Mitsukuni) Date: Thu, 28 Nov 2002 15:30:58 +0900 Subject: [SCore-users-jp] PM ethernet/ethernet device already opened Message-ID: <3DE5B822.4C011686@sse.co.jp> 亀山様: 住商エレクトロニクスの菅野です。 お世話になります。 以下は、先日アドバイスいただきました、debugモードで 試した結果です。 解決策をご教示いただければと思います。 $ cd /opt/score/deploy $ scout -g pcc SCOUT: Spawn done. SCOUT: session started $ export PM_DEBUG=1 $ ./scstest -network ethernet SCSTEST: BURST on ethernet(chan=0,ctx=0,len=16) pmEthernetMapEthernet(1, 0xbfffef78): open("/dev/etherpm/32", 2, 0): 16 pmEthernetOpenDevice("/var/scored/scoreboard/master.0000B5002rfL", 0xbffff234): pmEthernetMapEthernet(1, 0xbfffef78): 16 PM ethernet/ethernet device already opened. 以上、宜しくお願い致します。 --- kameyama @ pccluster.org からのメッセージ: > 亀山です. > > In article > <20021125015039.87175.qmail @ web403.mail.yahoo.co.jp> > 菅野 光邦 wrotes: > > また、念のため、全計算ノードをshutdownし、 > > 管理ノードをreboot後、全計算ノードを起動 > > してから、pm-etherの総合テストおよびmandel > > のdemoを実行しましたが、やはりslave23を含める > > と、このエラーがでてしまうのです。 > > そこで、前回のメールの内容の質問をさせていただ > > きました。 > > 環境変数 PM_DEBUG を 1 に設定して scstest を > 実行してみてください. > 多分もう少し情報が得られると思います. > > from Kameyama Toyohisa > _______________________________________________ > SCore-users-jp mailing list > SCore-users-jp @ pccluster.org > http://www.pccluster.org/mailman/listinfo/score-users-jp __________________________________________________ Do You Yahoo!? Yahoo! BB is Broadband by Yahoo! http://bb.yahoo.co.jp/ _______________________________________________ SCore-users-jp mailing list SCore-users-jp @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users-jp From kameyama @ pccluster.org Thu Nov 28 16:02:32 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Thu, 28 Nov 2002 16:02:32 +0900 Subject: [SCore-users-jp] PM ethernet/ethernet device already opened In-Reply-To: Your message of "Thu, 28 Nov 2002 15:30:58 JST." <3DE5B822.4C011686@sse.co.jp> Message-ID: <20021128070232.8E22A20040@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <3DE5B822.4C011686 @ sse.co.jp> "Sugano, Mitsukuni" wrotes: > $ cd /opt/score/deploy > $ scout -g pcc > SCOUT: Spawn done. > SCOUT: session started > $ export PM_DEBUG=1 > $ ./scstest -network ethernet > > SCSTEST: BURST on ethernet(chan=0,ctx=0,len=16) > pmEthernetMapEthernet(1, 0xbfffef78): open("/dev/etherpm/32", 2, 0): 16 PM/Ethernet の device (の unit 1) の open() が EBUSY になっているようです. やっぱり, 他の process が使用しているような感じですけど... from Kameyama Toyohisa From nrcb @ streamline-computing.com Thu Nov 28 15:50:42 2002 From: nrcb @ streamline-computing.com (Nick Birkett) Date: Thu, 28 Nov 2002 06:50:42 +0000 Subject: [SCore-users-jp] [SCore-users] Best way to increase the stacksize limit on MPI jobs? Message-ID: <200211280650.gAS6ohL13248@zeralda.streamline.com> Does anyone know if it is possible for an mpi processes to increase the stack size limits ? I had this query from one of our users: >It appears that one of our users is having problems with stacksize >limits in his SCore MPI program (VASP). > >The command >ulimit -s unlimited >works in a shell on the server, including within the shell script >submitted to qsub. What is the best way to have this command executed on >the relevant compute nodes (or somehow increase the stacksize to a >larger value like 256 MB if unlimited is not possible)? ulimit sets the stack size for a shell, so is not probably not what is wanted. Probably this is a general programming problem not related to Score mpi. Thanks, Nick _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From s-sumi @ flab.fujitsu.co.jp Thu Nov 28 17:34:01 2002 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Thu, 28 Nov 2002 17:34:01 +0900 (JST) Subject: [SCore-users-jp] PM ethernet/ethernet device already opened In-Reply-To: <20021128070232.8E22A20040@neal.il.is.s.u-tokyo.ac.jp> References: <3DE5B822.4C011686@sse.co.jp> <20021128070232.8E22A20040@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <20021128.173401.94582768.s-sumi@flab.fujitsu.co.jp> 富士通研の住元です。 From: kameyama @ pccluster.org Subject: Re: [SCore-users-jp] PM ethernet/ethernet device already opened Date: Thu, 28 Nov 2002 16:02:32 +0900 Message-ID: <20021128070232.8E22A20040 @ neal.il.is.s.u-tokyo.ac.jp> kameyama> 亀山です. kameyama> kameyama> In article <3DE5B822.4C011686 @ sse.co.jp> "Sugano, Mitsukuni" wrotes: kameyama> > $ cd /opt/score/deploy kameyama> > $ scout -g pcc kameyama> > SCOUT: Spawn done. kameyama> > SCOUT: session started kameyama> > $ export PM_DEBUG=1 kameyama> > $ ./scstest -network ethernet kameyama> > kameyama> > SCSTEST: BURST on ethernet(chan=0,ctx=0,len=16) kameyama> > pmEthernetMapEthernet(1, 0xbfffef78): open("/dev/etherpm/32", 2, 0): 16 kameyama> kameyama> PM/Ethernet の device (の unit 1) の open() が EBUSY になっているようです. kameyama> やっぱり, 他の process が使用しているような感じですけど... kameyama> kameyama> from Kameyama Toyohisa 整理してよろしいでしょうか? 1) rpmtestは正常に動作する。 2) scstestのみ失敗する。 でよろしいでしょうか? 1)が動いているので、pm-ethernet.conf は正しい。 と推定されます。 もし、このとおりであれば、scorehosts.dbの 特定のノードのネットワークエ ントリがおかしいのではないかと思います。記述はどうなっていますでしょう? ethernetが2つ書かれていたりしないでしょうか? ちなみに、rcstestは動作しますでしょうか? あと、/dev/etherpm/下にファイルはありますね? ------ Shinji Sumimoto, Fujitsu Labs From suga @ sse.co.jp Thu Nov 28 18:11:32 2002 From: suga @ sse.co.jp (Sugano, Mitsukuni) Date: Thu, 28 Nov 2002 18:11:32 +0900 Subject: [SCore-users-jp] PM ethernet/ethernet device already opened References: <3DE5B822.4C011686@sse.co.jp> <20021128070232.8E22A20040@neal.il.is.s.u-tokyo.ac.jp> <20021128.173401.94582768.s-sumi@flab.fujitsu.co.jp> Message-ID: <3DE5DDC4.7FCB792B@sse.co.jp> 住元様: 住商エレクトロニクスの菅野です。 いつもお世話になっております。 Shinji Sumimoto wrote: > > 富士通研の住元です。 > > From: kameyama @ pccluster.org > Subject: Re: [SCore-users-jp] PM ethernet/ethernet device already opened > Date: Thu, 28 Nov 2002 16:02:32 +0900 > Message-ID: <20021128070232.8E22A20040 @ neal.il.is.s.u-tokyo.ac.jp> > > kameyama> 亀山です. > kameyama> > kameyama> In article <3DE5B822.4C011686 @ sse.co.jp> "Sugano, Mitsukuni" wrotes: > kameyama> > $ cd /opt/score/deploy > kameyama> > $ scout -g pcc > kameyama> > SCOUT: Spawn done. > kameyama> > SCOUT: session started > kameyama> > $ export PM_DEBUG=1 > kameyama> > $ ./scstest -network ethernet > kameyama> > > kameyama> > SCSTEST: BURST on ethernet(chan=0,ctx=0,len=16) > kameyama> > pmEthernetMapEthernet(1, 0xbfffef78): open("/dev/etherpm/32", 2, 0): 16 > kameyama> > kameyama> PM/Ethernet の device (の unit 1) の open() が EBUSY になっているようです. > kameyama> やっぱり, 他の process が使用しているような感じですけど... > kameyama> > kameyama> from Kameyama Toyohisa > > 整理してよろしいでしょうか? > > 1) rpmtestは正常に動作する。 > 2) scstestのみ失敗する。 > > でよろしいでしょうか? はい。 > > 1)が動いているので、pm-ethernet.conf は正しい。 > と推定されます。 > > もし、このとおりであれば、scorehosts.dbの 特定のノードのネットワークエ > ントリがおかしいのではないかと思います。記述はどうなっていますでしょう? > ethernetが2つ書かれていたりしないでしょうか? 確認してみます。 管理ノードの/opt/score/etc/scorehosts.dbですよね? > > ちなみに、rcstestは動作しますでしょうか? 不勉強で、すみません。具体的な手順をいただけますでしょうか? > > あと、/dev/etherpm/下にファイルはありますね? 問題のある計算ノードのみ確認すればよろしいでしょうか? できれば、どのようなファイルがあるのが正解かもご教示 いただければ幸いです。 以上、よろしくお願いいたします。 −−−−−−念のため、以前MLに投げた内容を添付します。−−−−− SCore5.0.1のクラスタシステムのうち計算ノードの1台が HD故障で交換したため、正常なノードからddでHD丸ごと システムをコピーし、IPアドレスとhostnameにかかわる 部分のみを手動で編集し、復旧させました。 ところが、そのシステムを含めてpm-etherの1対1テスト は、正常に動作するもののトータルテストに失敗します。 以下は、そのテストの結果ですが、丸ごと他のノードの システムをコピーした場合、何か他に変更すべきファイル があるのでしょうか? また、特別変更する必要のあるファイルがない場合、この 現象の原因がどこにあるか教えていただければ幸いです。 以上、よろしくお願いいたします。 −−−slave23がHD交換をしたシステムです−−− [root @ master sbin]# ./rpmtest slave23 ethernet -reply In another window; [root @ master sbin]# ./rpmtest slave01 ethernet -dest 22 -ping 8 9.44502e-05 [root @ master sbin]# ./rpmtest slave32 ethernet -dest 22 -ping 8 9.44093e-05 (ちなみに、HOST0=slave01,...,HOST22=slave23,...です。) [root @ master sbin]# cd /opt/score/deploy [root @ master deploy]# scout -g pcc SCOUT: Spawning done. SCOUT: session started. [root @ master deploy]# ./scstest -network ethernet SCSTEST: BURST on ethernet(chan=0,ctx=0,len=16) PM ethernet/ethernet device already opened. 上記エラーが表示されます。 そこで、slave23をscorehosts.defectsに追加 [root @ master etc]# more scorehosts.defects slave23.pccluster.org [root @ master init.d]# ./msgbserv stop [root @ master init.d]# ./scoreboard stop [root @ master init.d]# ./scoreboard start [root @ master init.d]# ./msgbserv start [root @ master deploy]# cd /opt/score/deploy [root @ master deploy]# scout -g pcc SCOUT: Spawning done. SCOUT: session started. [root @ master deploy]# ./scstest -network ethernet SCSTEST: BURST on ethernet(chan=0,ctx=0,len=16) 50 K packets. 100 K packets. 150 K packets. 200 K packets. 250 K packets. 300 K packets. 350 K packets. 400 K packets. slave23を除くと正常動作します。 −−− 以上、テスト結果です−−− From s-sumi @ flab.fujitsu.co.jp Thu Nov 28 18:28:42 2002 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Thu, 28 Nov 2002 18:28:42 +0900 (JST) Subject: [SCore-users-jp] PM ethernet/ethernet device already opened In-Reply-To: <3DE5DDC4.7FCB792B@sse.co.jp> References: <20021128070232.8E22A20040@neal.il.is.s.u-tokyo.ac.jp> <20021128.173401.94582768.s-sumi@flab.fujitsu.co.jp> <3DE5DDC4.7FCB792B@sse.co.jp> Message-ID: <20021128.182842.118600028.s-sumi@flab.fujitsu.co.jp> 富士通研の住元です。 From: "Sugano, Mitsukuni" Subject: Re: [SCore-users-jp] PM ethernet/ethernet device already opened Date: Thu, 28 Nov 2002 18:11:32 +0900 Message-ID: <3DE5DDC4.7FCB792B @ sse.co.jp> suga> 住元様: suga> suga> 住商エレクトロニクスの菅野です。 suga> いつもお世話になっております。 suga> suga> Shinji Sumimoto wrote: suga> > suga> > 富士通研の住元です。 suga> > suga> > From: kameyama @ pccluster.org suga> > Subject: Re: [SCore-users-jp] PM ethernet/ethernet device already opened suga> > Date: Thu, 28 Nov 2002 16:02:32 +0900 suga> > Message-ID: <20021128070232.8E22A20040 @ neal.il.is.s.u-tokyo.ac.jp> suga> > suga> > kameyama> 亀山です. suga> > kameyama> suga> > kameyama> In article <3DE5B822.4C011686 @ sse.co.jp> "Sugano, Mitsukuni" wrotes: suga> > kameyama> > $ cd /opt/score/deploy suga> > kameyama> > $ scout -g pcc suga> > kameyama> > SCOUT: Spawn done. suga> > kameyama> > SCOUT: session started suga> > kameyama> > $ export PM_DEBUG=1 suga> > kameyama> > $ ./scstest -network ethernet suga> > kameyama> > suga> > kameyama> > SCSTEST: BURST on ethernet(chan=0,ctx=0,len=16) suga> > kameyama> > pmEthernetMapEthernet(1, 0xbfffef78): open("/dev/etherpm/32", 2, 0): 16 suga> > kameyama> suga> > kameyama> PM/Ethernet の device (の unit 1) の open() が EBUSY になっているようです. suga> > kameyama> やっぱり, 他の process が使用しているような感じですけど... suga> > kameyama> suga> > kameyama> from Kameyama Toyohisa suga> > suga> > 整理してよろしいでしょうか? suga> > suga> > 1) rpmtestは正常に動作する。 suga> > 2) scstestのみ失敗する。 suga> > suga> > でよろしいでしょうか? suga> suga> はい。 suga> suga> > suga> > 1)が動いているので、pm-ethernet.conf は正しい。 suga> > と推定されます。 suga> > suga> > もし、このとおりであれば、scorehosts.dbの 特定のノードのネットワークエ suga> > ントリがおかしいのではないかと思います。記述はどうなっていますでしょう? suga> > ethernetが2つ書かれていたりしないでしょうか? suga> suga> 確認してみます。 suga> 管理ノードの/opt/score/etc/scorehosts.dbですよね? はい、でも同じファイルで、以前は動いていたわけですよね? ここが結構不思議なのですが、、 誰かが変更していなければ問題無いはずなのですが、、 suga> > ちなみに、rcstestは動作しますでしょうか? suga> suga> 不勉強で、すみません。具体的な手順をいただけますでしょうか? http://www.pccluster.org/score/dist/score/html/ja/man/man8/rcstest.html % rcstest node01 ethernet -v で実行してください。 細かいオプションはcstestを参照してください。 http://www.pccluster.org/score/dist/score/html/ja/man/man8/cstest.html suga> > suga> > あと、/dev/etherpm/下にファイルはありますね? suga> suga> 問題のある計算ノードのみ確認すればよろしいでしょうか? suga> できれば、どのようなファイルがあるのが正解かもご教示 suga> いただければ幸いです。 特にopenに失敗している /dev/etherpm/32 があるかどうか、permissionは 他のノードと同じかどうかを確認してください。 以上、よろしくお願いします。 suga> 以上、よろしくお願いいたします。 suga> suga> suga> suga> −−−−−−念のため、以前MLに投げた内容を添付します。−−−−− suga> suga> SCore5.0.1のクラスタシステムのうち計算ノードの1台が suga> HD故障で交換したため、正常なノードからddでHD丸ごと suga> システムをコピーし、IPアドレスとhostnameにかかわる suga> 部分のみを手動で編集し、復旧させました。 suga> suga> ところが、そのシステムを含めてpm-etherの1対1テスト suga> は、正常に動作するもののトータルテストに失敗します。 suga> 以下は、そのテストの結果ですが、丸ごと他のノードの suga> システムをコピーした場合、何か他に変更すべきファイル suga> があるのでしょうか? suga> また、特別変更する必要のあるファイルがない場合、この suga> 現象の原因がどこにあるか教えていただければ幸いです。 suga> suga> 以上、よろしくお願いいたします。 suga> suga> −−−slave23がHD交換をしたシステムです−−− suga> suga> [root @ master sbin]# ./rpmtest slave23 ethernet -reply suga> In another window; suga> [root @ master sbin]# ./rpmtest slave01 ethernet -dest 22 -ping suga> 8 9.44502e-05 suga> [root @ master sbin]# ./rpmtest slave32 ethernet -dest 22 -ping suga> 8 9.44093e-05 suga> suga> (ちなみに、HOST0=slave01,...,HOST22=slave23,...です。) suga> suga> [root @ master sbin]# cd /opt/score/deploy suga> [root @ master deploy]# scout -g pcc suga> SCOUT: Spawning done. suga> SCOUT: session started. suga> [root @ master deploy]# ./scstest -network ethernet suga> SCSTEST: BURST on ethernet(chan=0,ctx=0,len=16) suga> PM ethernet/ethernet device already opened. suga> suga> 上記エラーが表示されます。 suga> そこで、slave23をscorehosts.defectsに追加 suga> suga> [root @ master etc]# more scorehosts.defects suga> slave23.pccluster.org suga> suga> [root @ master init.d]# ./msgbserv stop suga> [root @ master init.d]# ./scoreboard stop suga> [root @ master init.d]# ./scoreboard start suga> [root @ master init.d]# ./msgbserv start suga> suga> [root @ master deploy]# cd /opt/score/deploy suga> [root @ master deploy]# scout -g pcc suga> SCOUT: Spawning done. suga> SCOUT: session started. suga> [root @ master deploy]# ./scstest -network ethernet suga> SCSTEST: BURST on ethernet(chan=0,ctx=0,len=16) suga> 50 K packets. suga> 100 K packets. suga> 150 K packets. suga> 200 K packets. suga> 250 K packets. suga> 300 K packets. suga> 350 K packets. suga> 400 K packets. suga> suga> slave23を除くと正常動作します。 suga> suga> −−− 以上、テスト結果です−−− suga> _______________________________________________ suga> SCore-users-jp mailing list suga> SCore-users-jp @ pccluster.org suga> http://www.pccluster.org/mailman/listinfo/score-users-jp suga> suga> ------ Shinji Sumimoto, Fujitsu Labs From suga @ sse.co.jp Thu Nov 28 18:48:56 2002 From: suga @ sse.co.jp (Sugano, Mitsukuni) Date: Thu, 28 Nov 2002 18:48:56 +0900 Subject: [SCore-users-jp] PM ethernet/ethernet device already opened References: <20021128070232.8E22A20040@neal.il.is.s.u-tokyo.ac.jp> <20021128.173401.94582768.s-sumi@flab.fujitsu.co.jp> <3DE5DDC4.7FCB792B@sse.co.jp> <20021128.182842.118600028.s-sumi@flab.fujitsu.co.jp> Message-ID: <3DE5E688.A3D723D@sse.co.jp> 住元様: 住商エレクトロニクスの菅野です。 ご回答ありがとうございます。 申し訳ございませんが、少し確認させてください。 > % rcstest node01 ethernet -v > > で実行してください。 ここで、node01のところは任意の計算ノードを指定すれば、よろしい でしょうか?それとも不具合のあるノードを指定すべきでしょうか、 もしくは管理ノードを指定するのでしょうか? > suga> > あと、/dev/etherpm/下にファイルはありますね? > suga> > suga> 問題のある計算ノードのみ確認すればよろしいでしょうか? > suga> できれば、どのようなファイルがあるのが正解かもご教示 > suga> いただければ幸いです。 > > 特にopenに失敗している /dev/etherpm/32 があるかどうか、permissionは > 他のノードと同じかどうかを確認してください。 32の意味は、全計算ノード数でしょうか?また、ファイルの中身は何でしょう か? おそらく、正常なノードslave24からHD交換ノードslave23に丸ごとddしている ので、同じだとは思うのですが、確認してみます。 以上、よろしくお願いいたします。 From s-sumi @ flab.fujitsu.co.jp Thu Nov 28 18:56:58 2002 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Thu, 28 Nov 2002 18:56:58 +0900 (JST) Subject: [SCore-users-jp] PM ethernet/ethernet device already opened In-Reply-To: <3DE5E688.A3D723D@sse.co.jp> References: <3DE5DDC4.7FCB792B@sse.co.jp> <20021128.182842.118600028.s-sumi@flab.fujitsu.co.jp> <3DE5E688.A3D723D@sse.co.jp> Message-ID: <20021128.185658.108784003.s-sumi@flab.fujitsu.co.jp> From: "Sugano, Mitsukuni" Subject: Re: [SCore-users-jp] PM ethernet/ethernet device already opened Date: Thu, 28 Nov 2002 18:48:56 +0900 Message-ID: <3DE5E688.A3D723D @ sse.co.jp> suga> 住元様: suga> suga> 住商エレクトロニクスの菅野です。 suga> ご回答ありがとうございます。 suga> 申し訳ございませんが、少し確認させてください。 suga> suga> > % rcstest node01 ethernet -v suga> > suga> > で実行してください。 suga> suga> ここで、node01のところは任意の計算ノードを指定すれば、よろしい suga> でしょうか?それとも不具合のあるノードを指定すべきでしょうか、 suga> もしくは管理ノードを指定するのでしょうか? 任意の計算ノードです。 suga> > suga> > あと、/dev/etherpm/下にファイルはありますね? suga> > suga> suga> > suga> 問題のある計算ノードのみ確認すればよろしいでしょうか? suga> > suga> できれば、どのようなファイルがあるのが正解かもご教示 suga> > suga> いただければ幸いです。 suga> > suga> > 特にopenに失敗している /dev/etherpm/32 があるかどうか、permissionは suga> > 他のノードと同じかどうかを確認してください。 suga> suga> 32の意味は、全計算ノード数でしょうか?また、ファイルの中身は何でしょう suga> か? 32は単なるファイル名で、デバイスファイルです。 suga> おそらく、正常なノードslave24からHD交換ノードslave23に丸ごとddしている suga> ので、同じだとは思うのですが、確認してみます。 suga> suga> 以上、よろしくお願いいたします。 suga> _______________________________________________ suga> SCore-users-jp mailing list suga> SCore-users-jp @ pccluster.org suga> http://www.pccluster.org/mailman/listinfo/score-users-jp suga> ------ Shinji Sumimoto, Fujitsu Labs From RStorm @ deltacomputer.de Thu Nov 28 20:00:35 2002 From: RStorm @ deltacomputer.de (=?iso-8859-1?Q?Ren=E9_Storm?=) Date: Thu, 28 Nov 2002 12:00:35 +0100 Subject: [SCore-users-jp] [SCore-users] PM and GM on one system Message-ID: Hi Folks, I have made a little script which schwitchs between gm and pm. I know its not nearly perfect, but it may help you to write a better one. It works fine in my enviroment. Cya Rene ################################ #!/bin/bash # # start and stop gm or score with this script # # by Rene Storm, DeltaComputer Products GmbH # mailto: RStorm @ DeltaComputer.de # www.deltacomputer.de # # # TODO: create in your NFS directory a bashrc_none, a bashrc_score, a bashrc_gm were you exported the right PATH # eg:PATH="/usr/local/sbin:/usr/sbin:/sbin:/bin:/usr/bin:/usr/X11R6/bin:/ usr/local/bin:/opt/score/bin:/opt/score/sbin:/opt/score/mpi/mpich-1.2.0/i 386-redhat7-linux2_4/bin/:/opt/score/bin:/root/bin:/opt/score/deploy" # export $PATH # for score # # edit the prefix-line in GM_INSTALL to the absolut Path # # General # INITD="/etc/init.d" NODES="node01" # ALL the Nodes, long lines are recommended USERS="root " # Users NFSDIR="/home/share" usage () { echo "Usage: $0 [score/gm] [start/stop]" exit 0 } # SCORE # MODPATH="/lib/modules/2.4.10-2SCORE/kernel/drivers/char" # Place of the PM Modules SCOREMODULES="pm_memory pm_shmem pm_myrinet" # order must be right, max 9 modules, ether shmem and myri depends on pm_memory; add pm_ethernet_dev if myrinet was too expensiv ;o( SCORE_SERV_PROGS="scoreboard msgbserv pbs_server pbs_sched pbs_mom" # the Score Server Proggies, don't forget pm_ethernet if lowcost omni not included SCORE_NODE_PROGS="scoutd pbs_mom" # the Score Client Proggies, don't forget pm_ethernet if lowcost # GM # GMPATH="/usr/local/gm-1.5.1_Linux" MAP_ARGS="map_once.args" start_score () { # Master for MODULE in $SCOREMODULES; do insmod ${MODPATH}/${MODULE}.o done for PROG in $SCORE_SERV_PROGS; do ${INITD}/${PROG} start done for USER in ${USERS};do HOMEPATH=`grep "^${USER}" /etc/passwd | cut -d ":" -f 6` cat ${NFSDIR}/bashrc_score > ${HOMEPATH}/.bashrc done # Slaves for NODE in $NODES;do for MODULE in $SCOREMODULES; do rsh $NODE "/sbin/insmod ${MODPATH}/${MODULE}.o" done for NPROG in $SCORE_NODE_PROGS; do rsh $NODE " ${INITD}/${NPROG} start" done for USER in ${USERS};do HOMEPATH=`grep "^${USER}" /etc/passwd | cut -d ":" -f 6` rsh $NODE "cat ${NFSDIR}/bashrc_score > ${HOMEPATH}/.bashrc" done done } stop_score () { # Master for PROG in `echo $SCORE_SERV_PROGS | awk '{print $9 " " $8 " " $7 " " $6 " " $5 " " $4 " " $3 " " $2 " " $1}'`; do #stop backwards ${INITD}/${PROG} stop done rmmod `echo $SCOREMODULES | awk '{print $9 " " $8 " " $7 " " $6 " " $5 " " $4 " " $3 " " $2 " " $1}'` #reload backwards for USER in ${USERS};do HOMEPATH=`grep "^${USER}" /etc/passwd | cut -d ":" -f 6` cat ${NFSDIR}/bashrc_none > ${HOMEPATH}/.bashrc done # Slaves for NODE in $NODES;do for NPROG in `echo $SCORE_NODE_PROGS | awk '{print $9 " " $8 " " $7 " " $6 " " $5 " " $4 " " $3 " " $2 " " $1}'`; do rsh $NODE " ${INITD}/${NPROG} stop" done rsh $NODE /sbin/rmmod `echo $SCOREMODULES | awk '{print $9 " " $8 " " $7 " " $6 " " $5 " " $4 " " $3 " " $2 " " $1}'` for USER in ${USERS};do HOMEPATH=`grep "^${USER}" /etc/passwd | cut -d ":" -f 6` rsh $NODE "cat ${NFSDIR}/bashrc_none > ${HOMEPATH}/.bashrc" done done } # GM # start_gm () { # Master ${GMPATH}/binary/GM_INSTALL for USER in ${USERS};do HOMEPATH=`grep "^${USER}" /etc/passwd | cut -d ":" -f 6` cat ${NFSDIR}/bashrc_gm > ${HOMEPATH}/.bashrc done # Slave for NODE in $NODES; do rsh $NODE "/sbin/insmod ${GMPATH}/binary/sbin/gm" for USER in ${USERS};do HOMEPATH=`grep "^${USER}" /etc/passwd | cut -d ":" -f 6` rsh $NODE "cat ${NFSDIR}/bashrc_gm > ${HOMEPATH}/.bashrc" rsh $NODE "/bin/mkdir ${HOMEPATH}/.gmpi" rcp ${HOMEPATH}/.gmpi/conf ${NODE}:${HOMEPATH}/.gmpi/conf done done # Mapper sleep 2 ${GMPATH}/binary/sbin/mapper ${GMPATH}/binary/sbin/${MAP_ARGS} } stop_gm () { # Master killall mapper 2>/dev/null #only used for active.args or file.args rmmod gm for USER in ${USERS};do HOMEPATH=`grep "^${USER}" /etc/passwd | cut -d ":" -f 6` cat ${NFSDIR}/bashrc_none > ${HOMEPATH}/.bashrc done # Slave for NODE in $NODES; do rsh $NODE "/sbin/rmmod gm" for USER in ${USERS};do HOMEPATH=`grep "^${USER}" /etc/passwd | cut -d ":" -f 6` rsh $NODE "cat ${NFSDIR}/bashrc_none > ${HOMEPATH}/.bashrc" done done } case "$1" in score) case "$2" in start) stop_gm >/dev/null 2>/dev/null sleep 2 start_score bash exit 0 ;; stop) stop_score exit 0 ;; *) usage ;; esac exit 0 ;; gm) case "$2" in start) stop_score >/dev/null 2>/dev/null sleep 2 start_gm bash exit 0 ;; stop) stop_gm exit 0 ;; *) usage ;; esac exit 0 ;; *) usage ;; esac ################# > -----Ursprüngliche Nachricht----- >Von: score-users-request @ pccluster.org >[mailto:score-users-request @ pccluster.org] >Gesendet: Donnerstag, 28. November 2002 04:00 >An: score-users @ pccluster.org >Betreff: SCore-users digest, Vol 1 #134 - 8 msgs > > << Datei: ATT00261.txt; charset = iso-2022-jp >> _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From bogdan.costescu @ iwr.uni-heidelberg.de Thu Nov 28 20:54:52 2002 From: bogdan.costescu @ iwr.uni-heidelberg.de (Bogdan Costescu) Date: Thu, 28 Nov 2002 12:54:52 +0100 (CET) Subject: [SCore-users-jp] Re: [SCore-users] Best way to increase the stacksize limit on MPI jobs? In-Reply-To: <200211280650.gAS6ohL13248@zeralda.streamline.com> Message-ID: On Thu, 28 Nov 2002, Nick Birkett wrote: > Does anyone know if it is possible for an mpi processes to increase the stack > size limits ? No process can increase its own stack size, from what I know. Possibly root-owned ones might, but this is not the case here. > ulimit sets the stack size for a shell, so is not probably not what is > wanted. On RedHat, the file /etc/security/limits.conf read from PAM is used to set these values transparently to the user. -- Bogdan Costescu IWR - Interdisziplinaeres Zentrum fuer Wissenschaftliches Rechnen Universitaet Heidelberg, INF 368, D-69120 Heidelberg, GERMANY Telephone: +49 6221 54 8869, Telefax: +49 6221 54 8868 E-mail: Bogdan.Costescu @ IWR.Uni-Heidelberg.De _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From miyagi @ hpc.cs.ritsumei.ac.jp Fri Nov 29 13:13:50 2002 From: miyagi @ hpc.cs.ritsumei.ac.jp (Masato Miyagi) Date: Fri, 29 Nov 2002 13:13:50 +0900 Subject: [SCore-users-jp] is there free() func for ompsm_galloc()? Message-ID: はじめまして、立命館大学の宮城と申します。 現在、既存の逐次プログラムを SCoreのOpenMP環境へ移植する ということをしています。 分散共有メモリを動的に確保するのに、ompsm_galloc() という関数をmalloc()の代わりに使用するということですが、 このompsm_galloc()で確保したメモリをfree()する関数は 用意されていますでしょうか? 一通り調べてみても分からなかったのでお尋ねします。 よろしくお願いします。 -- 宮城雅人 立命館大学理工学部情報学科 高性能計算研究室 From kouchi @ fasol.fujitsu.com Fri Nov 29 16:45:57 2002 From: kouchi @ fasol.fujitsu.com (Hiroyuki KOUCHI) Date: Fri, 29 Nov 2002 16:45:57 +0900 Subject: [SCore-users-jp] monitorオプションについて Message-ID: <200211290745.AA00101@kouchi01.fasol.fujitsu.com> メーリングリスト一同様 いつもお世話になっております。 富士通アドバンストソリューションズの幸地です。 SCore-5.2でのMPIバイナリの実行について質問を させてください。宜しくお願い致します。 以下のコマンドを実行しましたところ、SCore-5.0の 時には、出てこなかったエラーがでてきました。 % scrun -nodes=2x1,monitor "プログラム" SCore-D 5.2.0 connected. GLUT: Fatal Error in loadmonitor3d.exe: OpenGL GLX extension not supported by display: xxx.xxx.xxx.xxx:0.0 GLUT: Fatal Error in loadmonitor3d.exe: OpenGL GLX extension not supported by display: xxx.xxx.xxx.xxx:0.0 <0:0> SCORE: 2 nodes (2x1) ready. monitorオプションで表示させるGUIは、ASTEC-XのXサーバに表示させています。 ASTEC-Xには、GLX 拡張を表示させる(?)オプションがありませんでした。 そこで、SCore-5.0と同様なmonitorオプションのGUIを表示させる方法がありましたら お願い致します。 以上です。 -------------------------------------------------- Hiroyuki KOUCHI Systems Engnieering Dept. II Solutions Systems Business Div. FUJITSU ADVANCED SOLUTIONS LIMITED 1-2-4,Shinkoyahu, Kanagawa-ku, Yokohama, TEL:+81 45-438-2105 FAX:+81 45-438-2318 URL http://www.fasol.fujitsu.com E-mail: kouchi @ fasol.fujitsu.com -------------------------------------------------- From kameyama @ pccluster.org Fri Nov 29 18:09:09 2002 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Fri, 29 Nov 2002 18:09:09 +0900 Subject: [SCore-users-jp] monitorオプションについて In-Reply-To: Your message of "Fri, 29 Nov 2002 16:45:57 JST." <200211290745.AA00101@kouchi01.fasol.fujitsu.com> Message-ID: <20021129090909.604E220024@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <200211290745.AA00101 @ kouchi01.fasol.fujitsu.com> Hiroyuki KOUCHI wrotes: > SCore-5.2でのMPIバイナリの実行について質問を > させてください。宜しくお願い致します。 > > 以下のコマンドを実行しましたところ、SCore-5.0の > 時には、出てこなかったエラーがでてきました。 > > % scrun -nodes=2x1,monitor "プログラム" > SCore-D 5.2.0 connected. > GLUT: Fatal Error in loadmonitor3d.exe: OpenGL GLX extension not supported by > display: xxx.xxx.xxx.xxx:0.0 > GLUT: Fatal Error in loadmonitor3d.exe: OpenGL GLX extension not supported by > display: xxx.xxx.xxx.xxx:0.0 > <0:0> SCORE: 2 nodes (2x1) ready. > > monitorオプションで表示させるGUIは、ASTEC-XのXサーバに表示させています。 > ASTEC-Xには、GLX 拡張を表示させる(?)オプションがありませんでした。 redhat 7.2 は OpenGL ライブラリとして Mesa が入っていたのですが. redhat 7.3 から XFree86 のライブラリを使用するようになりました. そのため OpenGL を使用するためにはサーバに GLX 拡張が 必要になったようです. > そこで、SCore-5.0と同様なmonitorオプションのGUIを表示させる方法がありましたら > お願い致します。 環境変数その他ではできませんでした. 結局, 以下の方法しか無いような気がします. 1. /usr/lib/libGL.so* を redhat 7.2 のものに置き換えてしまう. 2. Mesa library を install して loadmonitor3d を作成し直す. from Kameyama Toyohisa From wka @ math.duke.edu Sat Nov 30 01:01:25 2002 From: wka @ math.duke.edu (Bill Allard) Date: Fri, 29 Nov 2002 11:01:25 -0500 (EST) Subject: [SCore-users-jp] Re: [SCore-users] PM and GM on one system In-Reply-To: Message-ID: How do I unsubcribe? On Thu, 28 Nov 2002, René Storm wrote: > Hi Folks, > > I have made a little script which schwitchs between gm and pm. > I know its not nearly perfect, but it may help you to write a better > one. > It works fine in my enviroment. > > Cya Rene > > ################################ > #!/bin/bash > # > # start and stop gm or score with this script > # > # by Rene Storm, DeltaComputer Products GmbH > # mailto: RStorm @ DeltaComputer.de > # www.deltacomputer.de > # > # > # TODO: create in your NFS directory a bashrc_none, a bashrc_score, a > bashrc_gm were you exported the right PATH > # eg:PATH="/usr/local/sbin:/usr/sbin:/sbin:/bin:/usr/bin:/usr/X11R6/bin:/ > usr/local/bin:/opt/score/bin:/opt/score/sbin:/opt/score/mpi/mpich-1.2.0/i > 386-redhat7-linux2_4/bin/:/opt/score/bin:/root/bin:/opt/score/deploy" > # export $PATH > # for score > # > # edit the prefix-line in GM_INSTALL to the absolut Path > # > > > # General # > INITD="/etc/init.d" > NODES="node01" # ALL the Nodes, long lines are recommended > USERS="root " # Users > NFSDIR="/home/share" > > usage () { echo "Usage: $0 [score/gm] [start/stop]" > exit 0 > } > > > # SCORE # > MODPATH="/lib/modules/2.4.10-2SCORE/kernel/drivers/char" # Place of > the PM Modules > SCOREMODULES="pm_memory pm_shmem pm_myrinet" # order must be right, > max 9 modules, ether shmem and myri depends on pm_memory; add > pm_ethernet_dev if myrinet was too expensiv ;o( > SCORE_SERV_PROGS="scoreboard msgbserv pbs_server pbs_sched pbs_mom" # > the Score Server Proggies, don't forget pm_ethernet if lowcost omni not > included > SCORE_NODE_PROGS="scoutd pbs_mom" # the Score Client Proggies, > don't forget pm_ethernet if lowcost > > # GM # > GMPATH="/usr/local/gm-1.5.1_Linux" > MAP_ARGS="map_once.args" > > > > start_score () { > # Master > for MODULE in $SCOREMODULES; do > insmod ${MODPATH}/${MODULE}.o > done > > for PROG in $SCORE_SERV_PROGS; do > ${INITD}/${PROG} start > done > for USER in ${USERS};do > HOMEPATH=`grep "^${USER}" /etc/passwd | cut -d ":" -f 6` > cat ${NFSDIR}/bashrc_score > ${HOMEPATH}/.bashrc > done > > # Slaves > for NODE in $NODES;do > for MODULE in $SCOREMODULES; do > rsh $NODE "/sbin/insmod ${MODPATH}/${MODULE}.o" > done > > for NPROG in $SCORE_NODE_PROGS; do > rsh $NODE " ${INITD}/${NPROG} start" > done > > > for USER in ${USERS};do > HOMEPATH=`grep "^${USER}" /etc/passwd | cut -d ":" -f 6` > rsh $NODE "cat ${NFSDIR}/bashrc_score > ${HOMEPATH}/.bashrc" > done > > done > } > > > > stop_score () { > # Master > > for PROG in `echo $SCORE_SERV_PROGS | awk '{print $9 " " $8 " " $7 " > " $6 " " $5 " " $4 " " $3 " " $2 " " $1}'`; do #stop backwards > ${INITD}/${PROG} stop > done > > rmmod `echo $SCOREMODULES | awk '{print $9 " " $8 " " > $7 " " $6 " " $5 " " $4 " " $3 " " $2 " " $1}'` #reload backwards > > for USER in ${USERS};do > HOMEPATH=`grep "^${USER}" /etc/passwd | cut -d ":" -f 6` > cat ${NFSDIR}/bashrc_none > ${HOMEPATH}/.bashrc > done > > # Slaves > > > for NODE in $NODES;do > > for NPROG in `echo $SCORE_NODE_PROGS | awk '{print $9 " " $8 " " $7 > " " $6 " " $5 " " $4 " " $3 " " $2 " " $1}'`; do > rsh $NODE " ${INITD}/${NPROG} stop" > done > > rsh $NODE /sbin/rmmod `echo $SCOREMODULES | awk '{print $9 " " > $8 " " $7 " " $6 " " $5 " " $4 " " $3 " " $2 " " $1}'` > > > for USER in ${USERS};do > HOMEPATH=`grep "^${USER}" /etc/passwd | cut -d ":" -f 6` > rsh $NODE "cat ${NFSDIR}/bashrc_none > ${HOMEPATH}/.bashrc" > done > > done > > } > > > # GM # > > start_gm () { > > > # Master > ${GMPATH}/binary/GM_INSTALL > > for USER in ${USERS};do > HOMEPATH=`grep "^${USER}" /etc/passwd | cut -d ":" -f 6` > cat ${NFSDIR}/bashrc_gm > ${HOMEPATH}/.bashrc > done > # Slave > for NODE in $NODES; do > > rsh $NODE "/sbin/insmod ${GMPATH}/binary/sbin/gm" > > for USER in ${USERS};do > HOMEPATH=`grep "^${USER}" /etc/passwd | cut -d ":" -f 6` > rsh $NODE "cat ${NFSDIR}/bashrc_gm > ${HOMEPATH}/.bashrc" > rsh $NODE "/bin/mkdir ${HOMEPATH}/.gmpi" > rcp ${HOMEPATH}/.gmpi/conf ${NODE}:${HOMEPATH}/.gmpi/conf > done > done > > # Mapper > sleep 2 > ${GMPATH}/binary/sbin/mapper ${GMPATH}/binary/sbin/${MAP_ARGS} > > } > > stop_gm () { > > # Master > killall mapper 2>/dev/null #only used for active.args or file.args > rmmod gm > > for USER in ${USERS};do > HOMEPATH=`grep "^${USER}" /etc/passwd | cut -d ":" -f 6` > cat ${NFSDIR}/bashrc_none > ${HOMEPATH}/.bashrc > done > # Slave > > for NODE in $NODES; do > > rsh $NODE "/sbin/rmmod gm" > > for USER in ${USERS};do > HOMEPATH=`grep "^${USER}" /etc/passwd | cut -d ":" -f 6` > rsh $NODE "cat ${NFSDIR}/bashrc_none > ${HOMEPATH}/.bashrc" > done > done > > } > > > > > case "$1" in > score) > case "$2" in > > start) > stop_gm >/dev/null 2>/dev/null > sleep 2 > start_score > bash > exit 0 > ;; > > stop) > stop_score > exit 0 > ;; > > *) > usage > ;; > esac > exit 0 > ;; > > gm) > case "$2" in > > start) > stop_score >/dev/null 2>/dev/null > sleep 2 > start_gm > bash > exit 0 > ;; > > stop) > stop_gm > exit 0 > ;; > > *) > usage > ;; > esac > exit 0 > ;; > *) > usage > ;; > esac > > > ################# > > > -----Ursprüngliche Nachricht----- > >Von: score-users-request @ pccluster.org > >[mailto:score-users-request @ pccluster.org] > >Gesendet: Donnerstag, 28. November 2002 04:00 > >An: score-users @ pccluster.org > >Betreff: SCore-users digest, Vol 1 #134 - 8 msgs > > > > << Datei: ATT00261.txt; charset = iso-2022-jp >> > _______________________________________________ > SCore-users mailing list > SCore-users @ pccluster.org > http://www.pccluster.org/mailman/listinfo/score-users > -- William K. Allard Professor of Mathematics Duke University Box 90320 Durham, NC 27708-0320 (919) 660-2861 Fax:(919) 660-2821 _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From sales @ smoking.com.net Fri Nov 29 03:13:42 2002 From: sales @ smoking.com.net (Sales Department) Date: Thu, 28 Nov 2002 19:13:42 +0100 Subject: [SCore-users-jp] [SCore-users] Low Price Fags Message-ID: <200211292232.gATMWoS21406@pccluster.org> Dear Sir or Madam In the past you have requested information on discounted products. If you are not a smoker, and find this email offensive, then we sincerely apologise. We will be only too happy to take you off our database. If you are a smoker, however, you are probably fed up with paying high prices for your cigarettes and tobacco. Take a look at what we can do for you at http://www.britishsmokers.com/?S=15&ID=2&E=4421990 We can send you, legally, by registered air mail, direct to your door, 4 cartons of cigarettes or 40 pouches of rolling tobacco (all brands are available) from only 170 Euros - about 105 pounds - fully inclusive of postage and packing. Why pay more? If you would rather not hear from us any more, this link will ensure that you are not bothered again. http://www.britishsmokers.com/off/index.php Yours faithfully. British Smokers http://www.britishsmokers.com/?S=15&ID=2&E=4421990 w2y14421990563 _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users