From hqzhou @ nju.edu.cn Wed May 5 13:58:26 2004 From: hqzhou @ nju.edu.cn (Huiqun Zhou) Date: Wed, 5 May 2004 12:58:26 +0800 Subject: [SCore-users-jp] [SCore-users] How to compile an application under Score? Message-ID: <004e01c4325d$9a5dc380$1a00a8c0@geohpclab.nju.edu.cn> Hi, I'm trying to make a simulation code compiled under Score. By default, the "configure" is unable to find where the mpi header and library files are, so I pointed it to /opt/score/include and /opt/score/lib, respectively. But when I run the program by using either scrun or mpirun, I got a message: the "program" is not a Score appilication. What's wrong with my compilation? --------------------------------- Huiqun Zhou, Doctor of Science Department of Earth Sciences Nanjing University China e-mail: hqzhou @ nju.edu.cn Tel: 86(25)359-4664 FAX: 86(25)368-6016 Mobil: 13182856800 --------------------------------- _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From yoshihiro551230 @ bc.wakwak.com Thu May 6 02:09:00 2004 From: yoshihiro551230 @ bc.wakwak.com (Yoshihiro ISHIKAWA) Date: Thu, 6 May 2004 02:09:00 +0900 Subject: [SCore-users-jp] SGE/SCoreでジョブが入らない Message-ID: <007601c432c3$a9047670$6f501da0@airfoceone> メーリングリストの皆様 岩手大学の石川と申します.いつもお世話になっております. SCore-5.6.1の環境でSGE/SCoreをインストールしたのですが, ジョブを投入しようとすると,下記のようなメッセージが出て ジョブが投入されませんでした. マニュアルを参考にpとmのオプションを与えてみてもダメでした. 以上に関して,解決方法をご存じの方がいらっしゃいましたら ご教授いただけないでしょうか? $ qsub2 -pe cluster-all_multi 3 -masterq score-02.q solver.sh qsub: illegal -p value qsub: illegal -m value usage: qsub [-a date_time] [-A account_string] [-c interval] [-C directive_prefix] [-e path] [-h ] [-I] [-j y|n] [-k keep] [-l resource_list] [-m mail_options] [-M user_list] [-N jobname] [-o path] [-p priority] [-r y|n] [-S path] [-u user_list] [-W otherattributes=value...] [-v variable_list] [-V ] [-z] [script] ==================================== 岩手大学大学院工学研究科機械工学専攻 航空宇宙システム部門/船崎・山田研究室 修士課程2年 石川慶拓 Yoshihiro Ishikawa mail yoshihiro551230 @ bc.wakwak.com ==================================== From kameyama @ pccluster.org Thu May 6 09:16:52 2004 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Thu, 06 May 2004 09:16:52 +0900 Subject: [SCore-users-jp] SGE/SCoreでジョブが入らない In-Reply-To: Your message of "Thu, 06 May 2004 02:09:00 JST." <007601c432c3$a9047670$6f501da0@airfoceone> Message-ID: <20040506001101.87D3312894C@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <007601c432c3$a9047670$6f501da0 @ airfoceone> "Yoshihiro ISHIKAWA" wrotes: > SCore-5.6.1の環境でSGE/SCoreをインストールしたのですが, > ジョブを投入しようとすると,下記のようなメッセージが出て > ジョブが投入されませんでした. > > マニュアルを参考にpとmのオプションを与えてみてもダメでした. > > 以上に関して,解決方法をご存じの方がいらっしゃいましたら > ご教授いただけないでしょうか? > > $ qsub2 -pe cluster-all_multi 3 -masterq score-02.q solver.sh > qsub: illegal -p value > qsub: illegal -m value > usage: qsub [-a date_time] [-A account_string] [-c interval] > [-C directive_prefix] [-e path] [-h ] [-I] [-j y|n] [-k keep] > [-l resource_list] [-m mail_options] [-M user_list] [-N jobname] [-o path] > [-p priority] [-r y|n] [-S path] [-u user_list] [-W > otherattributes=value...] > [-v variable_list] [-V ] [-z] [script] どうも PBS の qsub を起動しようとしているようです. PATH で SGE/SCore のほうを /opt/score/* よりも先に探すようにしてみてください. from Kameyama Toyohisa From kameyama @ pccluster.org Thu May 6 09:33:19 2004 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Thu, 06 May 2004 09:33:19 +0900 Subject: [SCore-users-jp] Re: [SCore-users] How to compile an application under Score? In-Reply-To: Your message of "Wed, 05 May 2004 12:58:26 JST." <004e01c4325d$9a5dc380$1a00a8c0@geohpclab.nju.edu.cn> Message-ID: <20040506002728.55E4812894C@neal.il.is.s.u-tokyo.ac.jp> In article <004e01c4325d$9a5dc380$1a00a8c0 @ geohpclab.nju.edu.cn> "Huiqun Zhou" wrotes: > I'm trying to make a simulation code compiled under Score. By default, the "c > onfigure" is unable to > find where the mpi header and library files are, so I pointed it to /opt/scor > e/include and /opt/score/lib, The mpi include files and libraroes is under /opt/score/mpi/*. But you must use mpicc (and mpif77) as compiler instead of gcc (or g77). mpicc script known the heaser files and libraries. from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From yoshihiro551230 @ bc.wakwak.com Thu May 6 09:56:27 2004 From: yoshihiro551230 @ bc.wakwak.com (Yoshihiro ISHIKAWA) Date: Thu, 6 May 2004 09:56:27 +0900 Subject: [SCore-users-jp] SGE/SCoreでジョブが入らない References: <20040506001101.87D3312894C@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <00b401c43304$f6c778d0$6f501da0@airfoceone> 亀山様 岩手大学の石川です.ご回答ありがとうございました. PATHを設定し直すことで,SGEのqsubが呼ばれるようになったのですが, 今度は下記のようなメッセージが出てしまいました. denied: host "score-02.iwate-u.ac.jp" is no submit host score-02.iwate-u.ac.jpはSCoreサーバとSGEマスターを兼ねているホストです. 何かお分かりになることがございましたら,ご教授頂けないでしょうか? ==================================== 岩手大学大学院工学研究科機械工学専攻 航空宇宙システム部門/船崎・山田研究室 修士課程2年 石川慶拓 Yoshihiro Ishikawa mail yoshihiro551230 @ bc.wakwak.com ==================================== From s-sumi @ flab.fujitsu.co.jp Thu May 6 12:02:58 2004 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Thu, 06 May 2004 12:02:58 +0900 (JST) Subject: [SCore-users-jp] Re: [SCore-users] Something strange in PM/Ethernet Network Trunking In-Reply-To: <408FA884.2020508@mdl.ipc.pku.edu.cn> References: <408FA884.2020508@mdl.ipc.pku.edu.cn> Message-ID: <20040506.120258.424264088.s-sumi@flab.fujitsu.co.jp> Hi. Sorry for late response because of holidays in Japan. Have you changed the values maxnsend and backoff options in pm-ethernet.conf? If so, how about pmtest communication performace? Shinji. From: Chen Hao Subject: [SCore-users] Something strange in PM/Ethernet Network Trunking Date: Wed, 28 Apr 2004 20:50:12 +0800 Message-ID: <408FA884.2020508 @ mdl.ipc.pku.edu.cn> hchen> Hello all, I used PMB 2.2.1 to measure SCORE/MPI performance and found hchen> something string. When I used two 3C905B NICs, I got the results of hchen> PingPong and Pingping as following: hchen> #--------------------------------------------------- hchen> # Benchmarking PingPong hchen> # ( #processes = 2 ) hchen> # ( 14 additional processes waiting in MPI_Barrier) hchen> #--------------------------------------------------- hchen> #bytes #repetitions t[usec] Mbytes/sec hchen> 0 1000 49.13 0.00 hchen> 1 1000 49.89 0.02 hchen> 2 1000 50.40 0.04 hchen> 4 1000 50.54 0.08 hchen> 8 1000 50.86 0.15 hchen> 16 1000 52.92 0.29 hchen> 32 1000 56.37 0.54 hchen> 64 1000 62.83 0.97 hchen> 128 1000 75.88 1.61 hchen> 256 1000 98.53 2.48 hchen> 512 1000 151.50 3.22 hchen> 1024 1000 247.95 3.94 hchen> 2048 1000 347.78 5.62 hchen> 4096 1000 463.81 8.42 hchen> 8192 1000 594.80 13.13 hchen> 16384 1000 1056.45 14.79 hchen> 32768 1000 1754.30 17.81 hchen> 65536 640 3122.35 20.02 hchen> 131072 320 5992.52 20.86 hchen> 262144 160 11469.87 21.80 hchen> 524288 80 22598.54 22.13 hchen> 1048576 40 44952.29 22.25 hchen> 2097152 20 89360.53 22.38 hchen> 4194304 10 178679.39 22.39 hchen> #--------------------------------------------------- hchen> # Benchmarking PingPing hchen> # ( #processes = 2 ) hchen> # ( 14 additional processes waiting in MPI_Barrier) hchen> #--------------------------------------------------- hchen> #bytes #repetitions t[usec] Mbytes/sec hchen> 0 1000 55.40 0.00 hchen> 1 1000 54.75 0.02 hchen> 2 1000 52.09 0.04 hchen> 4 1000 55.12 0.07 hchen> 8 1000 53.07 0.14 hchen> 16 1000 58.13 0.26 hchen> 32 1000 57.33 0.53 hchen> 64 1000 67.17 0.91 hchen> 128 1000 79.80 1.53 hchen> 256 1000 98.88 2.47 hchen> 512 1000 164.32 2.97 hchen> 1024 1000 252.47 3.87 hchen> 2048 1000 1901.03 1.03 hchen> 4096 1000 3520.96 1.11 hchen> 8192 1000 2870.28 2.72 hchen> 16384 1000 10062.60 1.55 hchen> 32768 1000 10718.80 2.92 hchen> 65536 640 20858.36 3.00 hchen> 131072 320 26830.07 4.66 hchen> 262144 160 39868.81 6.27 hchen> 524288 80 62836.03 7.96 hchen> 1048576 40 108759.45 9.19 hchen> 2097152 20 194836.70 10.27 hchen> 4194304 10 379412.10 10.54 hchen> we could see that pingpong's bandwidth is very poor when packet is from hchen> 2KB to 64KB, what's the matter? hchen> hchen> ChenHao hchen> _______________________________________________ hchen> SCore-users mailing list hchen> SCore-users @ pccluster.org hchen> http://www.pccluster.org/mailman/listinfo/score-users hchen> hchen> ------ Shinji Sumimoto, Fujitsu Labs _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From yoshihiro551230 @ bc.wakwak.com Thu May 6 14:17:44 2004 From: yoshihiro551230 @ bc.wakwak.com (Yoshihiro ISHIKAWA) Date: Thu, 6 May 2004 14:17:44 +0900 Subject: [SCore-users-jp] SGE/SCoreでジョブが入らない References: <20040506001101.87D3312894C@neal.il.is.s.u-tokyo.ac.jp> <00b401c43304$f6c778d0$6f501da0@airfoceone> Message-ID: <011801c43329$76bcfff0$6f501da0@airfoceone> 自己レスです. #qconf -as hostname で,ジョブ実行依頼ホストを設定することで解決できました. ----- Original Message ----- From: "Yoshihiro ISHIKAWA" To: "SCoreメーリングリスト" ; Sent: Thursday, May 06, 2004 9:56 AM Subject: Re: [SCore-users-jp] SGE/SCoreでジョブが入らない > 亀山様 > > 岩手大学の石川です.ご回答ありがとうございました. > > PATHを設定し直すことで,SGEのqsubが呼ばれるようになったのですが, > 今度は下記のようなメッセージが出てしまいました. > > denied: host "score-02.iwate-u.ac.jp" is no submit host > > score-02.iwate-u.ac.jpはSCoreサーバとSGEマスターを兼ねているホストです. > 何かお分かりになることがございましたら,ご教授頂けないでしょうか? > > ==================================== > 岩手大学大学院工学研究科機械工学専攻 > 航空宇宙システム部門/船崎・山田研究室 > 修士課程2年 石川慶拓 Yoshihiro Ishikawa > mail yoshihiro551230 @ bc.wakwak.com > ==================================== > > > _______________________________________________ > SCore-users-jp mailing list > SCore-users-jp @ pccluster.org > http://www.pccluster.org/mailman/listinfo/score-users-jp > From hqzhou @ nju.edu.cn Thu May 6 13:38:04 2004 From: hqzhou @ nju.edu.cn (Huiqun Zhou) Date: Thu, 6 May 2004 12:38:04 +0800 Subject: [SCore-users-jp] Re: [SCore-users] How to compile an application under Score? References: <20040506002728.55E4812894C@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <000f01c43323$ebd67970$1a00a8c0@geohpclab.nju.edu.cn> Kitayama-san, I have changed the compile option to /opt/score/mpi/mpich-1.2.5/i386-redhat7-linux2_4/include|lib, respectively, but I still got following message: ....... checking for mpi.h .. (cached) yes checking for library containing MPI_Init ... (cached) no Warning: unable to compile and link with MPI libraries. Any ideas? Thanks. Huiqun Zhou ----- Original Message ----- From: To: "Huiqun Zhou" Cc: "Score ML" Sent: Thursday, May 06, 2004 8:33 AM Subject: Re: [SCore-users] How to compile an application under Score? > In article <004e01c4325d$9a5dc380$1a00a8c0 @ geohpclab.nju.edu.cn> "Huiqun Zhou" wrotes: > > I'm trying to make a simulation code compiled under Score. By default, the "c > > onfigure" is unable to > > find where the mpi header and library files are, so I pointed it to /opt/scor > > e/include and /opt/score/lib, > > The mpi include files and libraroes is under /opt/score/mpi/*. > But you must use mpicc (and mpif77) as compiler instead of gcc (or g77). > mpicc script known the heaser files and libraries. > > from Kameyama Toyohisa > > _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Thu May 6 17:59:16 2004 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Thu, 06 May 2004 17:59:16 +0900 Subject: [SCore-users-jp] Re: [SCore-users] How to compile an application under Score? In-Reply-To: Your message of "Thu, 06 May 2004 12:38:04 JST." <000f01c43323$ebd67970$1a00a8c0@geohpclab.nju.edu.cn> Message-ID: <20040506085323.BFC8712894C@neal.il.is.s.u-tokyo.ac.jp> In article <000f01c43323$ebd67970$1a00a8c0 @ geohpclab.nju.edu.cn> "Huiqun Zhou" wrotes: > I have changed the compile option to /opt/score/mpi/mpich-1.2.5/i386-redhat7-linux2_4/include|lib, respectively, > but I still got following message: > ....... > checking for mpi.h .. (cached) yes > checking for library containing MPI_Init ... (cached) no > Warning: unable to compile and link with MPI libraries. Please remove cache file (probabry config.cache) and try again. from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From mika126 @ hotmail.com Thu May 6 17:55:28 2004 From: mika126 @ hotmail.com (chris kiam) Date: Thu, 06 May 2004 08:55:28 +0000 Subject: [SCore-users-jp] [SCore-users] freeing memory allocated by ompsm_galloc() Message-ID: Hello, i wondered if there is a free function to deallocate memory allocated by the ompsm_galloc() function. I couldnt find anything in the site or mailing list. thank you Kristian Kiamos _________________________________________________________________ MSN 8 with e-mail virus protection service: 2 months FREE* http://join.msn.com/?page=features/virus _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From hqzhou @ nju.edu.cn Thu May 6 13:59:44 2004 From: hqzhou @ nju.edu.cn (Huiqun Zhou) Date: Thu, 6 May 2004 12:59:44 +0800 Subject: [SCore-users-jp] Re: [SCore-users] How to compile an application under Score? References: <20040506085323.BFC8712894C@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <002d01c43326$f4a9d080$1a00a8c0@geohpclab.nju.edu.cn> I removed that file, but the result is still the same:( Huiqun Zhou ----- Original Message ----- From: To: "Huiqun Zhou" Cc: ; "Score ML" Sent: Thursday, May 06, 2004 4:59 PM Subject: Re: [SCore-users] How to compile an application under Score? > In article <000f01c43323$ebd67970$1a00a8c0 @ geohpclab.nju.edu.cn> "Huiqun Zhou" wrotes: > > I have changed the compile option to /opt/score/mpi/mpich-1.2.5/i386-redhat7-linux2_4/include|lib, respectively, > > but I still got following message: > > ....... > > checking for mpi.h .. (cached) yes > > checking for library containing MPI_Init ... (cached) no > > Warning: unable to compile and link with MPI libraries. > > Please remove cache file (probabry config.cache) and try again. > > from Kameyama Toyohisa > > _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Thu May 6 19:37:52 2004 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Thu, 06 May 2004 19:37:52 +0900 Subject: [SCore-users-jp] Re: [SCore-users] How to compile an application under Score? In-Reply-To: Your message of "Thu, 06 May 2004 12:59:44 JST." <002d01c43326$f4a9d080$1a00a8c0@geohpclab.nju.edu.cn> Message-ID: <20040506103159.5413212894C@neal.il.is.s.u-tokyo.ac.jp> In article <002d01c43326$f4a9d080$1a00a8c0 @ geohpclab.nju.edu.cn> "Huiqun Zhou" wrotes: > I removed that file, but the result is still the same:( The probrem solves depend how to search MPI_Init function by the configure scrtipt: 1. If the script search libmpi.a by nm, please check library location. 2, If the script compile small program, please use C compiler to mpicc. from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From s-sumi @ flab.fujitsu.co.jp Fri May 7 18:40:47 2004 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Fri, 07 May 2004 18:40:47 +0900 (JST) Subject: [SCore-users-jp] Re: [SCore-users] Something strange in PM/Ethernet Network Trunking In-Reply-To: <409B5763.8090705@mdl.ipc.pku.edu.cn> References: <408FA884.2020508@mdl.ipc.pku.edu.cn> <20040506.120258.424264088.s-sumi@flab.fujitsu.co.jp> <409B5763.8090705@mdl.ipc.pku.edu.cn> Message-ID: <20040507.184047.893803826.s-sumi@flab.fujitsu.co.jp> Hi. From: Chen Hao Subject: Re: [SCore-users] Something strange in PM/Ethernet Network Trunking Date: Fri, 07 May 2004 17:31:15 +0800 Message-ID: <409B5763.8090705 @ mdl.ipc.pku.edu.cn> hchen> I didn't change the values maxnsend and backoff options in hchen> pm-ethernet.conf(maxnsend=16, backoff=4800). And as I posted early, hchen> pingpong and pingping's results had great different, It seemed very strange. Could you change the value maxnsend=24, backoff=2400, and test? The PingPing is a burst test, so communicaiton performance is decreased if some re-transmission has occurred. If the situation does not change, please test PM level communication bandwidth using rpmtest. http://www.pccluster.org/score/dist/score/html/en/installation/pm-testethernet.html Shinji. hchen> Shinji Sumimoto wrote: hchen> hchen> >Hi. hchen> > hchen> >Sorry for late response because of holidays in Japan. hchen> > hchen> >Have you changed the values maxnsend and backoff options in hchen> >pm-ethernet.conf? If so, how about pmtest communication performace? hchen> > hchen> >Shinji. hchen> > hchen> >From: Chen Hao hchen> >Subject: [SCore-users] Something strange in PM/Ethernet Network Trunking hchen> >Date: Wed, 28 Apr 2004 20:50:12 +0800 hchen> >Message-ID: <408FA884.2020508 @ mdl.ipc.pku.edu.cn> hchen> > hchen> >hchen> Hello all, I used PMB 2.2.1 to measure SCORE/MPI performance and found hchen> >hchen> something string. When I used two 3C905B NICs, I got the results of hchen> >hchen> PingPong and Pingping as following: hchen> >hchen> #--------------------------------------------------- hchen> >hchen> # Benchmarking PingPong hchen> >hchen> # ( #processes = 2 ) hchen> >hchen> # ( 14 additional processes waiting in MPI_Barrier) hchen> >hchen> #--------------------------------------------------- hchen> >hchen> #bytes #repetitions t[usec] Mbytes/sec hchen> >hchen> 0 1000 49.13 0.00 hchen> >hchen> 1 1000 49.89 0.02 hchen> >hchen> 2 1000 50.40 0.04 hchen> >hchen> 4 1000 50.54 0.08 hchen> >hchen> 8 1000 50.86 0.15 hchen> >hchen> 16 1000 52.92 0.29 hchen> >hchen> 32 1000 56.37 0.54 hchen> >hchen> 64 1000 62.83 0.97 hchen> >hchen> 128 1000 75.88 1.61 hchen> >hchen> 256 1000 98.53 2.48 hchen> >hchen> 512 1000 151.50 3.22 hchen> >hchen> 1024 1000 247.95 3.94 hchen> >hchen> 2048 1000 347.78 5.62 hchen> >hchen> 4096 1000 463.81 8.42 hchen> >hchen> 8192 1000 594.80 13.13 hchen> >hchen> 16384 1000 1056.45 14.79 hchen> >hchen> 32768 1000 1754.30 17.81 hchen> >hchen> 65536 640 3122.35 20.02 hchen> >hchen> 131072 320 5992.52 20.86 hchen> >hchen> 262144 160 11469.87 21.80 hchen> >hchen> 524288 80 22598.54 22.13 hchen> >hchen> 1048576 40 44952.29 22.25 hchen> >hchen> 2097152 20 89360.53 22.38 hchen> >hchen> 4194304 10 178679.39 22.39 hchen> >hchen> #--------------------------------------------------- hchen> >hchen> # Benchmarking PingPing hchen> >hchen> # ( #processes = 2 ) hchen> >hchen> # ( 14 additional processes waiting in MPI_Barrier) hchen> >hchen> #--------------------------------------------------- hchen> >hchen> #bytes #repetitions t[usec] Mbytes/sec hchen> >hchen> 0 1000 55.40 0.00 hchen> >hchen> 1 1000 54.75 0.02 hchen> >hchen> 2 1000 52.09 0.04 hchen> >hchen> 4 1000 55.12 0.07 hchen> >hchen> 8 1000 53.07 0.14 hchen> >hchen> 16 1000 58.13 0.26 hchen> >hchen> 32 1000 57.33 0.53 hchen> >hchen> 64 1000 67.17 0.91 hchen> >hchen> 128 1000 79.80 1.53 hchen> >hchen> 256 1000 98.88 2.47 hchen> >hchen> 512 1000 164.32 2.97 hchen> >hchen> 1024 1000 252.47 3.87 hchen> >hchen> 2048 1000 1901.03 1.03 hchen> >hchen> 4096 1000 3520.96 1.11 hchen> >hchen> 8192 1000 2870.28 2.72 hchen> >hchen> 16384 1000 10062.60 1.55 hchen> >hchen> 32768 1000 10718.80 2.92 hchen> >hchen> 65536 640 20858.36 3.00 hchen> >hchen> 131072 320 26830.07 4.66 hchen> >hchen> 262144 160 39868.81 6.27 hchen> >hchen> 524288 80 62836.03 7.96 hchen> >hchen> 1048576 40 108759.45 9.19 hchen> >hchen> 2097152 20 194836.70 10.27 hchen> >hchen> 4194304 10 379412.10 10.54 hchen> >hchen> we could see that pingpong's bandwidth is very poor when packet is from hchen> >hchen> 2KB to 64KB, what's the matter? hchen> >hchen> hchen> >hchen> ChenHao hchen> >hchen> _______________________________________________ hchen> >hchen> SCore-users mailing list hchen> >hchen> SCore-users @ pccluster.org hchen> >hchen> http://www.pccluster.org/mailman/listinfo/score-users hchen> >hchen> hchen> >hchen> hchen> >------ hchen> >Shinji Sumimoto, Fujitsu Labs hchen> >_______________________________________________ hchen> >SCore-users mailing list hchen> >SCore-users @ pccluster.org hchen> >http://www.pccluster.org/mailman/listinfo/score-users hchen> > hchen> > hchen> > hchen> hchen> ------ Shinji Sumimoto, Fujitsu Labs _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From amx02628 @ mail2.accsnet.ne.jp Sat May 8 17:39:22 2004 From: amx02628 @ mail2.accsnet.ne.jp (KURODA Tohru) Date: Sat, 8 May 2004 17:39:22 +0900 Subject: [SCore-users-jp] scorehostsについて Message-ID: 皆様 黒田と申します。 以前にscore5.0.1で組んだクラスター を再構成して使おうと考えています。 以前は、2計算ホストcomp0, comp1と 1サーバーでやっておりました。 comp1機が不調になったのでサーバーを 計算ホストにしようとしています。 それで、eitを使ってグループの構成を変え 設定し直したのですが、 scorehosts -g pcc とやると、計算ホストは comp0, comp1 と認識されたままです。 scorehosts.dbの最後にはcomp0とserverに ついての記述だけがあるのですが。 新たなグループを作成しても scorehostsの-gオプションではそのグループは 認識されず、comp0, comp1からなるグループpcc が認識されているだけです。 ifcを導入するための再コンパイルをしたことが あります。 どなたか、グループの再構成のためのヒントを お示しいただければ幸いです。 From kameyama @ pccluster.org Mon May 10 09:01:08 2004 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Mon, 10 May 2004 09:01:08 +0900 Subject: [SCore-users-jp] scorehostsについて In-Reply-To: Your message of "Sat, 08 May 2004 17:39:22 JST." Message-ID: <20040509235503.E532A12894C@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article "KURODA Tohru" wrotes: > それで、eitを使ってグループの構成を変え > 設定し直したのですが、 > scorehosts -g pcc とやると、計算ホストは > comp0, comp1 と認識されたままです。 > scorehosts.dbの最後にはcomp0とserverに > ついての記述だけがあるのですが。 scoreboard っdwo再起動していないためだと思います. また, server を compute host にするためには server の kernel も 変更する必要がありますので, 再起動する必要があります. server の /boot, /etc/lilo.conf もしくは /etc/grub.conf の記述を確認し, kernel が変更されていること, 記述に問題ないことを確認し, reboot してください. from Kameyama Toyohisa From kameyama @ pccluster.org Tue May 11 13:33:36 2004 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Tue, 11 May 2004 13:33:36 +0900 Subject: [SCore-users-jp] [SCore-users] Re: =?gb2312?B?V2hlcmUgY2FuIEkgZmluZCB0aGUgY29kZSBvZiBTQ29yZS1EID8=?= In-Reply-To: Your message of "Tue, 11 May 2004 11:53:12 JST." <40A04E28.000158.10672@bjapp7> Message-ID: <20040511042727.D101F12894C@neal.il.is.s.u-tokyo.ac.jp> In article <40A04E28.000158.10672 @ bjapp7> "=?gb2312?B?wO680Q==?=" wrotes: > I want to study the principle of SCore-D. Where can I find the code of > SCore-D and correlative documents? SCore-D is in SCore Cluster System software. You can download SCore source code, binary for readhat 7.3 and document from following URL: http://www.pccluster.org/score/dist/index_e.php Ypu can read documentation form: http://www.pccluster.org/score/dist/score/html/en/index.html from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From iwa @ strad.ssg.fujitsu.com Tue May 11 19:10:34 2004 From: iwa @ strad.ssg.fujitsu.com (=?iso-2022-jp?b?aXdhIBskQiF3GyhCIHN0cmFkLnNzZy5mdWppdHN1LmNvbQ==?=) Date: Tue, 11 May 2004 19:10:34 +0900 Subject: [SCore-users-jp] omni openmpの動作環境について Message-ID: <200405111010.AA02961@f4ej.strad.ssg.fujitsu.com> いつもお世話になっております。 岩谷@富士通です。 現在、SCore5.4.0にてOmni OpenMPの追加インストールの依頼があり 以下の追加の導入作業テストを実施しております。 1./usr/javaにてtar -jvh j2sdk-1.3.1-FCS-linux-i386.tar.bz2 2./opt/score/score-src/adm/config/siteを作成    JAVA_HOME = /usr/java/j2sdk1.3.1 JAVA = $(JAVA_HOME)/bin/java 3.tar xzf /mnt/cdrom/score.source/score-5.4.0.omni.tar.gz 4./opt/score/score.sourceでconfigure 5./opt/score/score.source/runtime/omni配下でsmakeとsmake install 上記作業後にSCASH Omni/OpenMP − はじめにの項に載っているlaplaceを用いた 動作テストをしようとしているのですが # omcc -omniconfig=scash -o laplace_omp laplace_omp.c を実施したところ omcc -omniconfig=scash -o laplace_omp laplace_omp.c Warning: -ms16m not understood. Ignoring. Warning: -mx1024m not understood. Ignoring. Warning: -o not understood. Ignoring. Exception in thread "main" java.lang.InternalError: unexpected exception during linking: java.lang.ClassNotFoundException: exc.object.XobjectFile at 0x4028115f: java.lang.Throwable.Throwable(java.lang.String) (/usr/lib/libg cj.so.3) at 0x4027408e: java.lang.Error.Error(java.lang.String) (/usr/lib/libgcj.so.3) at 0x40281542: java.lang.VirtualMachineError.VirtualMachineError(java.lang.St ring) (/usr/lib/libgcj.so.3) at 0x40275a92: java.lang.InternalError.InternalError(java.lang.String) (/usr/ lib/libgcj.so.3) at 0x40273146: java.lang.ClassLoader.resolveClass0(java.lang.Class) (/usr/lib /libgcj.so.3) at 0x4024190b: _Jv_PrepareClass(java.lang.Class) (/usr/lib/libgcj.so.3) at 0x40260568: java.lang.ClassLoader.linkClass0(java.lang.Class) (/usr/lib/li bgcj.so.3) at 0x40273073: java.lang.ClassLoader.resolveClass0(java.lang.Class) (/usr/lib /libgcj.so.3) at 0x4025e99c: java.lang.Class.initializeClass() (/usr/lib/libgcj.so.3) at 0x4025d224: java.lang.Class.forName(java.lang.String, boolean, java.lang.C lassLoader) (/usr/lib/libgcj.so.3) at 0x4025d2bf: java.lang.Class.forName(java.lang.String) (/usr/lib/libgcj.so. 3) at 0x402c60a0: gnu.gcj.runtime.FirstThread.run() (/usr/lib/libgcj.so.3) at 0x40267fdc: _Jv_ThreadRun(java.lang.Thread) (/usr/lib/libgcj.so.3) at 0x4023478c: _Jv_RunMain(java.lang.Class, byte const, int, byte const, bool ean) (/usr/lib/libgcj.so.3) at 0x08048900: __gcj_personality_v0 (OMPC_DIR=/opt/score/omni/lib/openmp/gcc) at 0x420158d4: __libc_start_main (OMPC_DIR=/opt/score/omni/lib/openmp/gcc) at 0x080486c1: _Jv_RegisterClasses (OMPC_DIR=/opt/score/omni/lib/openmp/gcc) というjavaクラスに関すると思われるメッセージが出て、実行モジュールが作成されません。 そこで 教えて欲しいのですが、SCore5.4.0のCDに入っているomni openmpと整合性の合うJDKは、 j2sdk-1.3.1-FCS-linuxで問題ないのでしょうか? また、上記エラーの原因、対処方法が判れば教えて下さい。 [実行環境] マシン:当社PRIMERGY TS220 ・・・社内テスト環境 管理Node+計算Node×5 OS:RHL8.0(2.4.18-14smp) SCore5.4.0(Kernel 2.4.19) *************************************************************** 富士通株式会社 HPCシステム部) 岩谷正樹/Masaki Iwatani TEL:043-299-3252 (内)7055-2889 FAX:043-299-3644 (内)7055-5583 E-mail to:iwamasa @ jp.fujitsu.com **************************************************************** From kameyama @ pccluster.org Tue May 11 19:36:03 2004 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Tue, 11 May 2004 19:36:03 +0900 Subject: [SCore-users-jp] omni openmpの動作環境について In-Reply-To: Your message of "Tue, 11 May 2004 19:10:34 JST." <200405111010.AA02961@f4ej.strad.ssg.fujitsu.com> Message-ID: <20040511102954.4C422128950@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <200405111010.AA02961 @ f4ej.strad.ssg.fujitsu.com> iwa @ strad.ssg.fujitsu.com wrotes: > 1./usr/javaにてtar -jvh j2sdk-1.3.1-FCS-linux-i386.tar.bz2 > 2./opt/score/score-src/adm/config/siteを作成 >    JAVA_HOME = /usr/java/j2sdk1.3.1 > JAVA = $(JAVA_HOME)/bin/java > 3.tar xzf /mnt/cdrom/score.source/score-5.4.0.omni.tar.gz > 4./opt/score/score.sourceでconfigure ここで, % coinfigure --option site と site ファイルを使用することを教えてあげてください. あと SCore の下だけ make install しないと /opt/score/* に反映されません. Omni の make だけでしたら /opt/score/lib/build/config/i386-redhat8-linux2_4 に追加するだけでもよいと思います. で, これを行っていないので... > # omcc -omniconfig=scash -o laplace_omp laplace_omp.c > を実施したところ > omcc -omniconfig=scash -o laplace_omp laplace_omp.c > Warning: -ms16m not understood. Ignoring. > Warning: -mx1024m not understood. Ignoring. > Warning: -o not understood. Ignoring. > Exception in thread "main" java.lang.InternalError: unexpected exception duri > ng > linking: java.lang.ClassNotFoundException: exc.object.XobjectFile > at 0x4028115f: java.lang.Throwable.Throwable(java.lang.String) (/usr/lib/l > ibgcj.so.3) j2sdk ではなく, /usr/bin にあった gcj を使用しようとしているようです. > そこで > 教えて欲しいのですが、SCore5.4.0のCDに入っているomni openmpと整合性の合うJDK > は、 > j2sdk-1.3.1-FCS-linuxで問題ないのでしょうか? 多分問題ないと思います. ちなみに, SCore 5.4.0 の binarry をつくるときに私用したのは j2se 1.3.1_02 です. from Kameyama Toyohisa From iwa @ strad.ssg.fujitsu.com Tue May 11 20:16:50 2004 From: iwa @ strad.ssg.fujitsu.com (=?iso-2022-jp?b?aXdhIBskQiF3GyhCIHN0cmFkLnNzZy5mdWppdHN1LmNvbQ==?=) Date: Tue, 11 May 2004 20:16:50 +0900 Subject: [SCore-users-jp] omni openmpの動作環境について In-Reply-To: <20040511102954.4C422128950@neal.il.is.s.u-tokyo.ac.jp> References: <20040511102954.4C422128950@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <200405111116.AA02962@f4ej.strad.ssg.fujitsu.com> 亀山様 いつもお世話になっております。 岩谷@富士通です。 回答ありがとうございます。 早速試してみます。 お騒がせしました。 >亀山です. > >In article <200405111010.AA02961 @ f4ej.strad.ssg.fujitsu.com> iwa @ strad.ssg.fujitsu.com wrotes: >> 1./usr/javaにてtar -jvh j2sdk-1.3.1-FCS-linux-i386.tar.bz2 >> 2./opt/score/score-src/adm/config/siteを作成 >>    JAVA_HOME = /usr/java/j2sdk1.3.1 >> JAVA = $(JAVA_HOME)/bin/java >> 3.tar xzf /mnt/cdrom/score.source/score-5.4.0.omni.tar.gz >> 4./opt/score/score.sourceでconfigure > >ここで, > % coinfigure --option site >と site ファイルを使用することを教えてあげてください. >あと SCore の下だけ make install しないと /opt/score/* >に反映されません. >Omni の make だけでしたら > /opt/score/lib/build/config/i386-redhat8-linux2_4 >に追加するだけでもよいと思います. 今回は、既存SCore環境にOmniを追加するだけなので上記 Omniだけをmakeしたいと考えています。蒸気方法でやってみます。 >で, これを行っていないので... > >> # omcc -omniconfig=scash -o laplace_omp laplace_omp.c >> を実施したところ >> omcc -omniconfig=scash -o laplace_omp laplace_omp.c >> Warning: -ms16m not understood. Ignoring. >> Warning: -mx1024m not understood. Ignoring. >> Warning: -o not understood. Ignoring. >> Exception in thread "main" java.lang.InternalError: unexpected exception duri >> ng >> linking: java.lang.ClassNotFoundException: exc.object.XobjectFile >> at 0x4028115f: java.lang.Throwable.Throwable(java.lang.String) (/usr/lib/l >> ibgcj.so.3) > >j2sdk ではなく, /usr/bin にあった gcj を使用しようとしているようです. > >> そこで >> 教えて欲しいのですが、SCore5.4.0のCDに入っているomni openmpと整合性の合うJDK >> は、 >> j2sdk-1.3.1-FCS-linuxで問題ないのでしょうか? > >多分問題ないと思います. >ちなみに, SCore 5.4.0 の binarry をつくるときに私用したのは >j2se 1.3.1_02 です. > > from Kameyama Toyohisa *************************************************************** 富士通株式会社 HPCシステム部) 岩谷正樹/Masaki Iwatani TEL:043-299-3252 (内)7055-2889 FAX:043-299-3644 (内)7055-5583 E-mail to:iwamasa @ jp.fujitsu.com **************************************************************** From moral9692 @ hotmail.com Wed May 12 10:14:23 2004 From: moral9692 @ hotmail.com (moral moral) Date: Wed, 12 May 2004 09:14:23 +0800 Subject: [SCore-users-jp] [SCore-users] where can I get MPI source code Message-ID: Hello everyone Where can I get MPI source code? Greetings! moral 2004.5.12 _________________________________________________________________ 享用世界上最大的?子?件系?― MSN Hotmail。 http://www.hotmail.com _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Wed May 12 10:34:02 2004 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Wed, 12 May 2004 10:34:02 +0900 Subject: [SCore-users-jp] Re: [SCore-users] where can I get MPI source code In-Reply-To: Your message of "Wed, 12 May 2004 09:14:23 JST." Message-ID: <20040512012751.7F0CB128950@neal.il.is.s.u-tokyo.ac.jp> In article "moral moral" wrotes: > Where can I get MPI source code? You can get mpich-SCore source code from following URL: http://www.pccluster.org/score/dist/pub/score-5.6.1/source/score-5.6.0.mpi.tar.gz Note that SCore 5.6.1 CD-ROM image include source and binary for redhat 7.3. Please see also installation document "SCore Source Extraction and Installation". http://www.pccluster.org/score/dist/score/html/en/installation/download-source.html from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From adult_news @ aol.com Wed May 12 13:11:24 2004 From: adult_news @ aol.com (=?iso-2022-jp?b?YWR1bHRfbmV3cyAbJEIhdxsoQiBhb2wuY29t?=) Date: Wed, 12 May 2004 13:11:24 +0900 Subject: [SCore-users-jp] [SCore-users] Do you visit at once and see? Message-ID: 20040512084600 The wonderful site was found when carrying out netsurfing. To a beautiful movie site, a quality is also high. http://www.xmax.info _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From iwa @ strad.ssg.fujitsu.com Thu May 13 11:23:36 2004 From: iwa @ strad.ssg.fujitsu.com (=?iso-2022-jp?b?aXdhIBskQiF3GyhCIHN0cmFkLnNzZy5mdWppdHN1LmNvbQ==?=) Date: Thu, 13 May 2004 11:23:36 +0900 Subject: [SCore-users-jp] PVMの導入と動作確認方法について Message-ID: <200405130223.AA02971@f4ej.strad.ssg.fujitsu.com> いつもお世話になっております。 岩谷@富士通です。 現在、PVMを既存SCore5.4.0の環境に追加インストール する作業をしておりますが、導入後のテストを実施したところ正常に動作 せずその原因がわからないので教えて頂きたくメールさせて頂きました。 ・導入手順としましては、ソースを展開し、/opt/score/score-src/runtime/pvm  にてsmake smake installを実施しました。 ・動作確認 手順としては、以下のサイトの通りの手順で実施しております。 http://www.pccluster.org/score/dist/score/html/en/reference/pvm/getting-started.html それでmaster.c,slave.cの実行モジュールを作成するところまで完了しています。 そこでこれをクラスタで動作させようとしたところ %scout -g pcc %scrun -nodes=2x1 pvmd -e 1 master SCore-D 5.4.0 connected. Assembling hostlist Adding host pc01.strad.ssg.fujitsu.com to VM! Adding host pc02.strad.ssg.fujitsu.com to VM! [pvmd pid1057] 05/13 10:57:30 mksocs() /tmp/pvmd.500 exists. pvmd already runni ng? [pvmd pid1057] 05/13 10:57:30 pvmbailout(0) 上記メッセージを出力して終了してしまいます。 メッセージからみて各計算ノードのVMでの初期化は成功しているようなのですが、 既にpvmdが動いているというメッセージが出力されます。 そこでpc01,pc02でps等で確認したのですが、pvmdなるものが動いている形跡はありません。 切り分けのため計算ノードを再起動して上記を試したのですが、全く同じメッセージに なります。 原因と対処方法について教えて頂きたくお願い致します。 [環境] マシン:PRIMERGY TS220 OS:RHL8.0(Kernel2.4.19)+SCore5.4.0 *************************************************************** 富士通株式会社 HPCシステム部) 岩谷正樹/Masaki Iwatani TEL:043-299-3252 (内)7055-2889 FAX:043-299-3644 (内)7055-5583 E-mail to:iwamasa @ jp.fujitsu.com **************************************************************** From kameyama @ pccluster.org Thu May 13 12:04:19 2004 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Thu, 13 May 2004 12:04:19 +0900 Subject: [SCore-users-jp] PVMの導入と動作確認方法について In-Reply-To: Your message of "Thu, 13 May 2004 11:23:36 JST." <200405130223.AA02971@f4ej.strad.ssg.fujitsu.com> Message-ID: <20040513025805.4578112894E@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <200405130223.AA02971 @ f4ej.strad.ssg.fujitsu.com> iwa @ strad.ssg.fujitsu.com wrotes: > ・導入手順としましては、ソースを展開し、/opt/score/score-src/runtime/pvm >  にてsmake smake installを実施しました。 > > ・動作確認 手順としては、以下のサイトの通りの手順で実施しております。 > http://www.pccluster.org/score/dist/score/html/en/reference/pvm/getting-start > ed.html > > それでmaster.c,slave.cの実行モジュールを作成するところまで完了しています。 > そこでこれをクラスタで動作させようとしたところ > > %scout -g pcc > %scrun -nodes=2x1 pvmd -e 1 master > > SCore-D 5.4.0 connected. > Assembling hostlist > Adding host pc01.strad.ssg.fujitsu.com to VM! > Adding host pc02.strad.ssg.fujitsu.com to VM! > [pvmd pid1057] 05/13 10:57:30 mksocs() /tmp/pvmd.500 exists. pvmd already ru > nning? 多分, pc01.strad.ssg.fujitsu.com に /tmp/pvmd.500 が存在しているのだと 思います. このファイルを削除してやってみてください. from Kameyama Toyohisa From domon_ay_8 @ yahoo.co.jp Thu May 13 13:08:32 2004 From: domon_ay_8 @ yahoo.co.jp (安田   陽) Date: Thu, 13 May 2004 13:08:32 +0900 (JST) Subject: [SCore-users-jp] compiler Message-ID: <20040513040832.18913.qmail@web2304.mail.yahoo.co.jp> 岐阜大学 安田です。 オプションコンパイラの自動並列化機能を用いて、プログラム をSCoreクラスタシステム上で並列計算実行することはできる でしょうか。できるとしたらどのような設定をすればよいでし ょうか。ご返答よろしくお願いします。 クラスタ環境 PC2台 (サーバー兼計算ホスト,計算ホスト) OS:RedHatLinux7.3 SCore5.6.1 オプションコンパイラ:Fujitsu Fortran & C オプションコンパイラの追加方法は以下のように行ないました 。 ・Fujitsu Fortran & C のインストール ・/opt/score/etc/compilers/site.sample.fujitsuを /opt/score/etc/compilers/system にコピー __________________________________________________ Do You Yahoo!? http://bb.yahoo.co.jp/ From kameyama @ pccluster.org Thu May 13 13:49:01 2004 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Thu, 13 May 2004 13:49:01 +0900 Subject: [SCore-users-jp] compiler In-Reply-To: Your message of "Thu, 13 May 2004 13:08:32 JST." <20040513040832.18913.qmail@web2304.mail.yahoo.co.jp> Message-ID: <20040513044247.1E60712894E@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <20040513040832.18913.qmail @ web2304.mail.yahoo.co.jp> 安田 陽 wrotes: > オプションコンパイラの自動並列化機能を用いて、プログラム > をSCoreクラスタシステム上で並列計算実行することはできる > でしょうか。 自動並列化機能って... 要するに OpenMP ですね. 同じソースプログラムを Omni を使用してコンパイルし直せば SCore cluster 上で実行することは可能ですけど... (この場合, "富士通コンパイラの自動並列化機能" は使用して いないことになりますが...) from Kameyama Toyohisa From amx02628 @ mail2.accsnet.ne.jp Thu May 13 18:34:22 2004 From: amx02628 @ mail2.accsnet.ne.jp (KURODA Tohru) Date: Thu, 13 May 2004 18:34:22 +0900 Subject: [SCore-users-jp] scorehostsについて Message-ID: <40A3411E.6050307@mail2.accsnet.ne.jp> 亀山様、皆様 黒田と申します。 scoreboard起動についての ヒントをありがとうございました。 書きもらしましたが、 score5.2.0のインストールを試したことが あったため、/optには score5.0.0とscore5.2.0が 並存する状態でした。 シンボリックリンク /opt/scoreの 指す先を/opt/score5.0.0にしてeitでインストール 作業をしましたが、5.0.1のeit は /etc/init.d/scoreboardの中の記述 INSTALL_ROOT=/opt/score5.2.0 を変更しなかったために、5.2.0に対する設定 のままでscoreboardが起動していたようです。 ここを直しましたら、うまく行きました。   From ishikawa @ is.s.u-tokyo.ac.jp Thu May 13 23:25:05 2004 From: ishikawa @ is.s.u-tokyo.ac.jp (Yutaka Ishikawa) Date: Thu, 13 May 2004 23:25:05 +0900 (JST) Subject: [SCore-users-jp] HPC Asia 2004 and MUG workshop CFP Message-ID: <20040513.232505.233676069.ishikawa@is.s.u-tokyo.ac.jp> SCoreユーザの皆様、 7月20日から22日に大宮で開催されるHPC Asia 2004国際会議に併設して、 Myrinet Users Groupワークショップを開催します。 Myrinetの最新情報、産総研のSuper AISTクラスタやロスアラモス研究所の Pinkクラスタの話など、大規模クラスタに関する最新情報が聞けます。 詳しくは、 http://ilab.is.s.u-tokyo.ac.jp/~ishikawa/mug2004/ を御覧下さい。 本ワークショップに参加される方は、HPC Asia 2004国際会議に参加登録する必要が あります。事前登録割引は6月20日が〆切です。 皆様の御参加をお待ちしております。 石川 From kameyama @ pccluster.org Fri May 14 16:57:17 2004 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Fri, 14 May 2004 16:57:17 +0900 Subject: [SCore-users-jp] compiler In-Reply-To: Your message of "Fri, 14 May 2004 15:03:08 JST." <20040514060308.35148.qmail@web2302.mail.yahoo.co.jp> Message-ID: <20040514075058.F3BD6128950@neal.il.is.s.u-tokyo.ac.jp> 亀山です. すみません. score-users-jp を追加します. In article <20040514060308.35148.qmail @ web2302.mail.yahoo.co.jp> 安田 陽 wrotes: > > 自動並列化機能って... > > 要するに OpenMP ですね. > > 同じソースプログラムを Omni > > を使用してコンパイルし直せば > > SCore cluster 上で実行することは可能ですけど... > > (この場合, "富士通コンパイラの自動並列化機能" > > は使用して > > いないことになりますが...) > > 私の知識のなさのため大変ご迷惑をおかけします。 > 富士通コンパイラには、openMP仕様の並列化機能とは別の仕様 > の自動並列化機能がマニュアルにあり、そこでopenMP仕様とは > 違う自動並列化機能でコンパイルしたプログラムを、SCoreク > ラスタシステム上で並列実行できるのだろうかと思い、メール > をさせていただいた所存です。(検討違いなことを言っている > かもしれませんが...) すみません. こちらの富士通コンパイラは古くてその機能が無いもので... Web page をよく読むと OpenMP とは別に option で自動的に 並列化してくれるようですね. いずれにしろ, これは同一 host の中のみで cluster を 使用してはくれないと思います. 多分, このオプションをつけてさらに MPI を使用する, といったことはできるとは思いますけど... > 話は変わりますが、 > SCore5.6.1に付随のomniを用いてプログラムを実行したところ > 以下のような問題が出てきました。 > Omni/openMPを試そうと > PC処理速度の測定に使用していた姫野ベンチといわれるベンチ > マークプログラムを、omniでコンパイルして実行したところ以 > 下のようなメッセージが出て、それ以降何の反応もしなくなっ > てしまいました。msgbコマンドで表示したウィンドウはグルー > プすべて赤表示のままです。 > > # omf77 -omniconfig=scash –o test_OMP > himenoBMTxp_m.f > > Compiling 'himenoBMTxp_m.f'... > MAIN : > initmt: > "himenoBMTxp_m.f", line 123: warning: statement number in > brank line is ingored > "himenoBMTxp_m.f", line 123: warning: statement number in > brank line is ingored > jacobi: > "himenoBMTxp_m.f", line 189: warning: statement number in > brank line is ingored > Compiling 'himenoBMTxp_m.f'... > > # scrun ./test_OMP > > SCore-D 5.6.1 connected. > <1> SCORE-D:WARNING Unable to change directory > (/work/himenoBMTxp_m), and set to > /var/scored/singleuser/0/jobs/jid-1. > <0:0> SCORE: 2 nodes (2x1) ready. > PAUSE statement executed > To resume execution, execute a kill -15 5339 command > (これ以降反応無しです) こっちはよくわかりません. > また違うプログラムでも試してみようと > /opt/score/example/scash/laplace.omp/laplace_omp.c > をコンパイルしたところ以下のようなエラーがでました。。 > > # omcc –omniconfig=scash –o laplace_omp > laplace_omp.c > > Compiling 'laplace_omp.c'... > laplace_omp.o: In function `_ompc_main': > laplace_omp.o(.text+0x8e): undefined reference to `sin' > laplace_omp.o(.text+0xca): undefined reference to `cos' > laplace_omp.o(.text+0x262): undefined reference to > `second' > laplace_omp.o(.text+0x273): undefined reference to > `second' > collect2: ld returned 1 exit status > Error 1 すみません. ドキュメントがちがっていました. % omcc -omniconfig=scash laplace_omp.c second.c -o laplace_omp -lm で試してみてください. from Kameyama Toyohisa From lev @ serebryakov.spb.ru Sat May 15 18:49:05 2004 From: lev @ serebryakov.spb.ru (Lev Serebryakov) Date: Sat, 15 May 2004 13:49:05 +0400 Subject: [SCore-users-jp] [SCore-users] Omin under cygwin OR Is Omni OpenMP project dead? Message-ID: <1669016435.20040515134905@serebryakov.spb.ru> Hello, score-users! How are you? I've tried to write to `pdp-openmp @ trc.rwcp.or.jp', but host doesn't exists and no new e-mail addressed on Omni home page :( It seems to me, that somebody on this list could give me some help about Omni OpenMP compiler. I've compiled Omni-1.6 under current cygwin (cygwin-1.5.9, gcc 3.3.1) without any problems. Everything was compiled and installed well (but NO StackThreads and cluster support). But when I try to compile any C program with omcc, I get "Signal 11" and C-back.exe.stackdump (poor core replacement under cygwin). Even program without OpenMP directives, even empty main() function gives such result. -- Lev Serebryakov _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From t-aoki @ pst.fujitsu.com Mon May 17 13:32:14 2004 From: t-aoki @ pst.fujitsu.com (青木) Date: Mon, 17 May 2004 13:32:14 +0900 Subject: [SCore-users-jp] invoke()処理時のException Signalについて Message-ID: <20040517103851.8D09.T-AOKI@pst.fujitsu.com> SCore開発関係者様 富士通プライスソフトテクノロジの 青木 と申します。 お世話になります。 Itanium2 で score-src/SCore/scored/test/mpc++/signal を実行 したところ、以下のメッセージが出力されました。 ********************************************** <0:0> SCORE: One local node ready. <0:0> ULT: Exception Signal (11) ********************************************** 〔環境〕RHEL3.0(2.4.21-9.EL)、SCore5.6.1 gcc-3.2.3-24 / glibc-2.3.2-95.6 調べたところ、signal.cc 内の invoke() を呼び出した直後に Exception Signal が発生しているようなのですが、 http://ilab.is.s.u-tokyo.ac.jp/~ishikawa/LinuxIA64/porting.html によると、「setjmp/longjmpの実装は、glibc-2.2.4に依存してい ることに注意」という記事があったため glibc が影響している可 能性があるかもしれないと考えています。 当方では、glibc-2.3.2 を使用しており、もしglibcのバージョン に依存した処理について、対処(修正)方法などをご存知の方は、 ご教授頂けますでしょうか。 よろしくお願い致します。 ________________________________ (株)富士通プライムソフトテクノロジ 3開統)3開発部 青木 利宏 内線 7677-5214 E-Mail : t-aoki @ pst.fujitsu.com From kameyama @ pccluster.org Mon May 17 14:06:58 2004 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Mon, 17 May 2004 14:06:58 +0900 Subject: [SCore-users-jp] invoke()処理時のException Signalについて In-Reply-To: Your message of "Mon, 17 May 2004 13:32:14 JST." <20040517103851.8D09.T-AOKI@pst.fujitsu.com> Message-ID: <20040517050030.B9CE7128950@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <20040517103851.8D09.T-AOKI @ pst.fujitsu.com> 青木 wrotes: > Itanium2 で score-src/SCore/scored/test/mpc++/signal を実行 > したところ、以下のメッセージが出力されました。 > ********************************************** > <0:0> SCORE: One local node ready. > <0:0> ULT: Exception Signal (11) > ********************************************** > 〔環境〕RHEL3.0(2.4.21-9.EL)、SCore5.6.1 > gcc-3.2.3-24 / glibc-2.3.2-95.6 > > 調べたところ、signal.cc 内の invoke() を呼び出した直後に > Exception Signal が発生しているようなのですが、 > http://ilab.is.s.u-tokyo.ac.jp/~ishikawa/LinuxIA64/porting.html > によると、「setjmp/longjmpの実装は、glibc-2.2.4に依存してい > ることに注意」という記事があったため glibc が影響している可 > 能性があるかもしれないと考えています。 setjmp/longjmp の実装に bug がありました. uf[0].__jmpbuf[1] に入れる GP ですが, これは現在の GP ではなく, 呼び出し側の GP を入れる必要があります. (RHEL Workstation 2,1 だと static link していれば GR の値が同じなので 大丈夫だったのですが, dynamic link にしたら問題が発生しました.) score-src/SCore/mttl-ult/ult/stack.c の t->jmpbuf[0].__jmpbuf[1] = getGP(); /* global pointer save */ の部分を t->jmpbuf[0].__jmpbuf[1] = ((long*)func)[1]; に変更してみてください. もっとも RHEL3 ではテストしていないので, 別の理由かもしれません. from Kameyama Toyohisa From t-aoki @ pst.fujitsu.com Mon May 17 17:05:04 2004 From: t-aoki @ pst.fujitsu.com (青木) Date: Mon, 17 May 2004 17:05:04 +0900 Subject: [SCore-users-jp] invoke()処理時のException Signalについて In-Reply-To: <20040517050030.B9CE7128950@neal.il.is.s.u-tokyo.ac.jp> References: <20040517103851.8D09.T-AOKI@pst.fujitsu.com> <20040517050030.B9CE7128950@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <20040517163407.8D1B.T-AOKI@pst.fujitsu.com> 富士通プライムソフトテクノロジの 青木 です。 亀山様、回答ありがとうございます。 > > 調べたところ、signal.cc 内の invoke() を呼び出した直後に > > Exception Signal が発生しているようなのですが、 > > http://ilab.is.s.u-tokyo.ac.jp/~ishikawa/LinuxIA64/porting.html > > によると、「setjmp/longjmpの実装は、glibc-2.2.4に依存してい > > ることに注意」という記事があったため glibc が影響している可 > > 能性があるかもしれないと考えています。 > > setjmp/longjmp の実装に bug がありました. > uf[0].__jmpbuf[1] に入れる GP ですが, これは現在の GP ではなく, > 呼び出し側の GP を入れる必要があります. > (RHEL Workstation 2,1 だと static link していれば GR の値が同じなので > 大丈夫だったのですが, dynamic link にしたら問題が発生しました.) > score-src/SCore/mttl-ult/ult/stack.c > の > t->jmpbuf[0].__jmpbuf[1] = getGP(); /* global pointer save */ > の部分を > t->jmpbuf[0].__jmpbuf[1] = ((long*)func)[1]; > に変更してみてください. > > もっとも RHEL3 ではテストしていないので, 別の理由かもしれません. 変更してみましたが、残念ながら改善されませんでした。 引き続きアドバイス等頂ければ幸いです。 よろしくお願い致します。 ________________________________ (株)富士通プライムソフトテクノロジ 3開統)3開発部 青木 利宏 内線 7677-5214 E-Mail : t-aoki @ pst.fujitsu.com From kameyama @ pccluster.org Mon May 17 17:44:35 2004 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Mon, 17 May 2004 17:44:35 +0900 Subject: [SCore-users-jp] invoke()処理時のException Signalについて In-Reply-To: Your message of "Mon, 17 May 2004 17:05:04 JST." <20040517163407.8D1B.T-AOKI@pst.fujitsu.com> Message-ID: <20040517083807.2469912894C@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <20040517163407.8D1B.T-AOKI @ pst.fujitsu.com> 青木 wrotes: > > (RHEL Workstation 2,1 だと static link していれば GR の値が同じなので > > 大丈夫だったのですが, dynamic link にしたら問題が発生しました.) > > score-src/SCore/mttl-ult/ult/stack.c > > の > > t->jmpbuf[0].__jmpbuf[1] = getGP(); /* global pointer save */ > > の部分を > > t->jmpbuf[0].__jmpbuf[1] = ((long*)func)[1]; > > に変更してみてください. > > > > もっとも RHEL3 ではテストしていないので, 別の理由かもしれません. > 変更してみましたが、残念ながら改善されませんでした。 とすると, 別の理由ですね. -nockpt オプションをつけてコンパイルしても同じでしょうか? 同じとすると... One local node でしたら gdb が使用できると思うのですが, signal がおきたときの back trace をとれないでしょうか? from Kameyama Toyohisa From t-aoki @ pst.fujitsu.com Mon May 17 19:07:23 2004 From: t-aoki @ pst.fujitsu.com (青木) Date: Mon, 17 May 2004 19:07:23 +0900 Subject: [SCore-users-jp] invoke()処理時のException Signalについて In-Reply-To: <20040517083807.2469912894C@neal.il.is.s.u-tokyo.ac.jp> References: <20040517163407.8D1B.T-AOKI@pst.fujitsu.com> <20040517083807.2469912894C@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <20040517182942.02B4.T-AOKI@pst.fujitsu.com> 亀山様 富士通プライムソフトテクノロジの 青木 です On Mon, 17 May 2004 17:44:35 +0900 kameyama @ pccluster.org wrote: > 亀山です. > > In article <20040517163407.8D1B.T-AOKI @ pst.fujitsu.com> 青木 wrotes: > > > (RHEL Workstation 2,1 だと static link していれば GR の値が同じなので > > > 大丈夫だったのですが, dynamic link にしたら問題が発生しました.) > > > score-src/SCore/mttl-ult/ult/stack.c > > > の > > > t->jmpbuf[0].__jmpbuf[1] = getGP(); /* global pointer save */ > > > の部分を > > > t->jmpbuf[0].__jmpbuf[1] = ((long*)func)[1]; > > > に変更してみてください. > > > > > > もっとも RHEL3 ではテストしていないので, 別の理由かもしれません. > > 変更してみましたが、残念ながら改善されませんでした。 > > とすると, 別の理由ですね. > -nockpt オプションをつけてコンパイルしても同じでしょうか? 同じでした。 > 同じとすると... One local node でしたら gdb が使用できると思うのですが, > signal がおきたときの back trace をとれないでしょうか? back trace を採取しました。 #7〜#10と同じフレーム情報が、#5000以降も表示されつづけていま す。この時点で既に動きがおかしいということになるのでしょうか。 Attaching to program: /opt/score/score-src/SCore/scored/test/mpc++/signal/obj.ia64-redhat-linux2_4/signal.exe, process 17984 0x40000000001d4d31 in waitpid () (gdb) bt #0 0x40000000001d4d31 in waitpid () #1 0x4000000000195310 in do_system () #2 0x4000000000016f70 in sc_inspectme (x_display=0x600000000003c8a0 "gdb /opt/score/score-src/SCore/scored/test/mpc++/signal/obj.ia64-redhat-linux2_4/signal.exe 17984\n", signal=11) at ../libscio.c:249 #3 0x4000000000011fb0 in score_attach_debugger (message=0x600000000002b070 "\230001", signal=11) at ../usrmesg.c:266 #4 0x4000000000005080 in ult_exception (sig=11, code=145880, sc=0xa0000000000040c0, addr=0xc000000000000003
) at ../mpcrt.c:127 #5 #6 _voidsinvoker0::invoke() () at mpcxx_mttl.h:2085 #7 0x40000000000034d0 in Sync::read(int&) (this=0x0, ap=@0x0) at mpcxx_mttl.h:241 #8 0x40000000000034d0 in Sync::read(int&) (this=0x0, ap=@0x0) at mpcxx_mttl.h:241 #9 0x40000000000034d0 in Sync::read(int&) (this=0x0, ap=@0x0) at mpcxx_mttl.h:241 #10 0x40000000000034d0 in Sync::read(int&) (this=0x0, ap=@0x0) at mpcxx_mttl.h:241 ∫ #5000以降も同上 (gdb) up 6 #6 _voidsinvoker0::invoke() () at mpcxx_mttl.h:2085 2085 static void invoke() { (gdb) list 2080 #endif 2081 }; 2082 2083 class _voidsinvoker0 { 2084 public: 2085 static void invoke() { 2086 ULT_DEBUG( 0, "invoke() %d %s",__LINE__,__FILE__); 2087 printf("invoke() %d %s\n",__LINE__,__FILE__); 2088 voidmarshal0 *argp = (voidmarshal0 *) mpcGetArgp(); 2089 int dummy; (gdb) (gdb) up #7 0x40000000000034d0 in Sync::read(int&) (this=0x0, ap=@0x0) at mpcxx_mttl.h:241 241 inline void read(ARG &ap) { (gdb) list 236 return mpcSyncWrite((void*) buf, argp - buf, pe, mpcSync), ap; 237 } 238 #endif 239 } 240 inline ncaddr_t _getMpcSync() { return mpcSync; } 241 inline void read(ARG &ap) { 242 if (MPCXX_EXACTLY_SAME(pe)) { 243 mpcSyncRead((void*) &ap, pe, mpcSync); 244 } 245 #ifdef MPCXX_HETERO (gdb) 以上ですが、よろしくお願い致します。 ________________________________ (株)富士通プライムソフトテクノロジ 3開統)3開発部 青木 利宏 内線 7677-5214 E-Mail : t-aoki @ pst.fujitsu.com From kameyama @ pccluster.org Tue May 18 10:09:41 2004 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Tue, 18 May 2004 10:09:41 +0900 Subject: [SCore-users-jp] invoke()処理時のException Signalについて In-Reply-To: Your message of "Mon, 17 May 2004 19:07:23 JST." <20040517182942.02B4.T-AOKI@pst.fujitsu.com> Message-ID: <20040518010311.79F5512894C@neal.il.is.s.u-tokyo.ac.jp> 亀山です. とりあえず, glibc 2.2.4 (redhat Advanced workstation 2.1 for Itanium のもの) と glibc 2.3.2 (Fedora Core 1 for Intel のもの) の setjump.S を 比べてみましたが, 大きな変更はありませんでした. In article <20040517182942.02B4.T-AOKI @ pst.fujitsu.com> 青木 wrotes: > > 同じとすると... One local node でしたら gdb が使用できると思うのですが, > > signal がおきたときの back trace をとれないでしょうか? > back trace を採取しました。 > #7〜#10と同じフレーム情報が、#5000以降も表示されつづけていま > す。この時点で既に動きがおかしいということになるのでしょうか。 voidsinvoker0::invoke() () の時点で setjump() によって 新しい stack を割り当てているため, これ自体はそんなに問題では ないと思いますが... > Attaching to program: /opt/score/score-src/SCore/scored/test/mpc++/signal/obj > .ia64-redhat-linux2_4/signal.exe, process 17984 > 0x40000000001d4d31 in waitpid () > (gdb) bt これって, SEGFAULT が起こったときに gdb が立ち上がったものですね. はじめから % gdb /opt/score/score-src/SCore/scored/test/mpc++/signal/obj.ia64-redhat-linux2_4/signal.exe で動かしてみてください. (多分, 同じところだとは思いますが, その命令で止るので, 少しはましかも...) もしくは, _voidsinvoker0::invoke で break して step 実行することで エラーの起こる命令が特定できるかも... from Kameyama Toyohisa From yoshihiro551230 @ bc.wakwak.com Wed May 19 14:35:16 2004 From: yoshihiro551230 @ bc.wakwak.com (Yoshihiro ISHIKAWA) Date: Wed, 19 May 2004 14:35:16 +0900 Subject: [SCore-users-jp] ULT: Exception Signal (11) Message-ID: <01a701c43d63$10c3f1b0$6f501da0@airfoceone> メーリングリストの皆様 岩手大学の石川と申します.いつもお世話になっております. SCore-5.6.1をマルチユーザモードで使用しているのですが, ULT: Exception Signal (11) が頻繁に出てSCore-Dが止まります.この時のSCore-Dの ログは下記のようになっております. 解決方法についてなにかお分かりになる方がいらっしゃいましたら ご教授頂けないでしょうか? ---- SCoreのログ --------------------------------------------------- SYSLOG: /opt/score/deploy/scored SYSLOG: SCore-D 5.6.1 $Id: init.cc,v 1.69 2003/09/26 07:16:45 hori Exp $ SYSLOG: Compile option(s): SYSLOG: SCore-D network: ethernet/ethernet SYSLOG: Cluster[0]: (0..13)x1.i386-redhat9-linux2_4.*.2400 SYSLOG: Memory: 1008[MB], Swap: 2048[MB], Disk: 9844[MB] SYSLOG: Network[0]: ethernet/ethernet SYSLOG: SubCluster[1]: (0..5)x1.i386-redhat9-linux2_4.pentium-4.2400 SYSLOG: Memory: 1008[MB], Swap: 2048[MB], Disk: 9845[MB] SYSLOG: Network[0]: ethernet/ethernet SYSLOG: SubCluster[2]: (6..11)x2.i386-redhat9-linux2_4.xeon.2400 SYSLOG: Memory: 6061[MB], Swap: 2048[MB], Disk: 9844[MB] SYSLOG: Network[0]: ethernet/ethernet SYSLOG: SubCluster[3]: (12..13)x1.i386-redhat9-linux2_4.pentium-4.2400 SYSLOG: Memory: 2020[MB], Swap: 2048[MB], Disk: 9845[MB] SYSLOG: Network[0]: ethernet/ethernet SYSLOG: Scheduler initiated: Timeslice = 500 [msec] SYSLOG: Queue[0] activated, exclusive scheduling SYSLOG: Queue[1] activated, time-sharing scheduling SYSLOG: Queue[2] activated, time-sharing scheduling SYSLOG: Session ID: 0 SYSLOG: Server Host: cluster21.iwate-u.ac.jp SYSLOG: Backup Host: cluster11.iwate-u.ac.jp SYSLOG: Backup file is lost but created. SYSLOG: Server file is lost but created. SYSLOG: Operated by: root SYSLOG: ========= SCore-D (5.6.1) bootup in SECURE MODE ======== SYSLOG: CONSOLE connected from 192.168.1.200 CONSOLE: >> set queue all deactivated CONSOLE: >> set queue all disabled CONSOLE: >> set queue all exclusive SYSLOG: Login request: abe @ score-01.iwate-u.ac.jp:40677 SYSLOG: Login failed: abe @ score-01.iwate-u.ac.jp:40677 CONSOLE: >> set queue all enabled CONSOLE: >> set queue all activated CONSOLE: >> exit SYSLOG: Login request: abe @ score-01.iwate-u.ac.jp:41003 SYSLOG: Login accepted: abe @ score-01.iwate-u.ac.jp:41003, JID: 2, Hosts: 5(3x2)@6, Priority: 1, Command: ./SGSk50MUT SYSLOG: Login request: abe @ score-01.iwate-u.ac.jp:41279 SYSLOG: Login accepted: abe @ score-01.iwate-u.ac.jp:41279, JID: 3, Hosts: 5(5x1)@0, Priority: 1, Command: ./naca_k50 SYSLOG: Login request: hiroma @ score-01.iwate-u.ac.jp:47783 SYSLOG: Login accepted: hiroma @ score-01.iwate-u.ac.jp:47783, JID: 4, Hosts: 4(2x2)@9, Priority: 1, Command: /home/hiroma/mhi_sr_new/solver/./a.out SYSLOG: Logout: hiroma @ score-01.iwate-u.ac.jp:47783, JOB-ID: 4, CPU Time: 40.59[S] SYSLOG: Login request: hiroma @ score-01.iwate-u.ac.jp:47846 SYSLOG: Login accepted: hiroma @ score-01.iwate-u.ac.jp:47846, JID: 5, Hosts: 4(2x2)@9, Priority: 1, Command: /home/hiroma/mhi_sr_new/solver/./a.out SYSLOG: Logout: hiroma @ score-01.iwate-u.ac.jp:47846, JOB-ID: 5, CPU Time: 11.25[M] SYSLOG: Login request: hiroma @ score-01.iwate-u.ac.jp:52564 SYSLOG: Login accepted: hiroma @ score-01.iwate-u.ac.jp:52564, JID: 6, Hosts: 4(2x2)@9, Priority: 1, Command: /home/hiroma/mhi_s1/solver/./a.out SYSLOG: Logout: hiroma @ score-01.iwate-u.ac.jp:52564, JOB-ID: 6, CPU Time: 7.267[M] SYSLOG: Login request: hiroma @ score-01.iwate-u.ac.jp:52869 SYSLOG: Login accepted: hiroma @ score-01.iwate-u.ac.jp:52869, JID: 7, Hosts: 4(2x2)@9, Priority: 1, Command: /home/hiroma/mhi_s1/solver/./a.out SYSLOG: Login request: hasegawa @ score-01.iwate-u.ac.jp:53566 SYSLOG: Login accepted: hasegawa @ score-01.iwate-u.ac.jp:53566, JID: 8, Hosts: 5(3x2)@6, Priority: 1, Command: ./a.out <8> ULT: Exception Signal (11) ==================================== 岩手大学大学院工学研究科機械工学専攻 航空宇宙システム部門/船崎・山田研究室 修士課程2年 石川慶拓 Yoshihiro Ishikawa mail yoshihiro551230 @ bc.wakwak.com ==================================== From hori @ swimmy-soft.com Thu May 20 16:59:51 2004 From: hori @ swimmy-soft.com (Atsushi HORI) Date: Thu, 20 May 2004 16:59:51 +0900 Subject: [SCore-users-jp] ULT: Exception Signal (11) In-Reply-To: <01a701c43d63$10c3f1b0$6f501da0@airfoceone> References: <01a701c43d63$10c3f1b0$6f501da0@airfoceone> Message-ID: <3167917191.hori0005@swimmy-soft.com> 堀@スイミー・ソフトウェアです. >が頻繁に出てSCore-Dが止まります.この時のSCore-Dの >ログは下記のようになっております. ログと同様に動かしてみましたが再現しませんでした. >解決方法についてなにかお分かりになる方がいらっしゃいましたら >ご教授頂けないでしょうか? > >---- SCoreのログ --------------------------------------------------- >SYSLOG: /opt/score/deploy/scored SCore-D を /opt/score/deploy/scored_dev として起動して,出力を*全て*送 ってください. ---- 堀 敦史(ほり あつし) スイミー・ソフトウェア株式会社 From yoshihiro551230 @ bc.wakwak.com Thu May 20 17:20:21 2004 From: yoshihiro551230 @ bc.wakwak.com (Yoshihiro ISHIKAWA) Date: Thu, 20 May 2004 17:20:21 +0900 Subject: [SCore-users-jp] ULT: Exception Signal (11) References: <01a701c43d63$10c3f1b0$6f501da0@airfoceone> <3167917191.hori0005@swimmy-soft.com> Message-ID: <004b01c43e43$4b07cd70$6f501da0@airfoceone> 堀 様 岩手大学の石川です.お返事ありがとうございます. お送りするのは,ULT: Exception Signal (11)が出るまで の出力ということでよろしかったでしょうか? それとも,scored_devを立ち上げてすぐの出力で良い でしょうか? ==================================== 岩手大学大学院工学研究科機械工学専攻 航空宇宙システム部門/船崎・山田研究室 修士課程2年 石川慶拓 Yoshihiro Ishikawa mail yoshihiro551230 @ bc.wakwak.com ==================================== ----- Original Message ----- From: "Atsushi HORI" To: ; Sent: Thursday, May 20, 2004 4:59 PM Subject: Re: [SCore-users-jp] ULT: Exception Signal (11) > 堀@スイミー・ソフトウェアです. > > >が頻繁に出てSCore-Dが止まります.この時のSCore-Dの > >ログは下記のようになっております. > > ログと同様に動かしてみましたが再現しませんでした. > > >解決方法についてなにかお分かりになる方がいらっしゃいましたら > >ご教授頂けないでしょうか? > > > >---- SCoreのログ --------------------------------------------------- > >SYSLOG: /opt/score/deploy/scored > > SCore-D を /opt/score/deploy/scored_dev として起動して,出力を*全て*送 > ってください. > > ---- > 堀 敦史(ほり あつし) > スイミー・ソフトウェア株式会社 > > From hori @ swimmy-soft.com Thu May 20 17:24:35 2004 From: hori @ swimmy-soft.com (Atsushi HORI) Date: Thu, 20 May 2004 17:24:35 +0900 Subject: [SCore-users-jp] ULT: Exception Signal (11) In-Reply-To: <004b01c43e43$4b07cd70$6f501da0@airfoceone> References: <01a701c43d63$10c3f1b0$6f501da0@airfoceone> Message-ID: <3167918675.hori0006@swimmy-soft.com> 堀@スイミー・ソフトウェアです. >お送りするのは,ULT: Exception Signal (11)が出るまで >の出力ということでよろしかったでしょうか? こっちでお願いします.大量でしょうか? ---- 堀 敦史(ほり あつし) スイミー・ソフトウェア株式会社 From yoshihiro551230 @ bc.wakwak.com Thu May 20 17:37:28 2004 From: yoshihiro551230 @ bc.wakwak.com (Yoshihiro ISHIKAWA) Date: Thu, 20 May 2004 17:37:28 +0900 Subject: [SCore-users-jp] ULT: Exception Signal (11) References: <01a701c43d63$10c3f1b0$6f501da0@airfoceone> <3167918675.hori0006@swimmy-soft.com> Message-ID: <005901c43e45$af4ab1b0$6f501da0@airfoceone> 堀 様 岩手大学の石川です. ULT: Exception Signal (11)が出るまで,しばらく時間を要すると 思いますので,その時に出力をお送り致します. その際はお手数をお掛けしますがよろしくお願い致します. ----- Original Message ----- From: "Atsushi HORI" To: ; Sent: Thursday, May 20, 2004 5:24 PM Subject: Re: [SCore-users-jp] ULT: Exception Signal (11) > 堀@スイミー・ソフトウェアです. > > >お送りするのは,ULT: Exception Signal (11)が出るまで > >の出力ということでよろしかったでしょうか? > > こっちでお願いします.大量でしょうか? > > ---- > 堀 敦史(ほり あつし) > スイミー・ソフトウェア株式会社 > > _______________________________________________ > SCore-users-jp mailing list > SCore-users-jp @ pccluster.org > http://www.pccluster.org/mailman/listinfo/score-users-jp > From adnews @ aol.com Thu May 20 22:03:56 2004 From: adnews @ aol.com (=?iso-2022-jp?b?YWRuZXdzIBskQiF3GyhCIGFvbC5jb20=?=) Date: Thu, 20 May 2004 22:03:56 +0900 Subject: [SCore-users-jp] [SCore-users] Do you visit at once and see? Message-ID: <28c301c43e6a$e9012b80$020ba8c0@xmax2> The wonderful site was found when carrying out netsurfing. To a beautiful movie site, a quality is also high. http://www.xmax.info Do you visit at once and see? _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From pvenka @ yahoo.com Mon May 24 16:37:01 2004 From: pvenka @ yahoo.com (parthasarathy venkataraman) Date: Mon, 24 May 2004 00:37:01 -0700 (PDT) Subject: [SCore-users-jp] [SCore-users] qsub gives library error Message-ID: <20040524073701.98436.qmail@web12305.mail.yahoo.com> Hi, When I run a program from command line it works. But when I run it using qsub it fails midway in the program giving error: error while loading shared library: libg2c.so.0:cannont open shared object file: No such file or directory. And the file libg2c.so.0 does exist in /usr/lib Any clues. venkat __________________________________ Do you Yahoo!? Yahoo! Domains ? Claim yours for only $14.70/year http://smallbusiness.promotions.yahoo.com/offer _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Mon May 24 16:47:08 2004 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Mon, 24 May 2004 16:47:08 +0900 Subject: [SCore-users-jp] Re: [SCore-users] qsub gives library error In-Reply-To: Your message of "Mon, 24 May 2004 00:37:01 JST." <20040524073701.98436.qmail@web12305.mail.yahoo.com> Message-ID: <20040524074017.81FB7128950@neal.il.is.s.u-tokyo.ac.jp> In article <20040524073701.98436.qmail @ web12305.mail.yahoo.com> parthasarathy venkataraman wrotes: > When I run a program from command line it works. > But when I run it using qsub it fails midway in the > program giving error: error while loading shared > library: libg2c.so.0:cannont open shared object file: > No such file or directory. > And the file libg2c.so.0 does exist in /usr/lib > Any clues. Note that If you run program with PBS, the program execute on the compute hosts. So you must check libg2c.so.0 is exist on the compute hosts. I recommend your program link statically (link with -static option). from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From k-okazaki @ pst.fujitsu.com Tue May 25 11:37:38 2004 From: k-okazaki @ pst.fujitsu.com (Keiichi Okazaki) Date: Tue, 25 May 2004 11:37:38 +0900 Subject: [SCore-users-jp] MPICH+threadジョブ実行時に発生する不具合について Message-ID: <40B2B172.9050904@pst.fujitsu.com> SCore開発関係者様 富士通プライムソフトテクノロジの岡崎と申します。 お世話になります。 MPICH+threadジョブのチェックポイント/リスタートを行うと、 チェックポイント時点からのリスタート時にSIGSEGVが発生する 現象が起きています。 実行環境は、RedHat8.0 + SCore5.6.1 です。 SIGSEGVを回避するにはどうすればよいのでしょうか? 以下に、こちらで調査したことを記します。 ---- score_syscall 内で__pthread_initial_thread_bos を 以前のスタック値へ書き換えてしまう処理があるようです。 ---- (gdb) ni 0x080a0816 in read () (gdb) x __pthread_initial_thread_bos 0x8167c60 : 0x000000ff ~~~~~~~~~ ※ここまでは正常 (gdb) ni ※1命令動かすと 0x080a081b in read () (gdb) x __pthread_initial_thread_bos 0xbfa00000: 0x00000000 ~~~~~~~~~~ ※書き変わっている 0x80a0815 : push %eax 0x80a0816 : call 0x809fd70 ★ 0x80a081b : add $0x20,%esp ----- 更に score_syscall の中を見てみると、 (score_syscall_nowrap)->__pthread_alt_unlock と呼び出されます。その 延長で __pthread_restart_new が呼び出されます。 __pthread_restart_new 内で自分自身にリスタートシグナルを送って いるため、pthread_initialize が走ってしまい、 __pthread_initial_thread_bos を初期状態に戻してしまっているようです。 これによって、libpthread.a 内 errno.o :__errno_location()→ thread_self()内のスレッドディスクリプタ特定処理で失敗。 __errno_location() はヌルポインタを返却し、ここにerrnoを 書き込むことでSIGSEGVが発生しているようです。 ---- 以上、よろしくお願い致します。 -- ------------------------------------------ 岡崎 E-mail : k-okazaki @ pst.fujitsu.com From kameyama @ pccluster.org Tue May 25 11:46:16 2004 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Tue, 25 May 2004 11:46:16 +0900 Subject: [SCore-users-jp] MPICH+threadジョブ実行時に発生する不具合について In-Reply-To: Your message of "Tue, 25 May 2004 11:37:38 JST." <40B2B172.9050904@pst.fujitsu.com> Message-ID: <20040525023923.7A33C12894E@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <40B2B172.9050904 @ pst.fujitsu.com> Keiichi Okazaki wrotes: > MPICH+threadジョブのチェックポイント/リスタートを行うと、 > チェックポイント時点からのリスタート時にSIGSEGVが発生する > 現象が起きています。 > 実行環境は、RedHat8.0 + SCore5.6.1 です。 > > SIGSEGVを回避するにはどうすればよいのでしょうか? SCore では pthread の checkpoint はサポートしていません. pthread を使用するときはコンパイル時に -nockpt オプションを つけて checkpoint を無効にしてください. (なお, 次の version ではコンパイル時に warning を出す予定です.) from Kameyama Toyohisa From nick @ streamline-computing.com Wed May 26 02:50:11 2004 From: nick @ streamline-computing.com (Nick Birkett) Date: 25 May 2004 18:50:11 +0100 Subject: [SCore-users-jp] [SCore-users] scout socket Message-ID: <1085507411.17370.1399.camel@zeralda.streamline> Dear Score users, scout socket files seem to get left in /tmp. Eventually a user starts a job with the same PID as an old socket file belonging to another user and fails. Is this a bug ? [sccomp @ sirius tmp]$ ls scout12652 scout14793 scout16994 scout17489 scout18393 scout23546 scout27764 ssh-XX3MORh4 scout12857 scout16176 scout17115 scout17533 scout18846 scout23755 scout2858 td_sockV4 kd_sockV4 scout10095 scout13194 scout16505 scout17217 scout17646 scout18962 scout23884 scout3572 ksocket-root scout10663 scout13732 scout16592 scout17362 scout17769 scout19072 scout24164 scout9300 lost+found scout.125 scout14672 scout16837 scout17405 scout17908 scout19268 scout2575 Regards, Nick _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From yoshihiro551230 @ bc.wakwak.com Wed May 26 14:49:40 2004 From: yoshihiro551230 @ bc.wakwak.com (Yoshihiro ISHIKAWA) Date: Wed, 26 May 2004 14:49:40 +0900 Subject: [SCore-users-jp] ULT: Exception Signal (11) References: <01a701c43d63$10c3f1b0$6f501da0@airfoceone> <3167918675.hori0006@swimmy-soft.com> Message-ID: <002001c442e5$3cff3a00$6f501da0@airfoceone> スイミー・ソフトウェア株式会社 堀 様 岩手大学の石川です.先日はありがとうございました. scored_devでULT: Exception Signal (11)が出たので それまでの出力をお送りいたします. よろしくお願い致します. ==================================== 岩手大学大学院工学研究科機械工学専攻 航空宇宙システム部門/船崎・山田研究室 修士課程2年 石川慶拓 Yoshihiro Ishikawa mail yoshihiro551230 @ bc.wakwak.com ==================================== ----- Original Message ----- From: "Atsushi HORI" To: ; Sent: Thursday, May 20, 2004 5:24 PM Subject: Re: [SCore-users-jp] ULT: Exception Signal (11) > 堀@スイミー・ソフトウェアです. > > >お送りするのは,ULT: Exception Signal (11)が出るまで > >の出力ということでよろしかったでしょうか? > > こっちでお願いします.大量でしょうか? > > ---- > 堀 敦史(ほり あつし) > スイミー・ソフトウェア株式会社 > > _______________________________________________ > SCore-users-jp mailing list > SCore-users-jp @ pccluster.org > http://www.pccluster.org/mailman/listinfo/score-users-jp > -------------- next part -------------- テキスト形式以外の添付ファイルを保管しました... ファイル名: score.log 型: application/octet-stream サイズ: 8305 バイト 説明: 無し URL: From yoshihiro551230 @ bc.wakwak.com Thu May 27 16:26:08 2004 From: yoshihiro551230 @ bc.wakwak.com (Yoshihiro ISHIKAWA) Date: Thu, 27 May 2004 16:26:08 +0900 Subject: [SCore-users-jp] ULT: Exception Signal (11) References: <01a701c43d63$10c3f1b0$6f501da0@airfoceone> <3168517875.hori000f@swimmy-soft.com> Message-ID: <000501c443bb$e11c9a70$6f501da0@airfoceone> 堀 様 岩手大学の石川です.お返事ありがとうございます. > すいませんが,unset DISPLAY (bash の場合)として,もう一度ログを取って > 頂けませんか? わかりました.環境変数DISPLAYをクリアして,もう一度ログを取ります. それと,ULT: Exception Signal (11)は排他的スケジューリングにしたとき に頻繁に起こっているようです. ==================================== 岩手大学大学院工学研究科機械工学専攻 航空宇宙システム部門/船崎・山田研究室 修士課程2年 石川慶拓 Yoshihiro Ishikawa mail yoshihiro551230 @ bc.wakwak.com ==================================== ----- Original Message ----- From: "Atsushi HORI" To: Sent: Thursday, May 27, 2004 3:51 PM Subject: Re: [SCore-users-jp] ULT: Exception Signal (11) > 堀@スイミー・ソフトウェアです. > > >scored_devでULT: Exception Signal (11)が出たので > >それまでの出力をお送りいたします. > > 折角ログを取って頂いたのに,一言忘れていました.ログでは残念ながら > DISPLAY 環境変数が適切に設定されていなかったので,どこで SIGSEGV が起 > きたか分かりませんでした. > > すいませんが,unset DISPLAY (bash の場合)として,もう一度ログを取って > 頂けませんか? > > ---- > 堀 敦史(ほり あつし) > スイミー・ソフトウェア株式会社 > > >