From c8538 @ st.cs.kumamoto-u.ac.jp Mon Dec 17 20:42:27 2001 From: c8538 @ st.cs.kumamoto-u.ac.jp (takuma) Date: Mon, 17 Dec 2001 20:42:27 +0900 Subject: [SCore-users-jp] =?iso-2022-jp?B?TlBCGyRCJEskRCQkJEYbKEI=?= Message-ID: <3C1DDA23.289354D9@st.cs.kumamoto-u.ac.jp> SCore4.2.1を使っています。性能を測定しようとベンチマークの結果が掲載され ていたNAS Parallel Benchmarks (NPB2.3) を使ってみようとして、いろいろ試 してみたのですがうまく利用できません。SCoreでは特殊な実行の仕方や設定が あるのでしょうか? できれば /NPB2.3/config/make.def  の設定を教えてほしいのですが、お願い します。 山本 From s-sumi @ trc.rwcp.or.jp Mon Dec 17 20:42:46 2001 From: s-sumi @ trc.rwcp.or.jp (=?iso-2022-jp?b?cy1zdW1pIBskQiF3GyhCIHRyYy5yd2NwLm9yLmpw?=) Date: Mon, 17 Dec 2001 20:42:46 +0900 Subject: [devel] [SCore-users-jp] =?ISO-2022-JP?B?TlBCGyRCJEskRCQkGyhC?= =?ISO-2022-JP?B?GyRCJEYbKEI=?= In-Reply-To: Your message of Mon, 17 Dec 2001 20:42:27 +0900. <3C1DDA23.289354D9@st.cs.kumamoto-u.ac.jp> Message-ID: <200112171142.fBHBgkY00470@pdsp39.trc.rwcp.or.jp> 新情報の住元です。 >>>>> "山本" == takuma writes: 山本> SCore4.2.1を使っています。性能を測定しようとベンチマークの結果が掲載され 山本> ていたNAS Parallel Benchmarks (NPB2.3) を使ってみようとして、いろいろ試 山本> してみたのですがうまく利用できません。SCoreでは特殊な実行の仕方や設定が 山本> あるのでしょうか? 山本> できれば /NPB2.3/config/make.def  の設定を教えてほしいのですが、お願い 山本> します。 RAND = randdp のほかは、SCore用のmpicc mpif77を指定してもらえれば、コンパイルできる はずです。ftだけは、ソースがf90のシンタックスを含んでいるため、g77では コンパイルできません。f90のシンタックスをサポートしたコンパイラをご利 用下さい。 どのようにうまく利用できないのでしょう? ----- 住元 真司 E-Mail: s-sumi @ trc.rwcp.or.jp 新情報処理開発機構  つくば研究センタ 並列分散システムソフトウェアつくば研究室 TEL:0298-53-1666 FAX:0298-53-1652 From s-sumi @ trc.rwcp.or.jp Tue Dec 18 13:16:05 2001 From: s-sumi @ trc.rwcp.or.jp (=?iso-2022-jp?b?cy1zdW1pIBskQiF3GyhCIHRyYy5yd2NwLm9yLmpw?=) Date: Tue, 18 Dec 2001 13:16:05 +0900 Subject: [devel] [SCore-users-jp] =?ISO-2022-JP?B?TlBCGyRCJEskRCQkGyhC?= =?ISO-2022-JP?B?GyRCJEYbKEI=?= In-Reply-To: Your message of Mon, 17 Dec 2001 20:42:46 +0900. <200112171142.fBHBgkY00470@pdsp39.trc.rwcp.or.jp> Message-ID: <200112180416.fBI4G5p06408@pdsp39.trc.rwcp.or.jp> 住元です。 以下の件ですが、make.defファイルの記述に問題があったとのことで、うまく コンパイルできたとのことです。 ご参考まで、、 ================================================================= Message-ID: <3C1EB8A8.67219F56 @ st.cs.kumamoto-u.ac.jp> Date: Tue, 18 Dec 2001 12:31:52 +0900 From: takuma X-Mailer: Mozilla 4.7 [ja] (WinNT; I) X-Accept-Language: ja MIME-Version: 1.0 To: s-sumi @ trc.rwcp.or.jp Subject: Re: [devel] [SCore-users-jp] NPBについて Content-Transfer-Encoding: 7bit X-UIDL: 40130b6cbdeec328553f96b2d622212f make.defファイルの設定で間違えていた所は MPIF77 = /opt/score/bin/mpif77 FLINK = /opt/score/bin/mpif77 FMPI_LIB =       ← -L/opt/score/mpi/mpich-1.2.0/i386-redhat7-linux2_4/lib -lmpi FMPI_INC = ← -I/opt/score/mpi/mpich-1.2.0/i386-redhat7-linux2_4/include MPICC= /opt/score/bin/mpicc CLINK = /opt/score/bin/mpicc CMPI_LIB =       ← -L/opt/score/mpi/mpich-1.2.0/i386-redhat7-linux2_4/lib -lmpi CMPI_INC =       ← -I/opt/score/mpi/mpich-1.2.0/i386-redhat7-linux2_4/include CC = -gcc ←/opt/score/bin/mpicc RAND = randdp ← ここを記入していない としていたところです。 山本 s-sumi @ trc.rwcp.or.jp wrote: > >>>>> "山本" == takuma writes: > 山本> 早いお返事ありがとうごさいます。 > 山本> その設定で行うとベンチマークをSCore上で動かすことができました。 > 山本> ありがとうございました。 > > 山本> 山本 > > 山本> s-sumi @ trc.rwcp.or.jp wrote: > > >> 住元です。 > >> > >> >>>>> "山本" == takuma writes: > >> 山本> お返事ありがとうございます。 > >> 山本> /NPB2.3/make.def のファイルの内容 > >> > >> CCは変更してはいけません。たぶんこれが問題と思いますが、、 > >> > >> これでだめなら、which mpif77 はどう出力されるしょうか? > >> どんなコンパイルエラーが出るのでしょう? > >> > >> 以下でできると思います。ほかの定義は省いてあります。 > >> ================================= > >> MPIF77 = /opt/score/bin/mpif77 > >> FLINK = /opt/score/bin/mpif77 > >> FMPI_LIB = > >> FMPI_INC = > >> > >> MPICC= /opt/score/bin/mpicc > >> CLINK = /opt/score/bin/mpicc > >> CMPI_LIB = > >> CMPI_INC = > >> > >> CC = gcc > >> > >> RAND = randdp > >> ================================= > >> > >> 山本> MPIF77 = mpif77 > >> 山本> FLINK = /opt/score/bin/mpif77 > >> 山本> FMPI_LIB = -L/opt/score/mpi/mpich-1.2.0/i386-redhat7-linux2_4/lib -lmpi > >> 山本> FMPI_INC = -I/opt/score/mpi/mpich-1.2.0/i386-redhat7-linux2_4/include > >> > >> 山本> MPICC= mpicc > >> 山本> CLINK = /opt/score/bin/mpicc > >> 山本> CMPI_LIB = -L/opt/score/mpi/mpich-1.2.0/i386-redhat7-linux2_4/lib -lmpi > >> 山本> CMPI_INC = -I/opt/score/mpi/mpich-1.2.0/i386-redhat7-linux2_4/include > >> > >> 山本> CC =/opt/score/bin/mpicc > >> > >> 山本> と設定しているのですが、コンパイルエラーが出てしまいます。設定が間違っているのでし > >> 山本> ょうか。 > >> > >> 山本> 山本 > >> > >> 山本> s-sumi @ trc.rwcp.or.jp wrote: > >> > >> >> 新情報の住元です。 > >> >> > >> >> >>>>> "山本" == takuma writes: > >> >> 山本> SCore4.2.1を使っています。性能を測定しようとベンチマークの結果が掲載され > >> >> 山本> ていたNAS Parallel Benchmarks (NPB2.3) を使ってみようとして、いろいろ試 > >> >> 山本> してみたのですがうまく利用できません。SCoreでは特殊な実行の仕方や設定が > >> >> 山本> あるのでしょうか? > >> >> > >> >> 山本> できれば /NPB2.3/config/make.def  の設定を教えてほしいのですが、お願い > >> >> 山本> します。 > >> >> > >> >> RAND = randdp > >> >> > >> >> のほかは、SCore用のmpicc mpif77を指定してもらえれば、コンパイルできる > >> >> はずです。ftだけは、ソースがf90のシンタックスを含んでいるため、g77では > >> >> コンパイルできません。f90のシンタックスをサポートしたコンパイラをご利 > >> >> 用下さい。 > >> >> > >> >> どのようにうまく利用できないのでしょう? ================================================================= ----- 住元 真司 E-Mail: s-sumi @ trc.rwcp.or.jp 新情報処理開発機構  つくば研究センタ 並列分散システムソフトウェアつくば研究室 TEL:0298-53-1666 FAX:0298-53-1652 From c8538 @ st.cs.kumamoto-u.ac.jp Wed Dec 19 17:58:20 2001 From: c8538 @ st.cs.kumamoto-u.ac.jp (takuma) Date: Wed, 19 Dec 2001 17:58:20 +0900 Subject: [SCore-users-jp] =?iso-2022-jp?B?GyRCJUElJyVDJS8lXSUkJXMlSDUhRz0kSyREJCQkRhsoQg==?= Message-ID: <3C2056AC.566FE43B@st.cs.kumamoto-u.ac.jp> チェックポイント機能について知りたいのですが、SCoreのドキュメントでは  SCore4.1の新機能     チェックポイントにおいてパリティディスクがサポートされ、ひとつの ホストがクラッシュし     ても復帰可能になりました。  ユーザーズガイド     チェックポインティングの制限      異なるノード上で再開することは出来ません。 並列プロセスはチェ ックポイントしたのと     同じノードで再開されます。 (この目的のため に、並列プロセスのマイグレーション機構     が 提供されます。) となっていますが、新しく他のノードで再開できるようになったのでしょうか。 またパリティディスクがサポートされたとなっていますが、パリティディスクを 設定したりするところがあるのでしょうか。チェックポイント機能について詳し く知りたいのですが。 山本 From hori @ swimmy-soft.com Wed Dec 19 18:20:48 2001 From: hori @ swimmy-soft.com (Atsushi HORI) Date: Wed, 19 Dec 2001 18:20:48 +0900 Subject: [devel] [SCore-users-jp] =?ISO-2022-JP?B?GyRCJUElJyVDJS8lXSUkJXMlSDUhRz0kSyREJCQkRhsoSg==?= In-Reply-To: <3C2056AC.566FE43B@st.cs.kumamoto-u.ac.jp> References: <3C2056AC.566FE43B@st.cs.kumamoto-u.ac.jp> Message-ID: <3091630848.hori0004@dns.bestsystems.co.jp> 堀@スイミー・ソフトウェアと申します.SCore 開発チームのメンバーで,チ ェックポイント関連の開発に関与しました. >となっていますが、新しく他のノードで再開できるようになったのでしょうか。 ここで32ホストでジョブが走っていたとします.そのうちの一つのホストが故 障した場合,そのホストを別なホストで置き換えた場合にのみ,ジョブの実行 が再開可能になった,ということです. つまりジョブ全体の実行を全く別な32ホストで再開することはできません. >またパリティディスクがサポートされたとなっていますが、パリティディスクを >設定したりするところがあるのでしょうか。チェックポイント機能について詳し >く知りたいのですが。 パリティがサポートされただけで RAID で言うところの「パリティディスク」 がサポートされた訳ではありません.SCore のチェックポイントのパリティは 良く知られている RAID のそれとは異なります.RAID は(基本的に)パリティ を専用のディスクに保存しますが,SCore の場合,パリティ(ブロック)はチェ ックポイントファイルの中に埋め込まれています.したがい,専用のパリティ ディスクは必要ありませんし,設定することは何もありません. 蛇足ですが,私は RAID の方式を「水平パリティ」,SCore の方式を「垂直パ リティ」と呼んでいます.垂直パリティ方式では,原理的に,各ホスト上のフ ァイルの大きさが N/(N-1) 倍になります(ここで N はホスト数.各ホスト上 のファイルが全て同じ大きさの場合). 一方,制約として2ホスト以上で走行するジョブでしかパリティの恩恵にあず かることはできません. From c8538 @ st.cs.kumamoto-u.ac.jp Wed Dec 19 18:49:58 2001 From: c8538 @ st.cs.kumamoto-u.ac.jp (takuma) Date: Wed, 19 Dec 2001 18:49:58 +0900 Subject: [devel] [SCore-users-jp] =?iso-2022-jp?B?GyRCJUElJyVDJS8lXSUkGyhC?= =?iso-2022-jp?B?GyRCJXMlSDUhRz0kSyREJCQkRhsoQg==?= References: <3C2056AC.566FE43B@st.cs.kumamoto-u.ac.jp> <3091630848.hori0004@dns.bestsystems.co.jp> Message-ID: <3C2062C6.AC85EAD8@st.cs.kumamoto-u.ac.jp> ありがとうございました。 >そのホストを別なホストで置き換えた場合にのみ とありますが例えば64台のホストがあるとします。そのうち32ホストでジョブを走ら せ、その1つが故障した場合、残りの32台のうち1台が置き換わるのでしょうか。そ の1台は自動に選択されるのでしょうか。 また同時に2台以上が故障した場合は再開不可能ですよね。 山本 Atsushi HORI wrote: > 堀@スイミー・ソフトウェアと申します.SCore 開発チームのメンバーで,チ > ェックポイント関連の開発に関与しました. > > >となっていますが、新しく他のノードで再開できるようになったのでしょうか。 > > ここで32ホストでジョブが走っていたとします.そのうちの一つのホストが故 > 障した場合,そのホストを別なホストで置き換えた場合にのみ,ジョブの実行 > が再開可能になった,ということです. > > つまりジョブ全体の実行を全く別な32ホストで再開することはできません. > > >またパリティディスクがサポートされたとなっていますが、パリティディスクを > >設定したりするところがあるのでしょうか。チェックポイント機能について詳し > >く知りたいのですが。 > > パリティがサポートされただけで RAID で言うところの「パリティディスク」 > がサポートされた訳ではありません.SCore のチェックポイントのパリティは > 良く知られている RAID のそれとは異なります.RAID は(基本的に)パリティ > を専用のディスクに保存しますが,SCore の場合,パリティ(ブロック)はチェ > ックポイントファイルの中に埋め込まれています.したがい,専用のパリティ > ディスクは必要ありませんし,設定することは何もありません. > > 蛇足ですが,私は RAID の方式を「水平パリティ」,SCore の方式を「垂直パ > リティ」と呼んでいます.垂直パリティ方式では,原理的に,各ホスト上のフ > ァイルの大きさが N/(N-1) 倍になります(ここで N はホスト数.各ホスト上 > のファイルが全て同じ大きさの場合). > > 一方,制約として2ホスト以上で走行するジョブでしかパリティの恩恵にあず > かることはできません. From hori @ swimmy-soft.com Wed Dec 19 18:53:57 2001 From: hori @ swimmy-soft.com (Atsushi HORI) Date: Wed, 19 Dec 2001 18:53:57 +0900 Subject: [devel] [SCore-users-jp] =?ISO-2022-JP?B?GyRCJUElJyVDJS8lXSUkJXMlSDUhRz0kSyREJCQkRhsoSg==?= In-Reply-To: <3C2062C6.AC85EAD8@st.cs.kumamoto-u.ac.jp> References: <3C2056AC.566FE43B@st.cs.kumamoto-u.ac.jp> Message-ID: <3091632837.hori0006@dns.bestsystems.co.jp> 堀@スイミー・ソフトウェアです. >とありますが例えば64台のホストがあるとします。そのうち32ホストでジョブを走ら >せ、その1つが故障した場合、残りの32台のうち1台が置き換わるのでしょうか。そ >の1台は自動に選択されるのでしょうか。 SCore ではクラスタをどのように構成するかというデータベースがあり,クラ スタを構成するホストについては「故障したらこのホストで代替する」という 記述ができるようになっています. おっしゃるようなことは,そのようにデータベースにそのような記述があれば そうなります.しかし,そうすると,別に64台のホストで走る並列ジョブがあ ったとすると,置き換えてしまった後は63台しかありませんから,そのジョブ は実行を再開できなくなってしまいます. 想定しているのは,64台とは別にホットスタンバイしているホストがあって, 故障したホストはそれに置き換わる,というシナリオです. もちろん同時に2台故障した場合は復帰できません.RAID だってそうですよね? From c8538 @ st.cs.kumamoto-u.ac.jp Wed Dec 19 19:35:24 2001 From: c8538 @ st.cs.kumamoto-u.ac.jp (takuma) Date: Wed, 19 Dec 2001 19:35:24 +0900 Subject: [devel] [SCore-users-jp] =?iso-2022-jp?B?GyRCJUElJyVDJS8lXSUkGyhC?= =?iso-2022-jp?B?GyRCJXMlSDUhRz0kSyREJCQkRhsoQg==?= References: <3C2056AC.566FE43B@st.cs.kumamoto-u.ac.jp> <3091632837.hori0006@dns.bestsystems.co.jp> Message-ID: <3C206D6C.7DC5C420@st.cs.kumamoto-u.ac.jp> ありがとうございます。再開の仕組みはわかりました。 scorehosts.db 内に spare で記述すればいいんですね。 山本     Atsushi HORI wrote: > 堀@スイミー・ソフトウェアです. > > >とありますが例えば64台のホストがあるとします。そのうち32ホストでジョブを走ら > >せ、その1つが故障した場合、残りの32台のうち1台が置き換わるのでしょうか。そ > >の1台は自動に選択されるのでしょうか。 > > SCore ではクラスタをどのように構成するかというデータベースがあり,クラ > スタを構成するホストについては「故障したらこのホストで代替する」という > 記述ができるようになっています. > > おっしゃるようなことは,そのようにデータベースにそのような記述があれば > そうなります.しかし,そうすると,別に64台のホストで走る並列ジョブがあ > ったとすると,置き換えてしまった後は63台しかありませんから,そのジョブ > は実行を再開できなくなってしまいます. > > 想定しているのは,64台とは別にホットスタンバイしているホストがあって, > 故障したホストはそれに置き換わる,というシナリオです. > > もちろん同時に2台故障した場合は復帰できません.RAID だってそうですよね? > > _______________________________________________ > SCore-users-jp mailing list > SCore-users-jp @ pccluster.org > http://www.pccluster.org/mailman/listinfo/score-users-jp From yamanaka @ exassia.tmit.ac.jp Wed Dec 19 22:08:19 2001 From: yamanaka @ exassia.tmit.ac.jp (Yamanaka Kenshi) Date: Wed, 19 Dec 2001 22:08:19 +0900 Subject: [SCore-users-jp] Red Hat7.2 on SCore4.2.1 Message-ID: <20011219220819.60c1d72b.yamanaka@exassia.tmit.ac.jp> SCore4.2.1をRed Hat 7.2上で動かす事が出来ました。 計算ホストにはオリジナルのKernel2.4.10にExt3のパッチとSCoreのパッチを当てています。 Kernelの設定はRed Hat 7.2のオリジナルの設定を使い、ReiserFSとExt3FSをモジュールではなくスタティックに組み込んでいます。 インストールにはEITではなくbininstallを用いています。 また、完全に動作確認していませんがIntelのコンパイラーとgcc3も設定してあげれば動作するようです。 以上、簡単ですが動作確認の報告です。 *----------------------------* 都立科学技術大学 大学院 白鳥研究室 山中賢史 yamanaka @ exassia.tmit.ac.jp http://exassia.tmit.ac.jp *----------------------------* From ishikawa @ rwcp.or.jp Thu Dec 20 10:41:50 2001 From: ishikawa @ rwcp.or.jp (=?iso-2022-jp?b?aXNoaWthd2EgGyRCIXcbKEIgcndjcC5vci5qcA==?=) Date: Thu, 20 Dec 2001 10:41:50 +0900 Subject: [SCore-users-jp] [SCore-users] Closing http://pdswww.rwcp.or.jp/ Message-ID: <20011220104150D.ishikawa@rwcp.or.jp> Dear SCore users, http://pdswww.rwcp.or.jp/ is closed today. Please look at http://www.pccluster.org/index-e.html for English or http://www.pccluster.org/ for Japanese which is the PC cluster consortium URL. We continue to support the SCore system software at the PC cluster consortium. We are still moving to the consortium, but at least you may download the latest SCore, version 4.2.1. -- Yutaka _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From liu @ mpcnet.co.jp Thu Dec 20 15:38:09 2001 From: liu @ mpcnet.co.jp (=?iso-2022-jp?B?GyRCTi0zWD82GyhCXChMSVUgWFVFWkhFTlwp?=) Date: Thu, 20 Dec 2001 15:38:09 +0900 Subject: [SCore-users-jp] help Message-ID: <00bf01c18920$e41896a0$3302c9a0@IWS0098> EXPERTの皆様 SCore4.2(RedHat7.1)をインストールして、 scrun -nodes=8x2 /opt/score/demo/bin/mandel で、テストしたところ、 <0> SCore-D:WARNING Unable to open PM myrinet/myrinet (error=19). <0> SCore-D:WARNING argv[0] -config <0> SCore-D:WARNING argv[1] /var/scored/scoreboard/server2.0000B200Gc5w <0> SCore-D:WARNING argv[2] -firmware <0> SCore-D:WARNING argv[3] /var/scored/scoreboard/server2.0000B200CR8v <0> SCore-D:ERROR No PM device opened. のメッセージが出て、実行できませんでした。 原因と対処方法を教えて頂けませんか。 よろしくお願い致します。 劉 From kameyama @ pccluster.org Thu Dec 20 16:30:52 2001 From: kameyama @ pccluster.org (Toyohisa Kameyama) Date: Thu, 20 Dec 2001 16:30:52 +0900 Subject: [devel] [SCore-users-jp] help In-Reply-To: Your message of Thu, 20 Dec 2001 15:38:09 +0900. <00bf01c18920$e41896a0$3302c9a0@IWS0098> Message-ID: <200112200730.fBK7Uq314746@pccluster.org> $B55;3$G$9(B. In article <00bf01c18920$e41896a0$3302c9a0 @ IWS0098> =?iso-2022-jp?B?GyRCTi0zWD82GyhCXChMSVUgWFVFWkhFTlwp?= writes: > SCore4.2(RedHat7.1)$B$r%$%s%9%H!<%k$7$F!"(B > > scrun -nodes=8x2 /opt/score/demo/bin/mandel $B$G!"%F%9%H$7$?$H$3$m!"(B > > <0> SCore-D:WARNING Unable to open PM myrinet/myrinet (error=19). > <0> SCore-D:WARNING argv[0] -config > <0> SCore-D:WARNING argv[1] /var/scored/scoreboard/server2.0000B200Gc5w > <0> SCore-D:WARNING argv[2] -firmware > <0> SCore-D:WARNING argv[3] /var/scored/scoreboard/server2.0000B200CR8v > <0> SCore-D:ERROR No PM device opened. > > $B$N%a%C%;!<%8$,=P$F!"l9g(B, /opt/score/install/mkpmmyridev $B$rl9g(B, kernel $B$K(B myrinet driver $B$,AH$_9~$^$l$F$$$J$$(B $B2DG=@-$,9b$$$G$9(B. patch $B$NEv$?$C$?%+!<%M%k$,$&$4$$$F$$$k$+$I$&$+3NG'$7$F2<$5$$(B. from Kameyama Toyohisa