From m-kawaguchi @ pst.fujitsu.com Mon May 16 14:14:39 2005 From: m-kawaguchi @ pst.fujitsu.com (Mitsugu Kawaguchi) Date: Mon, 16 May 2005 14:14:39 +0900 Subject: [SCore-users-jp] SCoreのサマータイム対応について Message-ID: <001f01c559d6$29191430$570aa8c0@Globus> SCore開発関係者様 富士通プライムソフトテクノロジの川口と申します。 掲題の件について、お分かりになるようでしたら教えてください。 将来的にどうなるか分かりませんが、 仮に日本でサマータイム制が導入された場合、 時間切り替え時におけるSCoreへの影響は 何が考えられるのでしょうか? とりあえず、影響がありそうと思われるものとして、 以下があるのではないかと推測しています。 【scrun実行中に切り替え発生した場合】  ・ scrun statisticsオプション指定時のelapse時間  ・ チェックポイント採取間隔指定  ・ sc_watch? 【scrun未実行時に切り替え発生した場合】  ・ 特になし? お忙しいところ申し訳ありませんが、宜しくお願いします。 --- 川口: m-kawaguchi @ pst.fujitsu.com From kameyama @ pccluster.org Mon May 16 15:00:21 2005 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Mon, 16 May 2005 15:00:21 +0900 Subject: [SCore-users-jp] SCoreのサマータイム対応について In-Reply-To: Your message of "Mon, 16 May 2005 14:14:39 JST." <001f01c559d6$29191430$570aa8c0@Globus> Message-ID: <20050516060021.6A3AD21EF52@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <001f01c559d6$29191430$570aa8c0 @ Globus> "Mitsugu Kawaguchi" wrotes: > 将来的にどうなるか分かりませんが、 > 仮に日本でサマータイム制が導入された場合、 > 時間切り替え時におけるSCoreへの影響は > 何が考えられるのでしょうか? サマータイムが問題になるのでしたら, すでに score-users あたりから文句が来ているような... > とりあえず、影響がありそうと思われるものとして、 > 以下があるのではないかと推測しています。 SCore における時間はたいてい gettimeofday(2) を使用していますが, man page から判断すると, この system call は夏時間を考慮しないようです. よって, 影響は sc_watch の出力程度ですみそうな気がします. from Kameyama Toyohisa From matsuoka @ ap.jp.nec.com Mon May 16 15:38:55 2005 From: matsuoka @ ap.jp.nec.com (matsuoka) Date: Mon, 16 May 2005 15:38:55 +0900 Subject: [SCore-users-jp] SCoreのサマータイム対応について In-Reply-To: <001f01c559d6$29191430$570aa8c0@Globus> References: <001f01c559d6$29191430$570aa8c0@Globus> Message-ID: <42883FFF.5050808@ap.jp.nec.com> 松岡です。 先日の夏時間に関する質問ですが、 こんな質問がでてました。 富士通も関係しているのかな... --- 松岡 Mitsugu Kawaguchi wrote: > SCore開発関係者様 > > 富士通プライムソフトテクノロジの川口と申します。 > 掲題の件について、お分かりになるようでしたら教えてください。 > > 将来的にどうなるか分かりませんが、 > 仮に日本でサマータイム制が導入された場合、 > 時間切り替え時におけるSCoreへの影響は > 何が考えられるのでしょうか? > とりあえず、影響がありそうと思われるものとして、 > 以下があるのではないかと推測しています。 > > 【scrun実行中に切り替え発生した場合】 >  ・ scrun statisticsオプション指定時のelapse時間 >  ・ チェックポイント採取間隔指定 >  ・ sc_watch? > > 【scrun未実行時に切り替え発生した場合】 >  ・ 特になし? > > お忙しいところ申し訳ありませんが、宜しくお願いします。 > > --- > 川口: m-kawaguchi @ pst.fujitsu.com > > _______________________________________________ > SCore-users-jp mailing list > SCore-users-jp @ pccluster.org > http://www.pccluster.org/mailman/listinfo/score-users-jp > From matsuoka @ ap.jp.nec.com Mon May 16 15:56:37 2005 From: matsuoka @ ap.jp.nec.com (matsuoka) Date: Mon, 16 May 2005 15:56:37 +0900 Subject: [SCore-users-jp] SCoreのサマータイム対応について In-Reply-To: <42883FFF.5050808@ap.jp.nec.com> References: <001f01c559d6$29191430$570aa8c0@Globus> <42883FFF.5050808@ap.jp.nec.com> Message-ID: <42884425.40108@ap.jp.nec.com> 松岡です。 関係者の皆さん、申し訳ありません。 宛先を間違えてしまい、 関係のないメールを送付してしました。 お気を悪くされたなら申し訳ありません。 >川口さん。 --- 松岡 matsuoka wrote: > 松岡です。 > > 先日の夏時間に関する質問ですが、 > こんな質問がでてました。 > > 富士通も関係しているのかな... > > --- > 松岡 > > Mitsugu Kawaguchi wrote: > >>SCore開発関係者様 >> >>富士通プライムソフトテクノロジの川口と申します。 >>掲題の件について、お分かりになるようでしたら教えてください。 >> >>将来的にどうなるか分かりませんが、 >>仮に日本でサマータイム制が導入された場合、 >>時間切り替え時におけるSCoreへの影響は >>何が考えられるのでしょうか? >>とりあえず、影響がありそうと思われるものとして、 >>以下があるのではないかと推測しています。 >> >>【scrun実行中に切り替え発生した場合】 >> ・ scrun statisticsオプション指定時のelapse時間 >> ・ チェックポイント採取間隔指定 >> ・ sc_watch? >> >>【scrun未実行時に切り替え発生した場合】 >> ・ 特になし? >> >>お忙しいところ申し訳ありませんが、宜しくお願いします。 >> >>--- >>川口: m-kawaguchi @ pst.fujitsu.com >> >>_______________________________________________ >>SCore-users-jp mailing list >>SCore-users-jp @ pccluster.org >>http://www.pccluster.org/mailman/listinfo/score-users-jp >> > > > From m-kawaguchi @ pst.fujitsu.com Mon May 16 16:53:52 2005 From: m-kawaguchi @ pst.fujitsu.com (Mitsugu Kawaguchi) Date: Mon, 16 May 2005 16:53:52 +0900 Subject: [SCore-users-jp] SCoreのサマータイム対応について In-Reply-To: <20050516060021.6A3AD21EF52@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <002a01c559ec$67793dc0$570aa8c0@Globus> 亀山様 富士通プライムソフトテクノロジの川口です。 迅速なご回答、どうもありがとうございました。 これからも宜しくお願いします。 > -----Original Message----- > From: score-users-jp-admin @ pccluster.org > [mailto:score-users-jp-admin @ pccluster.org] On Behalf Of > kameyama @ pccluster.org > Sent: Monday, May 16, 2005 3:00 PM > To: Mitsugu Kawaguchi > Cc: score-users-jp @ pccluster.org > Subject: Re: [SCore-users-jp] SCoreのサマータイム対応について > > > 亀山です. > > In article <001f01c559d6$29191430$570aa8c0 @ Globus> "Mitsugu > Kawaguchi" wrotes: > > 将来的にどうなるか分かりませんが、 > > 仮に日本でサマータイム制が導入された場合、 > > 時間切り替え時におけるSCoreへの影響は > > 何が考えられるのでしょうか? > > サマータイムが問題になるのでしたら, すでに score-users > あたりから文句が来ているような... > > > とりあえず、影響がありそうと思われるものとして、 > > 以下があるのではないかと推測しています。 > > SCore における時間はたいてい gettimeofday(2) を使用していますが, > man page から判断すると, この system call は夏時間を考慮しないようです. > よって, 影響は sc_watch の出力程度ですみそうな気がします. > > from Kameyama Toyohisa > _______________________________________________ > SCore-users-jp mailing list > SCore-users-jp @ pccluster.org > http://www.pccluster.org/mailman/listinfo/score-users-jp > --- 川口: m-kawaguchi @ pst.fujitsu.com From naoki.sugitani @ zx.necel.com Mon May 16 20:37:51 2005 From: naoki.sugitani @ zx.necel.com (naoki sugitani) Date: Mon, 16 May 2005 20:37:51 +0900 Subject: [SCore-users-jp] scoutがダンマリます Message-ID: <008601c55a0b$b1074170$2c531e0a@SDLPC44> 杉谷@NECエレクトロニクスと申します。 毎々お世話になっております。 以下の環境でSCoreをインストールしました。 SCOUTテスト手順に従い動作確認を行いましたが、scoutがダンマリます。 管理ノード  OS :RH 7.3(Kernel 2.4.18)  CPU :Intel P-3 1.4GHz  SCore :5.4.0 計算ノード(3台)  OS :RH 7.3(Kernel 2.4.18)  CPU :Intel P-3 1.2GHz × 2  SCore :5.4.0 scout -g pccall を実行するとプロンプトに戻りません。 msgb -group pccall & で表示されるウィンドウのhost01〜host03は赤くなります。 MLのアーカイブ(2003-November)に同様の質問がありましたので、 その回答にありました以下の確認を行いました。 # rsh-all -g pccall /opt/score/deploy/hostname-check `scorehosts pccall` 3 hosts found. host01.local host02.local host03.local host01.local: host01.local is OK host01.local: host02.local is OK host01.local: host03.local is OK host03.local: host01.local is OK host03.local: host02.local is OK host03.local: host03.local is OK host02.local: host01.local is OK host02.local: host02.local is OK host02.local: host03.local is OK 各計算ノードの/etc/hosts.equivは全て以下のようになっております。 hostgw.local host01.local host02.local host03.local host04.local 上記以外に何を調べればよいでしょうか。 ご教示のほどよろしくお願いします。 From kameyama @ pccluster.org Tue May 17 09:16:46 2005 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Tue, 17 May 2005 09:16:46 +0900 Subject: [SCore-users-jp] scoutがダンマリます In-Reply-To: Your message of "Mon, 16 May 2005 20:37:51 JST." <008601c55a0b$b1074170$2c531e0a@SDLPC44> Message-ID: <20050517001646.C567321EF52@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <008601c55a0b$b1074170$2c531e0a @ SDLPC44> "naoki sugitani" wrotes: > 以下の環境でSCoreをインストールしました。 > SCOUTテスト手順に従い動作確認を行いましたが、scoutがダンマリます。 > > 管理ノード >  OS :RH 7.3(Kernel 2.4.18) >  CPU :Intel P-3 1.4GHz >  SCore :5.4.0 > > 計算ノード(3台) >  OS :RH 7.3(Kernel 2.4.18) >  CPU :Intel P-3 1.2GHz × 2 >  SCore :5.4.0 > > scout -g pccall を実行するとプロンプトに戻りません。 scout を起動すると, SCout: Spawning host01.local SCout: Spawning host02.local SCout: Spawning host03.local Scout: session started というように表示してプロンプトが出るはずなのですが, このメッセージは出力していますでしょうか? それとも全く出力されていないでしょうか? (host01 が表示されているとき, 実際は host02 につなぎにいっている ことがあるので, 全面的には信用できないところもありますが, なくてもどのあたりまでまで動いているか見当をつけることができると思います.) もしくは, % scout -debug -g pccall とするともうすこし詳しいメッセージが出ます. この出力を送ってくださるともっと原因がわかるかも知れません. > MLのアーカイブ(2003-November)に同様の質問がありましたので、 > その回答にありました以下の確認を行いました。 > > # rsh-all -g pccall /opt/score/deploy/hostname-check `scorehosts pccall` root で実行する場合, rsh は /etc/hosts.equiv は見ないので /root/.rhosts が /etc/hosts.equiv と同様の内容になっているか確認してください. (scoutd が /etc/hosts.equiv を見るように動いていれば /root/.rhosts は 関係ないのですが...) from Kameyama Toyohisa From naoki.sugitani @ zx.necel.com Tue May 17 10:07:27 2005 From: naoki.sugitani @ zx.necel.com (naoki sugitani) Date: Tue, 17 May 2005 10:07:27 +0900 Subject: [SCore-users-jp] scoutがダンマリます References: <20050517001646.C567321EF52@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <001201c55a7c$cb2a03a0$2c531e0a@SDLPC44> To: 亀山 殿 杉谷@NECエレクトロニクスです 毎々お世話になっております。 早速の回答ありがとうございます。 > scout を起動すると, > SCout: Spawning host01.local > SCout: Spawning host02.local > SCout: Spawning host03.local > Scout: session started > というように表示してプロンプトが出るはずなのですが, > このメッセージは出力していますでしょうか? > それとも全く出力されていないでしょうか? > (host01 が表示されているとき, 実際は host02 につなぎにいっている > ことがあるので, 全面的には信用できないところもありますが, > なくてもどのあたりまでまで動いているか見当をつけることができると思います.) 上記メッセージを表示せずにダンマリます。 > もしくは, > % scout -debug -g pccall > とするともうすこし詳しいメッセージが出ます. > この出力を送ってくださるともっと原因がわかるかも知れません. 上記コマンドを実行したところ、以下のメッセージを出力してダンマリます。 # scout -debug -g pccall {BEP} backend_proc(0) {BEP} backend_proc(first=0,nhosts=3) {BEP} > spawn_next_proc() {BEP} spawn_next_proc(/opt/score5.4.0/deploy/scremote 0 cftpc1.ulsys.lsi.nec.c o.jp 32911 cftpc1.ulsys.lsi.nec.co.jp 32911 1 0) {BEP} < spawn_next_proc() > > MLのアーカイブ(2003-November)に同様の質問がありましたので、 > > その回答にありました以下の確認を行いました。 > > > > # rsh-all -g pccall /opt/score/deploy/hostname-check `scorehosts pccall` > > root で実行する場合, rsh は /etc/hosts.equiv は見ないので > /root/.rhosts > が /etc/hosts.equiv と同様の内容になっているか確認してください. > (scoutd が /etc/hosts.equiv を見るように動いていれば /root/.rhosts は > 関係ないのですが...) /root/.rhostsはIPアドレスで記述してありますが、全ノード共に正しく設定されて おります。 なお、PM/Myrinetのループバックテストは全ノード正常終了します。 しかし、SCore-Dテスト手順では以下のエラーとなりました。 # scrun -nodes=1 ./hello FEP:ERROR Neither SCOUT environment nor SCore-D server. 以上、よろしくお願いします。 From hori @ streamline-computing.com Tue May 17 10:24:16 2005 From: hori @ streamline-computing.com (Atsushi HORI) Date: Tue, 17 May 2005 10:24:16 +0900 Subject: [SCore-users-jp] scoutがダンマリます In-Reply-To: <001201c55a7c$cb2a03a0$2c531e0a@SDLPC44> References: <20050517001646.C567321EF52@neal.il.is.s.u-tokyo.ac.jp> <001201c55a7c$cb2a03a0$2c531e0a@SDLPC44> Message-ID: <59e2c884244f222ec5f64847ea2ddd12@streamline-computing.com> 堀@Allinea です。 On 2005/05/17, at 10:07, naoki sugitani wrote: > 上記コマンドを実行したところ、以下のメッセージを出力してダンマリます。 > # scout -debug -g pccall > {BEP} backend_proc(0) > {BEP} backend_proc(first=0,nhosts=3) > {BEP} > spawn_next_proc() > {BEP} spawn_next_proc(/opt/score5.4.0/deploy/scremote 0 > cftpc1.ulsys.lsi.nec.c > o.jp 32911 cftpc1.ulsys.lsi.nec.co.jp 32911 1 0) > {BEP} < spawn_next_proc() うん、これって spawn_next_proc(/opt/score5.4.0/deploy/scremote ... が失 敗しているようですね。 1. /opt/score5.4.0/deploy/scremote が存在するかどうか、 2. /opt/score5.4.0/deploy/bin.*****/scremote.exe が存在するかどうか 3. /opt/score5.4.0/deploy/scremote が cftpc1.ulsys.lsi.nec.co.jp 上で実 行できるかどうか を調べれば原因が分かると思います。 From kameyama @ pccluster.org Tue May 17 10:29:26 2005 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Tue, 17 May 2005 10:29:26 +0900 Subject: [SCore-users-jp] scoutがダンマリます In-Reply-To: Your message of "Tue, 17 May 2005 10:07:27 JST." <001201c55a7c$cb2a03a0$2c531e0a@SDLPC44> Message-ID: <20050517012926.2A88C21EF52@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <001201c55a7c$cb2a03a0$2c531e0a @ SDLPC44> "naoki sugitani" wrotes: > > もしくは, > > % scout -debug -g pccall > > とするともうすこし詳しいメッセージが出ます. > > この出力を送ってくださるともっと原因がわかるかも知れません. > > 上記コマンドを実行したところ、以下のメッセージを出力してダンマリます。 > # scout -debug -g pccall > {BEP} backend_proc(0) > {BEP} backend_proc(first=0,nhosts=3) > {BEP} > spawn_next_proc() > {BEP} spawn_next_proc(/opt/score5.4.0/deploy/scremote 0 > cftpc1.ulsys.lsi.nec.c > o.jp 32911 cftpc1.ulsys.lsi.nec.co.jp 32911 1 0) > {BEP} < spawn_next_proc() scout を起動した host の official name が cftpc1.ulsys.lsi.nec.co.jp になっているようです. (前の mail から推測すると, この host は ether が 2 枚以上ささっていて compute host につながっていないほうの hostname がついているのでは ないかと思いますが...) 最初の compute host は cftpc1.ulsys.lsi.nec.co.jp の scout に接続しようとします. しかし, compute host のほうではこの名前の解決ができないか, 解決できても network unreachable になってしまうのではないでしょうか? scout を起動する host の hostname を compute host 側の hostgw.local に変更するか, compute host から cftpc1.ulsys.lsi.nec.co.jp で 接続できるようにするかすれば動くと思います. > なお、PM/Myrinetのループバックテストは全ノード正常終了します。 > しかし、SCore-Dテスト手順では以下のエラーとなりました。 SCore-D を動かすためには scout 環境である必要があります. (multi user mode ならばその必要はありませんが, multi user mode で SCore-D を動かすときに scout 環境にいる必要があります.) というわけで, 先に scout を動かさないといけないことになります. from Kameyama Toyohisa From naoki.sugitani @ zx.necel.com Tue May 17 10:48:29 2005 From: naoki.sugitani @ zx.necel.com (naoki sugitani) Date: Tue, 17 May 2005 10:48:29 +0900 Subject: [SCore-users-jp] scoutがダンマリます References: <20050517012926.2A88C21EF52@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <001f01c55a82$8665bd30$2c531e0a@SDLPC44> To: 亀山 殿 杉谷@NECエレクトロニクスです 毎々お世話になっております。 計算ノードの/etc/hostsにcftpc1.ulsys.lsi.nec.co.jp を追加することで scoutが動作するようになりました。 ご指導ありがとうございました。 > 亀山です. > > In article <001201c55a7c$cb2a03a0$2c531e0a @ SDLPC44> "naoki sugitani" wrotes: > > > もしくは, > > > % scout -debug -g pccall > > > とするともうすこし詳しいメッセージが出ます. > > > この出力を送ってくださるともっと原因がわかるかも知れません. > > > > 上記コマンドを実行したところ、以下のメッセージを出力してダンマリます。 > > # scout -debug -g pccall > > {BEP} backend_proc(0) > > {BEP} backend_proc(first=0,nhosts=3) > > {BEP} > spawn_next_proc() > > {BEP} spawn_next_proc(/opt/score5.4.0/deploy/scremote 0 > > cftpc1.ulsys.lsi.nec.c > > o.jp 32911 cftpc1.ulsys.lsi.nec.co.jp 32911 1 0) > > {BEP} < spawn_next_proc() > > scout を起動した host の official name が > cftpc1.ulsys.lsi.nec.co.jp > になっているようです. > (前の mail から推測すると, この host は ether が 2 枚以上ささっていて > compute host につながっていないほうの hostname がついているのでは > ないかと思いますが...) > 最初の compute host は cftpc1.ulsys.lsi.nec.co.jp の > scout に接続しようとします. > しかし, compute host のほうではこの名前の解決ができないか, > 解決できても network unreachable になってしまうのではないでしょうか? > > scout を起動する host の hostname を compute host 側の > hostgw.local > に変更するか, compute host から cftpc1.ulsys.lsi.nec.co.jp で > 接続できるようにするかすれば動くと思います. > > > なお、PM/Myrinetのループバックテストは全ノード正常終了します。 > > しかし、SCore-Dテスト手順では以下のエラーとなりました。 > > SCore-D を動かすためには scout 環境である必要があります. > (multi user mode ならばその必要はありませんが, multi user mode > で SCore-D を動かすときに scout 環境にいる必要があります.) > というわけで, 先に scout を動かさないといけないことになります. > > from Kameyama Toyohisa > _______________________________________________ > SCore-users-jp mailing list > SCore-users-jp @ pccluster.org > http://www.pccluster.org/mailman/listinfo/score-users-jp From naoki.sugitani @ zx.necel.com Tue May 17 10:50:04 2005 From: naoki.sugitani @ zx.necel.com (naoki sugitani) Date: Tue, 17 May 2005 10:50:04 +0900 Subject: [SCore-users-jp] scoutがダンマリます References: <20050517001646.C567321EF52@neal.il.is.s.u-tokyo.ac.jp> <001201c55a7c$cb2a03a0$2c531e0a@SDLPC44> <59e2c884244f222ec5f64847ea2ddd12@streamline-computing.com> Message-ID: <002401c55a82$bf346ee0$2c531e0a@SDLPC44> To: 堀 殿 杉谷@NECエレクトロニクスです 毎々お世話になっております。 亀山殿のご指摘にて解決致しました。 アドバイスありがとうございました。 > > 堀@Allinea です。 > > On 2005/05/17, at 10:07, naoki sugitani wrote: > > > 上記コマンドを実行したところ、以下のメッセージを出力してダンマリます。 > > # scout -debug -g pccall > > {BEP} backend_proc(0) > > {BEP} backend_proc(first=0,nhosts=3) > > {BEP} > spawn_next_proc() > > {BEP} spawn_next_proc(/opt/score5.4.0/deploy/scremote 0 > > cftpc1.ulsys.lsi.nec.c > > o.jp 32911 cftpc1.ulsys.lsi.nec.co.jp 32911 1 0) > > {BEP} < spawn_next_proc() > > うん、これって spawn_next_proc(/opt/score5.4.0/deploy/scremote ... が失 > 敗しているようですね。 > > 1. /opt/score5.4.0/deploy/scremote が存在するかどうか、 > 2. /opt/score5.4.0/deploy/bin.*****/scremote.exe が存在するかどうか > 3. /opt/score5.4.0/deploy/scremote が cftpc1.ulsys.lsi.nec.co.jp 上で実 > 行できるかどうか > > を調べれば原因が分かると思います。 > > _______________________________________________ > SCore-users-jp mailing list > SCore-users-jp @ pccluster.org > http://www.pccluster.org/mailman/listinfo/score-users-jp > From jure.jerman @ rzs-hm.si Wed May 18 19:46:03 2005 From: jure.jerman @ rzs-hm.si (Jure Jerman) Date: Wed, 18 May 2005 12:46:03 +0200 Subject: [SCore-users-jp] [SCore-users] Two problems with SCore Message-ID: <428B1CEB.1090608@rzs-hm.si> Hello, after long time of inactivity we started to deal with ULT:Panic problem again (see score-mailing-list http://www.pccluster.org/pipermail/score-users/2004-December/002305.html) Just to recall the situation: -we are running SCore 5.8.2 on 14 node dual Xeon cluster -we had sudden (and unrepeatable) resets of score where score died with ULT:PANIC error. At that time the conclusion was that we can avoid ULT:PANIC type of errors with running application not just on one node but on several. Now we have the same time of problems (ULT:PANIC) with the code compiled with Intel fortran compiler even running on several nodes. The very same code compiled with Lahey/Fujitsu compiler runs fine. The score crashes are unrepeatable and quite often. Just to avoid the option that there is something wrong with network hardware we did tests with two different sets of network cards and switched but result was the same so we can say with pretty high degree of accuracy that it is not network hardware problem. We even separated score network from I/O network (every node has two NICs, one is dedicated for SCore), the other for tcp-ip, nfs, ... The dump of a crash is attached. What makes the whole story really confusing is the fact that Fujitsu compiled binary runs fine and that problems are unrepeatable. We have another problem (which is not that important): what could be the reason, that we can not checkpoint staticaly linked application compiled with intel compiler. If the checkpointing is triggered via sc_console the code just runs on. I would be very gratefull for any clue about problems. We are specially interested in solving the first one. Thank you, Jure Jerman Environmental Agency of Slovenia _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From s-sumi @ flab.fujitsu.co.jp Sat May 21 14:00:58 2005 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Sat, 21 May 2005 14:00:58 +0900 (JST) Subject: [SCore-users-jp] Re: [SCore-users] Two problems with SCore In-Reply-To: <428B1CEB.1090608@rzs-hm.si> References: <428B1CEB.1090608@rzs-hm.si> Message-ID: <20050521.140058.41634594.s-sumi@flab.fujitsu.co.jp> Hi. Sorry for late response. From: Jure Jerman Subject: [SCore-users] Two problems with SCore Date: Wed, 18 May 2005 12:46:03 +0200 Message-ID: <428B1CEB.1090608 @ rzs-hm.si> jure.jerman> Hello, jure.jerman> jure.jerman> after long time of inactivity we started to deal with ULT:Panic problem jure.jerman> again (see score-mailing-list jure.jerman> http://www.pccluster.org/pipermail/score-users/2004-December/002305.html) jure.jerman> jure.jerman> Just to recall the situation: jure.jerman> -we are running SCore 5.8.2 on 14 node dual Xeon cluster jure.jerman> -we had sudden (and unrepeatable) resets of score where score died with jure.jerman> ULT:PANIC error. jure.jerman> At that time the conclusion was that we can avoid ULT:PANIC type of jure.jerman> errors with running jure.jerman> application not just on one node but on several. jure.jerman> jure.jerman> Now we have the same time of problems (ULT:PANIC) with the code compiled jure.jerman> with Intel jure.jerman> fortran compiler even running on several nodes. The very same code jure.jerman> compiled with jure.jerman> Lahey/Fujitsu compiler runs fine. The score crashes are unrepeatable and jure.jerman> quite often. jure.jerman> jure.jerman> Just to avoid the option that there is something wrong with network jure.jerman> hardware we did jure.jerman> tests with two different sets of network cards and switched but result jure.jerman> was the same so we jure.jerman> can say with pretty high degree of accuracy that it is not network jure.jerman> hardware problem. Usually, ULT:PANIC errors come from comminication errors, not depend on compiler. You are using PM/Ethernet, right? If so, please add checksum option on your pm-ethernet.conf, and try to run the program. jure.jerman> We even separated score network from I/O network (every node has two jure.jerman> NICs, one is dedicated jure.jerman> for SCore), the other for tcp-ip, nfs, ... jure.jerman> jure.jerman> The dump of a crash is attached. What makes the whole story really jure.jerman> confusing is the fact jure.jerman> that Fujitsu compiled binary runs fine and that problems are unrepeatable. jure.jerman> We have another problem (which is not that important): what could be jure.jerman> the reason, that we can not checkpoint staticaly jure.jerman> linked application compiled with intel compiler. If the checkpointing is jure.jerman> triggered via sc_console jure.jerman> the code just runs on. Which version of intel compiler are you using? If you are using the versions after 8.0, checkpoint function is not able to use because the versions of Intel compilers use pthread library. SCore does not support checkpoint function on pthread binnaries, now. jure.jerman> I would be very gratefull for any clue about problems. We are specially jure.jerman> interested in jure.jerman> solving the first one. jure.jerman> jure.jerman> jure.jerman> Thank you, jure.jerman> jure.jerman> Jure Jerman jure.jerman> Environmental Agency of Slovenia jure.jerman> _______________________________________________ jure.jerman> SCore-users mailing list jure.jerman> SCore-users @ pccluster.org jure.jerman> http://www.pccluster.org/mailman/listinfo/score-users ------ Shinji Sumimoto, Fujitsu Labs _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From ncepu5 @ hotmail.com Tue May 24 15:18:03 2005 From: ncepu5 @ hotmail.com (Wang Jue) Date: Tue, 24 May 2005 06:18:03 +0000 Subject: [SCore-users-jp] [SCore-users] installation of omni openmp Message-ID: Hi, I am a beginner for using Score.I install it on RedHat 9(kernel 2.4.21) using "scash" and jdk 1.3.1. However there are some errors as follow: [root @ gale1 cg]# make ${OMNI_HOME:=/opt/score/../omni/lib/openmp/gcc}/bin/omcc -o cg-omp cg.c second.o -lm Warning: -ms16m not understood. Ignoring. Warning: -mx1024m not understood. Ignoring. Warning: -o not understood. Ignoring. Warning: -lm not understood. Ignoring. Exception in thread "main" java.lang.InternalError: unexpected exception during linking: java.lang.ClassNotFoundException: exc.object.XobjectFile at 0x40268e17: java.lang.Throwable.Throwable(java.lang.String) (/usr/lib/./libgcj.so.3) at 0x4025bc8e: java.lang.Error.Error(java.lang.String) (/usr/lib/./libgcj.so.3) at 0x402691fa: java.lang.VirtualMachineError.VirtualMachineError(java.lang.String) (/usr/lib/./libgcj.so.3) at 0x4025d62e: java.lang.InternalError.InternalError(java.lang.String) (/usr/lib/./libgcj.so.3) at 0x4025ad82: java.lang.ClassLoader.resolveClass0(java.lang.Class) (/usr/lib/./libgcj.so.3) at 0x402299cb: _Jv_PrepareClass(java.lang.Class) (/usr/lib/./libgcj.so.3) at 0x40248028: java.lang.ClassLoader.linkClass0(java.lang.Class) (/usr/lib/./libgcj.so.3) at 0x4025acb3: java.lang.ClassLoader.resolveClass0(java.lang.Class) (/usr/lib/./libgcj.so.3) at 0x4024646c: java.lang.Class.initializeClass() (/usr/lib/./libgcj.so.3) at 0x40244d04: java.lang.Class.forName(java.lang.String, boolean, java.lang.ClassLoader) (/usr/lib/./libgcj.so.3) at 0x40244d9f: java.lang.Class.forName(java.lang.String) (/usr/lib/./libgcj.so.3) at 0x402ad01d: gnu.gcj.runtime.FirstThread.run() (/usr/lib/./libgcj.so.3) at 0x4024fc4c: _Jv_ThreadRun(java.lang.Thread) (/usr/lib/./libgcj.so.3) at 0x4021c8ac: _Jv_RunMain(java.lang.Class, byte const, int, byte const, boolean) (/usr/lib/./libgcj.so.3) at 0x08048910: __gcj_personality_v0 (OMPC_DIR=/opt/score/../omni/lib/openmp/gcc) at 0x42015574: __libc_start_main (/lib/tls/libc.so.6) at 0x080486c1: _Jv_RegisterClasses (OMPC_DIR=/opt/score/../omni/lib/openmp/gcc) make: *** [cg-omp] Error 1 Wangjue _________________________________________________________________ 免?下? MSN Explorer: http://explorer.msn.com/lccn/ _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Tue May 24 15:27:32 2005 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Tue, 24 May 2005 15:27:32 +0900 Subject: [SCore-users-jp] Re: [SCore-users] installation of omni openmp In-Reply-To: Your message of "Tue, 24 May 2005 06:18:03 JST." Message-ID: <20050524062732.B36EF21EF52@neal.il.is.s.u-tokyo.ac.jp> In article "Wang Jue" wrotes: > Hi, > I am a beginner for using Score.I install it on RedHat 9(kernel 2.4.21) > using "scash" and jdk 1.3.1. However there are some errors as follow: > > [root @ gale1 cg]# make > ${OMNI_HOME:=/opt/score/../omni/lib/openmp/gcc}/bin/omcc -o cg-omp cg.c > second.o -lm > Warning: -ms16m not understood. Ignoring. > Warning: -mx1024m not understood. Ignoring. > Warning: -o not understood. Ignoring. > Warning: -lm not understood. Ignoring. > Exception in thread "main" java.lang.InternalError: unexpected exception > during linking: java.lang.ClassNotFoundException: exc.object.XobjectFile > at 0x40268e17: java.lang.Throwable.Throwable(java.lang.String) > (/usr/lib/./libgcj.so.3) You use gcj instead of JDK 1.3.1. Please check PATH and OMNI_JAVAVM environment variable for java command. from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From ncepu5 @ hotmail.com Tue May 24 16:20:44 2005 From: ncepu5 @ hotmail.com (Wang Jue) Date: Tue, 24 May 2005 07:20:44 +0000 Subject: [SCore-users-jp] Re: [SCore-users] installation of omni openmp In-Reply-To: <20050524062732.B36EF21EF52@neal.il.is.s.u-tokyo.ac.jp> Message-ID: Kameyama Toyohisa: Thanks for your reply.How can i set OMNI_JAVAVM environment variable. Wangjue _________________________________________________________________ 免?下? MSN Explorer: http://explorer.msn.com/lccn _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Tue May 24 16:27:59 2005 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Tue, 24 May 2005 16:27:59 +0900 Subject: [SCore-users-jp] Re: [SCore-users] installation of omni openmp In-Reply-To: Your message of "Tue, 24 May 2005 07:20:44 JST." Message-ID: <20050524072759.4A33B21EF52@neal.il.is.s.u-tokyo.ac.jp> In article "Wang Jue" wrotes: > Thanks for your reply.How can i set OMNI_JAVAVM environment variable. If you use csh, please execute as following: % setenv OMNI_JAVAVM /usr/java/jdk1.3.1_02/bin/java If you use bash, zsh or ksh, please execute as following: $ OMNI_JAVAVM=/usr/java/jdk1.3.1_02/bin/java $ export OMNI_JAVAVM If you want to use always these value, please add the line in your rc file (For example, .cshrc, .bashrc...). from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From ncepu5 @ hotmail.com Tue May 24 22:20:27 2005 From: ncepu5 @ hotmail.com (Wang Jue) Date: Tue, 24 May 2005 13:20:27 +0000 Subject: [SCore-users-jp] Re: [SCore-users] installation of omni openmp In-Reply-To: <20050524072759.4A33B21EF52@neal.il.is.s.u-tokyo.ac.jp> Message-ID: I have set OMNI_JAVAVM,but the question can not be resolved.I install the Omni OpenMP according to istallation specification of score 5.8. _________________________________________________________________ 与?机的朋友?行交流,?使用 MSN Messenger: http://messenger.msn.com/cn _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Wed May 25 09:54:58 2005 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Wed, 25 May 2005 09:54:58 +0900 Subject: [SCore-users-jp] Re: [SCore-users] installation of omni openmp In-Reply-To: Your message of "Tue, 24 May 2005 13:20:27 JST." Message-ID: <20050525005458.C0A2B21EF52@neal.il.is.s.u-tokyo.ac.jp> In article "Wang Jue" wrotes: > I have set OMNI_JAVAVM,but the question can not be resolved.I install the > Omni OpenMP according to istallation specification of score 5.8. Is there same message when OMNI_JAVAVM is setted. If this output is same, probabry you must rebuild Omni compiler with JDK. please set your PATH or please change java related make variable (JAVA_HOME. JRE_HOME, JAVAC, JAVA and JAR) in the following file: /opt/score/lib/build/config/i386-redhat9-linux2_4 And please make Omni: % cd /opt/score/score-src/runtime/omni % smake # smake install from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From ncepu5 @ hotmail.com Wed May 25 15:54:08 2005 From: ncepu5 @ hotmail.com (Wang Jue) Date: Wed, 25 May 2005 06:54:08 +0000 Subject: [SCore-users-jp] Re: [SCore-users] installation of omni openmp In-Reply-To: <20050525005458.C0A2B21EF52@neal.il.is.s.u-tokyo.ac.jp> Message-ID: I have created /opt/score/score-src/adm/config/site, and add JAVA_HOME = /usr/java/j2sdk1.3.1 JAVA = $(JAVA_HOME)/bin/java to this file according installation specification of score 5.8. I add JAVA_HOME=/usr/java/j2sdk1.3.1 JRE_HOME=/usr/java/j2sdk1.3.1/jre JAVAC=/usr/java/j2sdk1.3.1/bin/javac JAVA=/usr/java/j2sdk1.3.1/bin/java JAR=/usr/java/j2sdk1.3.1/bin/jar to the environment variable. when i do : % cd /opt/score/score-src/runtime/omni % smake # smake install i get the errors: Exception in thread "main" java.lang.NoClassDefFoundError: exc/object/XobjectDefEnv Thanks _________________________________________________________________ 享用世界上最大的?子?件系?― MSN Hotmail。 http://www.hotmail.com _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Wed May 25 16:18:23 2005 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Wed, 25 May 2005 16:18:23 +0900 Subject: [SCore-users-jp] Re: [SCore-users] installation of omni openmp In-Reply-To: Your message of "Wed, 25 May 2005 06:54:08 JST." Message-ID: <20050525071823.2015F21EF52@neal.il.is.s.u-tokyo.ac.jp> In article "Wang Jue" wrotes: > > I have created /opt/score/score-src/adm/config/site, and add > JAVA_HOME = /usr/java/j2sdk1.3.1 > JAVA = $(JAVA_HOME)/bin/java to this file according installation > specification of score 5.8. /opt/score/bin/smake read under /opt/score/lib/build only, This command dose not read /opt/score/score-src/*. If you add /opt/score/score-src/adm/config/site, you must re-install at least SCore module: % cd /opt/score/score-src % ./configure --option=site % cd SCore % make # make install If you already re-install SCore and cause these error, please send ALL compile log. from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From ncepu5 @ hotmail.com Wed May 25 17:37:20 2005 From: ncepu5 @ hotmail.com (Wang Jue) Date: Wed, 25 May 2005 08:37:20 +0000 Subject: [SCore-users-jp] [SCore-users] configure Message-ID: The messages with configure and make are in attachment.thanks _________________________________________________________________ 与?机的朋友?行交流,?使用 MSN Messenger: http://messenger.msn.com/cn -------------- next part -------------- 文字コード指定の無い添付文書を保管しました... 名前: input URL: From kameyama @ pccluster.org Wed May 25 17:50:43 2005 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Wed, 25 May 2005 17:50:43 +0900 Subject: [SCore-users-jp] [SCore-users] Re: configure In-Reply-To: Your message of "Wed, 25 May 2005 08:37:20 JST." Message-ID: <20050525085043.91EAD21EF52@neal.il.is.s.u-tokyo.ac.jp> In article "Wang Jue" wrotes: > The messages with configure and make are in attachment.thanks this message nclud only SCore configure log. (And dose not include SCore make and Omni make log.) The SCore configure log dose not include any probrem. from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From ncepu5 @ hotmail.com Wed May 25 17:50:56 2005 From: ncepu5 @ hotmail.com (Wang Jue) Date: Wed, 25 May 2005 08:50:56 +0000 Subject: [SCore-users-jp] [SCore-users] make1 of omni Message-ID: _________________________________________________________________ 免?下? MSN Explorer: http://explorer.msn.com/lccn -------------- next part -------------- 文字コード指定の無い添付文書を保管しました... 名前: make1.txt URL: From ncepu5 @ hotmail.com Wed May 25 17:56:44 2005 From: ncepu5 @ hotmail.com (Wang Jue) Date: Wed, 25 May 2005 08:56:44 +0000 Subject: [SCore-users-jp] [SCore-users] make2 Message-ID: _________________________________________________________________ 享用世界上最大的?子?件系?― MSN Hotmail。 http://www.hotmail.com -------------- next part -------------- 文字コード指定の無い添付文書を保管しました... 名前: make2.txt URL: From ncepu5 @ hotmail.com Wed May 25 17:59:38 2005 From: ncepu5 @ hotmail.com (Wang Jue) Date: Wed, 25 May 2005 08:59:38 +0000 Subject: [SCore-users-jp] [SCore-users] make4 Message-ID: _________________________________________________________________ 免?下? MSN Explorer: http://explorer.msn.com/lccn/ -------------- next part -------------- 文字コード指定の無い添付文書を保管しました... 名前: make4.txt URL: From kameyama @ pccluster.org Wed May 25 18:10:59 2005 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Wed, 25 May 2005 18:10:59 +0900 Subject: [SCore-users-jp] [SCore-users] Re: make4 In-Reply-To: Your message of "Wed, 25 May 2005 08:59:38 JST." Message-ID: <20050525091059.E4F8E21EF52@neal.il.is.s.u-tokyo.ac.jp> In article "Wang Jue" wrotes: ... > /opt/score/bin/score_compiler_list -s omcc| while read tag; \ > do \ > CPPFLAGS=-I/usr/include/nptl KERNELINCLUDES=-I/usr/src/linux-2.4/includ > e > ./omni_make -compiler $tag -javahome "/usr/java/j2sdk1.3.1" -jrehome > "/opt/score/java/linux" -prefix "" build; \ > done; ... > checking 64 bit virtual address... no > checking has quad-precision print format... yes > checking for ranlib... (cached) ranlib > checking for bison... (cached) /usr/bin/bison > checking for javac... (cached) /usr/bin/javac > checking for java... (cached) /usr/bin/java > checking for jar... (cached) /usr/bin/jar > checking for zip... (cached) /usr/bin/zip > checking for gcj... (cached) /usr/bin/gcj Sorry, please execute "make distclean" at first and recompile omni: % cd /opt/score/score-src/runtime/omni % smake distclean % smake # smake install from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From ncepu5 @ hotmail.com Wed May 25 17:58:36 2005 From: ncepu5 @ hotmail.com (Wang Jue) Date: Wed, 25 May 2005 08:58:36 +0000 Subject: [SCore-users-jp] [SCore-users] make3 Message-ID: _________________________________________________________________ 与?机的朋友?行交流,?使用 MSN Messenger: http://messenger.msn.com/cn -------------- next part -------------- 文字コード指定の無い添付文書を保管しました... 名前: make3.txt URL: From markus @ markus-fischer.de Wed May 25 18:53:50 2005 From: markus @ markus-fischer.de (Dr. Markus Fischer) Date: Wed, 25 May 2005 11:53:50 +0200 Subject: [SCore-users-jp] Re: [SCore-users] make4 In-Reply-To: References: Message-ID: <42944B2E.5020407@markus-fischer.de> Wang, stop posting your freaking attachments to the whole group. Or zip them at least M. _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Fri May 27 13:19:24 2005 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Fri, 27 May 2005 13:19:24 +0900 Subject: [SCore-users-jp] Re: [score-info] SCoreのバージョンアップについて In-Reply-To: Your message of "Fri, 27 May 2005 12:44:14 JST." <002501c5626e$59c478e0$6ffacca0@indigo.narutou.ac.jp> Message-ID: <20050527041924.C0EA721EF52@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <002501c5626e$59c478e0$6ffacca0 @ indigo.narutou.ac.jp> "Kazunori Matsuda" wrotes: > SCore問い合わせ担当者殿 score-info は廃止しました. 問い合わせなどは score-users-jp @ pccluster.org を使用してください. > お世話になります。 > 共立出版の「Linuxで並列処理をしよう」を読んで, > Red Hat 9.0にSCore ver.5.0.1をインストールしましたが, redhat 9 だとするとその本の附属の CD-ROM の rpm は使用できず, ソースから install したのだと思います. > その後に, > www.pccluster.org > から新しいバージョンが出ていることを知り, > score-5.8.0-redhat7.3.i386 > をダウンロードしてインストールしたいと思っています。 現在の最新は 5.8.2 です. score-5.8.0-redhat7.3.i386 は redhat 7.3 が対象なので, 5.0.1 と同様, ソースからコンパイルする必要が あります. > SCore 5.0.1はアンインストールして新しいバージョンを > インストールしたほうがよいと思いますが,古いバージョ > ンはどのようにしてアンインストールすればよろしいの > でしょうか。 bininstall など rpm を使用して install した場合は rpm -e ... が使えるのですが... ソースからコンパイルした場合は /opt/score 以下を削除すれば良いと思います. ただ, scorehosts.db や PM の設定ファイルなどをもどすことを考えると. uninstall しないでそのまま同じところに install して しまったほうが, むしろトラブルが少なくなるような気がします. from Kameyama Toyohisa