From hyasui @ sc.musashi-tech.ac.jp Mon May 19 12:32:22 2008 From: hyasui @ sc.musashi-tech.ac.jp (yasui hiroyuki) Date: Mon, 19 May 2008 12:32:22 +0900 Subject: [SCore-users-jp] =?iso-2022-jp?b?GyRCJSglaSE8JWElQyU7ITwbKEI=?= =?iso-2022-jp?b?GyRCJTgkTjBVTCMbKEI=?= Message-ID: <4830F4C6.1030800@sc.musashi-tech.ac.jp> 武蔵工大の安井と申します. 次のようなエラーが発生しましたが,どのような 状況で発生するエラーなのかが不明なので,お教え 頂ければと,メールいたしました. SCORE: Program aborted. SCOUT(cls1): SCOUT: I/O error (IO_CTRL_NEXT) SCore 5.8.3で64台シングルユーザモードで処理を しており,実行開始後1時間半程度で発生します. (再現性あり) 実行していたプログラムは気象シミュレータのWRF2.0 で,以前はキチンと動作していましたが,最近,計算 用のパラメータ変更などを行ったので,それが原因 だと考えています. しかし,プログラムの実行者は安井ではなく,SCore のことはあまり良く分かっていません.逆に安井はWRF ことが良く判っていないので,原因がなかなか特定 出来ません. 何かヒントをいただければ幸いです. -- Best regards, Hiroyuki YASUI /\_/\ _ D.Sc., Assistant Professor =^y^=____(( Information Processing Center, /~@~~ \)) Musashi Institute of Technology, JAPAN \)(/--/__/ From hori @ swimmy-soft.com Mon May 19 12:59:28 2008 From: hori @ swimmy-soft.com (Atsushi HORI) Date: Mon, 19 May 2008 12:59:28 +0900 Subject: =?ISO-2022-JP?B?UmU6IFtTQ29yZS11c2Vycy1qcF0gGyRCJSglaSE8JWEbKEI=?= =?ISO-2022-JP?B?GyRCJUMlOyE8JTgkTjBVTCMbKEI=?= In-Reply-To: <4830F4C6.1030800@sc.musashi-tech.ac.jp> References: <4830F4C6.1030800@sc.musashi-tech.ac.jp> Message-ID: <9611F0D0-C616-43E9-9AC4-D117F00A700A@swimmy-soft.com> On 2008/05/19, at 12:32, yasui hiroyuki wrote: > 何かヒントをいただければ幸いです. あくまでヒントの域を出ませんが、 SCORE: Program aborted. SCOUT(cls1): SCOUT: I/O error (IO_CTRL_NEXT) は SCOUT の TCP/IP の read/write でエラーに なった、あるいは予期しない EOF になった、というメッセージ だったように記憶してます。 ということで、PM/Ethernet-HXB(?)のデバドラの影響で TCP がおかしくなった、あるいはノードが落ちて EOF になっ た、とかいうのが原因のように思います。 From kameyama @ pccluster.org Mon May 19 13:15:55 2008 From: kameyama @ pccluster.org (Kameyama Toyohisa) Date: Mon, 19 May 2008 13:15:55 +0900 Subject: [SCore-users-jp] =?ISO-2022-JP?B?GyRCJSglaSE8JWElQyU7ITwlOBsoQg==?= =?ISO-2022-JP?B?GyRCJE4wVUwjGyhC?= In-Reply-To: <4830F4C6.1030800@sc.musashi-tech.ac.jp> References: <4830F4C6.1030800@sc.musashi-tech.ac.jp> Message-ID: <4830FEFB.3040706@pccluster.org> 亀山です. yasui hiroyuki さんは書きました: > 次のようなエラーが発生しましたが,どのような > 状況で発生するエラーなのかが不明なので,お教え > 頂ければと,メールいたしました. (中略) > SCOUT(cls1): SCOUT: I/O error (IO_CTRL_NEXT) これは, cls1 の scout が scout 状の次のホスト (cls2?) と通信しようとして, 通信できないというエラーです. scout 自体は SCore プログラムが落ちても動きつづけているはずですが... PM/Ethernet を使用しているのでしたら, 堀さんの言うように PM/Ethernet 関連 デバイスの bug の可能性も考えられますが, それが TCP/IP にまで 影響するというのは, ちょっと考えににくいような... もしかしたら, パラメータを変更したため, プログラムが大量の memory を使用するようになって, 実 memory + swap を越えてしまい, kernel が scout を kill するようになったとかいうのは考えられない でしょうか? Kameyama Toyohisa From ooyama.eiichi @ gmail.com Tue May 20 19:50:00 2008 From: ooyama.eiichi @ gmail.com (eiichi ooyama) Date: Tue, 20 May 2008 06:50:00 -0400 Subject: [SCore-users-jp] rcselect script Message-ID: <68d154a20805200350p37d02f49ofb2962fb1d1e588a@mail.gmail.com> 大山ともうします。 今以下のページを参考にしてAMD64のマシン上のCentOS4.6にscore-6.0.2.1をインストールしているのですが、 質問をさせてください。 (1) scorehosts.dbの記述についてですが、例だとpentiumIIIとなっていると思いますが、これは athlon64系のcpuだと、どう書けばよいでしょうか? athlonとすればよいでしょうか? (2) http://www.pccluster.org/faq/ja/installation/download-source.html 最後の手順で、 site ファイルを作成した場合、 # *./configure --option=site* 作成しなかった場合、 # *./configure* # *make* # */opt/score/install/setup -score_server* という箇所のところ、 site ファイルを作成した場合、 # *./configure --option=site* 作成しなかった場合、 # *./configure* # *make # 追加行 cd /opt/score/install/ * # */opt/score/install/setup -score_server* 追加行のところを追加しないとインストールできませんでした。 (3) あと、(別ページですが、) http://www.pccluster.org/faq/ja/installation/sys-compute-fromsrc.html の真ん中ほどの、 echo rsh > /etc/securetty というのは、(ほかのページの記述と同様に) echo rsh >> /etc/securetty とするべきかと。 以上ですが、よろしくお願いします。 -------------- next part -------------- HTMLの添付ファイルを保管しました... URL: From ooyama.eiichi @ gmail.com Tue May 20 20:33:51 2008 From: ooyama.eiichi @ gmail.com (eiichi ooyama) Date: Tue, 20 May 2008 07:33:51 -0400 Subject: [SCore-users-jp] =?iso-2022-jp?b?U0NPVVQbJEIkTiVGJTklSCRLGyhC?= =?iso-2022-jp?b?GyRCJEQkJCRGGyhC?= Message-ID: <68d154a20805200433r34d85ad1y98c12ed3eddd8a0b@mail.gmail.com> 大山ともうします。 度々すいません。インストール後のテストに関する質問なのですが、 SCOUT TEST PROCEDURE という項で、 SCOUT コマンドの実行 $ *msgb -group pcc &* の後、以下のようなエラーメッセージが出てしまいます。host1というのはサーバー兼計算ノードです。 [hoge @ host1 etc]$ msgb -group ethergroup & [1] 25405 [hoge @ host1 etc]$ can't open server host1.nunmaecluster.com:8767, couldn't open socket: connection refused この場合考えられる原因は何でしょうか? 何度もすいませんが、よろしくお願いします。 -------------- next part -------------- HTMLの添付ファイルを保管しました... URL: From kameyama @ pccluster.org Wed May 21 09:41:59 2008 From: kameyama @ pccluster.org (Kameyama Toyohisa) Date: Wed, 21 May 2008 09:41:59 +0900 Subject: [SCore-users-jp] rcselect script In-Reply-To: <68d154a20805200350p37d02f49ofb2962fb1d1e588a@mail.gmail.com> References: <68d154a20805200350p37d02f49ofb2962fb1d1e588a@mail.gmail.com> Message-ID: <48336FD7.8010809@pccluster.org> 亀山です. eiichi ooyama さんは書きました: > (1) > scorehosts.dbの記述についてですが、例だとpentiumIIIとなっていると思いま > すが、これは > athlon64系のcpuだと、どう書けばよいでしょうか? > athlonとすればよいでしょうか? これは, scrun で node の指定のときに % scrun -nodes=2x2.x86_64-centos5-linux2_6.pentiumIII.500 ... などと指定するときに使用します. http://www.pccluster.org/score/dist/score/html/ja/man/man1/scrun.html つまり, 使用する cluster が複数種類の CPU で構成されている場合, どの CPU で実行したいかを指定するときに使用します. ということで, 仕様上は (. を含まない ASCII の) 任意の文字列で構いません. 実際, 単一の種類の1 CPU で構成されている場合, 直接指定することも 無いと思いますので, 好きなように使用して構わないと思います. > > (2) > http://www.pccluster.org/faq/ja/installation/download-source.html > 最後の手順で、 > > site ファイルを作成した場合、 > # *./configure --option=/site/* > 作成しなかった場合、 > # *./configure* > > # *make* > # */opt/score/install/setup -score_server* > > > > という箇所のところ、 > > site ファイルを作成した場合、 > # *./configure --option=/site/* > 作成しなかった場合、 > # *./configure* > > # *make > > # 追加行 > cd /opt/score/install/ > > > * # */opt/score/install/setup -score_server* > > > 追加行のところを追加しないとインストールできませんでした。 そうですね... もしくは setup の rcselect の指定を絶対 path にする必要がありますね... > (3) > あと、(別ページですが、) > http://www.pccluster.org/faq/ja/installation/sys-compute-fromsrc.html > の真ん中ほどの、 > echo rsh > /etc/securetty > というのは、(ほかのページの記述と同様に) > echo rsh >> /etc/securetty > とするべきかと。 確かに... ありがとうございました. Kameyama Toyohisa From kameyama @ pccluster.org Wed May 21 10:02:34 2008 From: kameyama @ pccluster.org (Kameyama Toyohisa) Date: Wed, 21 May 2008 10:02:34 +0900 Subject: [SCore-users-jp] =?ISO-2022-JP?B?U0NPVVQbJEIkTiVGJTklSCRLGyhC?= =?ISO-2022-JP?B?GyRCJEQkJCRGGyhC?= In-Reply-To: <68d154a20805200433r34d85ad1y98c12ed3eddd8a0b@mail.gmail.com> References: <68d154a20805200433r34d85ad1y98c12ed3eddd8a0b@mail.gmail.com> Message-ID: <483374AA.8070809@pccluster.org> 亀山です. eiichi ooyama さんは書きました: > 度々すいません。インストール後のテストに関する質問なのですが、 > SCOUT TEST PROCEDURE という項で、 > > SCOUT コマンドの実行 > > |$ *msgb -group /pcc/ &*| > > の後、以下のようなエラーメッセージが出てしまいます。host1というのはサー > バー兼計算ノードです。 > > [hoge @ host1 etc]$ msgb -group ethergroup & > [1] 25405 > [hoge @ host1 etc]$ can't open server host1.nunmaecluster.com:8767 > , couldn't open socket: connection > refused > > この場合考えられる原因は何でしょうか? 1. msgbserv があがっていない. ps などで, msgbserv があがっているかどうか確認してください. 2. scorehosts.db で msgbserv の port を 8764 に指定してください. msgbserv の default は 8766 なんですが, /etc/init.d/msgbserv では 8764 で上げているため通信ができなくなっていると思われます. 多分, 2 ではないかと... Kameyama Toyohisa From hyasui @ sc.musashi-tech.ac.jp Wed May 21 10:35:05 2008 From: hyasui @ sc.musashi-tech.ac.jp (yasui hiroyuki) Date: Wed, 21 May 2008 10:35:05 +0900 Subject: [SCore-users-jp] =?ISO-2022-JP?B?GyRCJSglaSE8JWElQyU7ITwlOBsoQg==?= =?ISO-2022-JP?B?GyRCJE4wVUwjGyhC?= In-Reply-To: <4830FEFB.3040706@pccluster.org> References: <4830F4C6.1030800@sc.musashi-tech.ac.jp> <4830FEFB.3040706@pccluster.org> Message-ID: <48337C49.3070305@sc.musashi-tech.ac.jp> 安井です. 堀さん,亀山さん,早速のお返事ありがとうございます. (亀山さん,ダイレクトに返信してしまいまして申し訳ございません) Kameyama Toyohisa さんは書きました: > これは, cls1 の scout が scout 状の次のホスト (cls2?) と通信しようとして, > 通信できないというエラーです. cls1はサーバです.(説明不足で申し訳ありません)そうなると, 次のホストというのは0番の計算ノードということになりますでしょうか. > もしかしたら, パラメータを変更したため, プログラムが大量の > memory を使用するようになって, 実 memory + swap を越えてしまい, > kernel が scout を kill するようになったとかいうのは考えられない > でしょうか? こちらの可能性が大きいような気がします. ありがとうございます. From ooyama.eiichi @ gmail.com Wed May 21 13:45:25 2008 From: ooyama.eiichi @ gmail.com (eiichi ooyama) Date: Wed, 21 May 2008 00:45:25 -0400 Subject: =?ISO-2022-JP?B?UmU6IFtTQ29yZS11c2Vycy0=?= =?ISO-2022-JP?B?anBdIFNDT1VUGyRCJE4lRiU5JUgkSyREJCQkRhsoQg==?= In-Reply-To: <483374AA.8070809@pccluster.org> References: <68d154a20805200433r34d85ad1y98c12ed3eddd8a0b@mail.gmail.com> <483374AA.8070809@pccluster.org> Message-ID: <68d154a20805202145l69a0f9a6uc46b6481988c6e9d@mail.gmail.com> 大山です。 ご返答ありがとうございます。 ポート番号を設定したところ、このテストについてはパスする事が出来ました。 ところが次のポイントツーポイントのテスト(rpmtestのテスト)で失敗してしまいます。 (以前のMLにあったようなタイムアウトではなく、glibcのエラーメッセージでした) 以下はその時のログなのですが、当方の環境では、 host1 10.13.13.1 (計算ホスト兼サーバ) host2 10.13.13.2 host3 10.13.13.3 host4 10.13.13.4 となってまして、CentOS4.6(2.6.9-67.ELsmp) Athlon64 3600+です。 ●1つ目のウィンドウ [hoge @ host1 ~]$ rpmtest host2 ethernet -reply connect to address 10.13.13.2: Connection refused Trying krb4 rsh... connect to address 10.13.13.2: Connection refused trying normal rsh (/usr/bin/rsh) ●2つ目のウィンドウ [hoge @ host1 ~]$ rpmtest host1 ethernet -dest 1 -ping connect to address 10.13.13.1: Connection refused Trying krb4 rsh... connect to address 10.13.13.1: Connection refused trying normal rsh (/usr/bin/rsh) Ethernet PM context #0 information (unit 0) channel 0 descripter information rx_p=00000000, rx_c=00000000, rx_bp=00000000, rx_bc=00000000 tx_p=00000001, tx_c=00000000, tx_bp=00000080, tx_bc=00000000 channel 0 statistics information st_txmit=14211b01, st_rexmit=040953b3, st_xmit_ctl=1b000000 st_xmit_ack=22901621 st_xmit_lost=14211b02, st_xmit_stop=040953b4 st_xmit_err=0000009c, st_xmit_received=ff010201, st_rcv_valid=00000000 st_rcv_ackonly=00000000, st_rcv_igonore=00000000, st_rcv_lose=00000270 st_rcv_ov=00000000,st_rcv_ov=00000000 st_rcv_stop=00000000, st_rcv_go=00000000 *** glibc detected *** double free or corruption (out): 0x00000000005f0d50 *** 以前のメールでrpmtestでtimeoutというスレッドがにたような状況みたいに思われましたので、 そちらにあった亀山さんの質問について調べました。 1. rpm の install は ./bininstall -compute で行ったでしょうか? =>ソースからのインストールですのでrpmは使ってません。 2. rpm -qa | grep score で score6.0.0-comp はでてきますでしょうか? =>ありません。 3. /opt/score/6.0.0/modules はありますでしょうか? =>あります。/opt/score/6.0.2/modules ですが。。 4. /lib/module/`uname -r`/extra/score+pm はありますでしょうか? その中に tg3_scorepm1.ko はありますでしょうか? =>当方の環境が以下のようになっていまして、e1000_scorepm1.koができていて欲しいところだと思うのですが、 [hoge @ host1 ~]$ /opt/score/install/linux2.6/netdev -a eth0 forcedeth eth1 e1000 上記ディレクトリを見ますと、 [hoge @ host1 ~]$ ls /lib/modules/2.6.9-67.ELsmp/extra/score+pm/ e100_scorepm1.ko pm_ethernet2.ko pm_ethernet_loader.ko pm_shmem.ko infini_dev.ko pm_ethernet2_mem.ko pm_memory.ko tg3_scorepm1.ko infini_sm_dev.ko pm_ethernet_dev_nkp.ko pm_myrinet.ko となっていまして、e1000関係のモジュールは出来ていませんでした。 以下はその他の状況です。 ●/etc/modprobe.conf alias eth0 forcedeth alias eth1 e1000 alias scsi_hostadapter sata_nv alias usb-controller ehci-hcd alias usb-controller1 ohci-hcd ●/etc/pm_ethernet.conf PM_ETHERNET_UNIT_ETH1=0 ●/opt/score/etc/pm-ethernet.conf unit 0 intreap 0 # maxnsend 0 - 32 # maxnsend 0 # backoff 1000 - 20000 (usec) backoff 4800 # checksum (0 if off, 1 is on) checksum 0 # PE MAC address base hostname # comment 0 00:1B:21:14:B4:51 host1.nunmaecluster.com # ip=10.13.13.1 on eth1 1 00:1B:21:14:B3:C0 host2.nunmaecluster.com # ip=10.13.13.2 on eth1 2 00:1B:21:14:BC:71 host3.nunmaecluster.com # ip=10.13.13.3 on eth1 3 00:1B:21:16:90:22 host4.nunmaecluster.com # ip=10.13.13.4 on eth1 です。どうかこのテストをパスするための助言をお願いします。 大山 2008/05/20 21:02 Kameyama Toyohisa : > 亀山です. > > eiichi ooyama さんは書きました: > > 度々すいません。インストール後のテストに関する質問なのですが、 > > SCOUT TEST PROCEDURE という項で、 > > > > SCOUT コマンドの実行 > > > > |$ *msgb -group /pcc/ &*| > > > > の後、以下のようなエラーメッセージが出てしまいます。host1というのはサー > > バー兼計算ノードです。 > > > > [hoge @ host1 etc]$ msgb -group ethergroup & > > [1] 25405 > > [hoge @ host1 etc]$ can't open server host1.nunmaecluster.com:8767 > > , couldn't open socket: connection > > refused > > > > この場合考えられる原因は何でしょうか? > > 1. msgbserv があがっていない. > ps などで, msgbserv があがっているかどうか確認してください. > > 2. scorehosts.db で msgbserv の port を 8764 に指定してください. > msgbserv の default は 8766 なんですが, /etc/init.d/msgbserv では > 8764 で上げているため通信ができなくなっていると思われます. > > 多分, 2 ではないかと... > > Kameyama Toyohisa > -------------- next part -------------- HTMLの添付ファイルを保管しました... URL: From ooyama.eiichi @ gmail.com Wed May 21 13:51:12 2008 From: ooyama.eiichi @ gmail.com (eiichi ooyama) Date: Wed, 21 May 2008 00:51:12 -0400 Subject: [SCore-users-jp] rcselect script In-Reply-To: <48336FD7.8010809@pccluster.org> References: <68d154a20805200350p37d02f49ofb2962fb1d1e588a@mail.gmail.com> <48336FD7.8010809@pccluster.org> Message-ID: <68d154a20805202151j126da6ccsc9582a5b05ea8f0b@mail.gmail.com> 大山です。 ご返答ありがとうございました。 以下の件ですが、、、 2008/05/20 20:41 Kameyama Toyohisa : > 亀山です. > > eiichi ooyama さんは書きました: > > (1) > > scorehosts.dbの記述についてですが、例だとpentiumIIIとなっていると思いま > > すが、これは > > athlon64系のcpuだと、どう書けばよいでしょうか? > > athlonとすればよいでしょうか? > > これは, scrun で node の指定のときに > % scrun -nodes=2x2.x86_64-centos5-linux2_6.pentiumIII.500 ... > などと指定するときに使用します. > http://www.pccluster.org/score/dist/score/html/ja/man/man1/scrun.html > つまり, 使用する cluster が複数種類の CPU で構成されている場合, > どの CPU で実行したいかを指定するときに使用します. > > ということで, 仕様上は (. を含まない ASCII の) 任意の文字列で構いません. > 実際, 単一の種類の1 CPU で構成されている場合, 直接指定することも > 無いと思いますので, 好きなように使用して構わないと思います. > > > > > (2) > > http://www.pccluster.org/faq/ja/installation/download-source.html > > 最後の手順で、 > > > > site ファイルを作成した場合、 > > # *./configure --option=/site/* > > 作成しなかった場合、 > > # *./configure* > > > > # *make* > > # */opt/score/install/setup -score_server* > > > > > > > > という箇所のところ、 > > > > site ファイルを作成した場合、 > > # *./configure --option=/site/* > > 作成しなかった場合、 > > # *./configure* > > > > # *make > > > > # 追加行 > > cd /opt/score/install/ > > > > > > * # */opt/score/install/setup -score_server* > > > > > > 追加行のところを追加しないとインストールできませんでした。 > > そうですね... > もしくは setup の rcselect の指定を絶対 path にする必要がありますね... > ここを絶対パスにしても次の /opt/score/install/setup -omni の中だったと思いますが、やはり相対パスになっている箇所があるため駄目だったと思います。 (あやふやですいません) > > (3) > > あと、(別ページですが、) > > http://www.pccluster.org/faq/ja/installation/sys-compute-fromsrc.html > > の真ん中ほどの、 > > echo rsh > /etc/securetty > > というのは、(ほかのページの記述と同様に) > > echo rsh >> /etc/securetty > > とするべきかと。 > > 確かに... > ありがとうございました. > > Kameyama Toyohisa > -------------- next part -------------- HTMLの添付ファイルを保管しました... URL: From kameyama @ pccluster.org Wed May 21 15:31:11 2008 From: kameyama @ pccluster.org (Kameyama Toyohisa) Date: Wed, 21 May 2008 15:31:11 +0900 Subject: [SCore-users-jp] =?ISO-2022-JP?B?U0NPVVQbJEIkTiVGJTklSCRLGyhC?= =?ISO-2022-JP?B?GyRCJEQkJCRGGyhC?= In-Reply-To: <68d154a20805202145l69a0f9a6uc46b6481988c6e9d@mail.gmail.com> References: <68d154a20805200433r34d85ad1y98c12ed3eddd8a0b@mail.gmail.com> <483374AA.8070809@pccluster.org> <68d154a20805202145l69a0f9a6uc46b6481988c6e9d@mail.gmail.com> Message-ID: <4833C1AF.4000803@pccluster.org> 亀山です. eiichi ooyama さんは書きました: > 2. rpm -qa | grep score > > で score6.0.0-comp はでてきますでしょうか? > =>ありません。 source から install したのならできていないでしょうね... > 4. /lib/module/`uname -r`/extra/score+pm > はありますでしょうか? > その中に tg3_scorepm1.ko はありますでしょうか? > > =>当方の環境が以下のようになっていまして、e1000_scorepm1.koができていて欲しいところだと 思うのですが、 > [hoge @ host1 ~]$ /opt/score/install/linux2.6/netdev -a > eth0 forcedeth > eth1 e1000 > 上記ディレクトリを見ますと、 > [hoge @ host1 ~]$ ls /lib/modules/2.6.9-67.ELsmp/extra/score+pm/ > > e100_scorepm1.ko pm_ethernet2.ko pm_ethernet_loader.ko pm_shmem.ko > infini_dev.ko pm_ethernet2_mem.ko pm_memory.ko tg3_scorepm1.ko > infini_sm_dev.ko pm_ethernet_dev_nkp.ko pm_myrinet.ko > > となっていまして、e1000関係のモジュールは出来ていませんでした。 e1000 関連のモジュールができていないのが, 原因だと思います. これは, source code 中では score6-src/SCore/pm-v2/arch/ethernet/driver/e1000_scorepm/linux2_6 にあります. 問題はこの directory の kcompat.h です. 以下の patch をあててコンパイルし直してください. (その directory で % /opt/score/deploy/smake distclean % /opt/score/deploy/smake % /opt/score/deploy/smake install でコンパイルできます.) その後, compute host の /opt/score/install で # ./setup -score_comp を実行してください. Kameyama Toyohisa Index: kcompat.h =================================================================== RCS file: /develop/cvsroot/score6-src/SCore/pm-v2/arch/ethernet/driver/e1000_scorepm/linux2_6/kcompat.h,v retrieving revision 1.4 diff -u -r1.4 kcompat.h --- kcompat.h 24 Jan 2007 07:16:32 -0000 1.4 +++ kcompat.h 21 May 2008 06:25:29 -0000 @@ -1081,7 +1081,9 @@ #if ( LINUX_VERSION_CODE < KERNEL_VERSION(2,6,19) ) #if ( LINUX_VERSION_CODE >= KERNEL_VERSION(2,5,0) ) +#if (!(( RHEL_RELEASE_CODE > RHEL_RELEASE_VERSION(4,4) ) && ( RHEL_RELEASE_CODE < RHEL_RELEASE_VERSION(5,0) ) || ( RHEL_RELEASE_CODE > RHEL_RELEASE_VERSION(5,0) ))) typedef irqreturn_t (*irq_handler_t)(int, void*, struct pt_regs *); +#endif typedef irqreturn_t (*new_handler_t)(int, void*); static inline irqreturn_t _kc_request_irq(unsigned int irq, new_handler_t handler, unsigned long flags, const char *devname, void *dev_id) #else /* 2.4.x */ Kameyama Toyohisa From ooyama.eiichi @ gmail.com Wed May 21 17:20:06 2008 From: ooyama.eiichi @ gmail.com (eiichi ooyama) Date: Wed, 21 May 2008 04:20:06 -0400 Subject: =?ISO-2022-JP?B?UmU6IFtTQ29yZS11c2Vycy0=?= =?ISO-2022-JP?B?anBdIFNDT1VUGyRCJE4lRiU5JUgkSyREJCQkRhsoQg==?= In-Reply-To: <4833C1AF.4000803@pccluster.org> References: <68d154a20805200433r34d85ad1y98c12ed3eddd8a0b@mail.gmail.com> <483374AA.8070809@pccluster.org> <68d154a20805202145l69a0f9a6uc46b6481988c6e9d@mail.gmail.com> <4833C1AF.4000803@pccluster.org> Message-ID: <68d154a20805210120s6e60a434s637f0061372c41ff@mail.gmail.com> ありがとうございます、rpmtestをパスしました。その後もテストをパスして、一応デモンストレーションの ところまで来ました。 以下はログです。 [hoge @ host1 ~]$ rpmtest host1 ethernet -dest 1 -ping connect to address 10.13.13.1: Connection refused Trying krb4 rsh... connect to address 10.13.13.1: Connection refused trying normal rsh (/usr/bin/rsh) 8 3.50687e-05 [hoge @ host1 ~]$ scout -g pcc SCOUT: Spawning done. SCOUT: session started. [hoge @ host1 ~]$ scstest -network ethernet -config:file=pm-ethernet.conf type=ethernet SCSTEST: BURST on ethernet(chan=0,ctx=0,len=16) 50 K packets. (6.096e+01 kpps) 100 K packets. (6.149e+01 kpps) 150 K packets. (6.050e+01 kpps) 200 K packets. (5.553e+01 kpps) 250 K packets. (4.647e+01 kpps) 300 K packets. (4.940e+01 kpps) 350 K packets. (5.007e+01 kpps) ところで、パッチを当ててコンパイルしていると、以下のワーニングが出てたのですが、これは問題ないですよね? (テストもパスしたし、、) [hoge @ host1 ~]$ grep warning /tmp/compile.log /opt/score/score6-src/SCore/pm-v2/arch/ethernet/driver/e1000_scorepm/linux2_6/obj.x86_64-centos4-linux2_6 @ 2.6.9-67.ELsmp/../../../../include/pm_ethernet_client.h:103:1: warning: "request_irq" redefined /opt/score/score6-src/SCore/pm-v2/arch/ethernet/driver/e1000_scorepm/linux2_6/obj.x86_64-centos4-linux2_6 @ 2.6.9-67.ELsmp/kcompat.h:1100:1: warning: this is the location of the previous definition /opt/score/score6-src/SCore/pm-v2/arch/ethernet/driver/e1000_scorepm/linux2_6/obj.x86_64-centos4-linux2_6 @ 2.6.9-67.ELsmp/e1000_main.c:365: warning: passing arg 2 of `pm_ethernet_request_irq' from incompatible pointer type/opt/score/score6-src/SCore/pm-v2/arch/ethernet/driver/e1000_scorepm/linux2_6/obj.x86_64-centos4-linux2_6 @ 2.6.9-67.ELsmp/e1000_main.c:372: warning: passing arg 2 of `pm_ethernet_request_irq' from incompatible pointer type 亀山さんのパッチを当てるため今回初めてkcompat.hを見たのですが、#if ( LINUX_VERSION_CODE が多くて 大変そうですね。linuxもソース変え過ぎですよねえ。。。 それにしても、これで動きそうです。本当にありがとうございました。 大山 2008/05/21 2:31 Kameyama Toyohisa : > 亀山です. > > eiichi ooyama さんは書きました: > > 2. rpm -qa | grep score > > > > で score6.0.0-comp はでてきますでしょうか? > > =>ありません。 > > source から install したのならできていないでしょうね... > > > 4. /lib/module/`uname -r`/extra/score+pm > > はありますでしょうか? > > その中に tg3_scorepm1.ko はありますでしょうか? > > > > =>当方の環境が以下のようになっていまして、e1000_scorepm1.koができていて欲しいところだと > 思うのですが、 > > [hoge @ host1 ~]$ /opt/score/install/linux2.6/netdev -a > > eth0 forcedeth > > eth1 e1000 > > 上記ディレクトリを見ますと、 > > [hoge @ host1 ~]$ ls /lib/modules/2.6.9-67.ELsmp/extra/score+pm/ > > > > e100_scorepm1.ko pm_ethernet2.ko pm_ethernet_loader.ko > pm_shmem.ko > > infini_dev.ko pm_ethernet2_mem.ko pm_memory.ko > tg3_scorepm1.ko > > infini_sm_dev.ko pm_ethernet_dev_nkp.ko pm_myrinet.ko > > > > となっていまして、e1000関係のモジュールは出来ていませんでした。 > > e1000 関連のモジュールができていないのが, 原因だと思います. > これは, source code 中では > score6-src/SCore/pm-v2/arch/ethernet/driver/e1000_scorepm/linux2_6 > にあります. > 問題はこの directory の kcompat.h です. > > 以下の patch をあててコンパイルし直してください. > (その directory で > % /opt/score/deploy/smake distclean > % /opt/score/deploy/smake > % /opt/score/deploy/smake install > でコンパイルできます.) > その後, compute host の /opt/score/install で > # ./setup -score_comp > を実行してください. > > Kameyama Toyohisa > > Index: kcompat.h > =================================================================== > RCS file: > > /develop/cvsroot/score6-src/SCore/pm-v2/arch/ethernet/driver/e1000_scorepm/linux2_6/kcompat.h,v > retrieving revision 1.4 > diff -u -r1.4 kcompat.h > --- kcompat.h 24 Jan 2007 07:16:32 -0000 1.4 > +++ kcompat.h 21 May 2008 06:25:29 -0000 > @@ -1081,7 +1081,9 @@ > #if ( LINUX_VERSION_CODE < KERNEL_VERSION(2,6,19) ) > > #if ( LINUX_VERSION_CODE >= KERNEL_VERSION(2,5,0) ) > +#if (!(( RHEL_RELEASE_CODE > RHEL_RELEASE_VERSION(4,4) ) && ( > RHEL_RELEASE_CODE < > RHEL_RELEASE_VERSION(5,0) ) || ( RHEL_RELEASE_CODE > > RHEL_RELEASE_VERSION(5,0) ))) > typedef irqreturn_t (*irq_handler_t)(int, void*, struct pt_regs *); > +#endif > typedef irqreturn_t (*new_handler_t)(int, void*); > static inline irqreturn_t _kc_request_irq(unsigned int irq, new_handler_t > handler, > unsigned long flags, const char *devname, void *dev_id) > #else /* 2.4.x */ > > Kameyama Toyohisa > -------------- next part -------------- HTMLの添付ファイルを保管しました... URL: From kameyama @ pccluster.org Wed May 21 17:41:51 2008 From: kameyama @ pccluster.org (Kameyama Toyohisa) Date: Wed, 21 May 2008 17:41:51 +0900 Subject: [SCore-users-jp] =?ISO-2022-JP?B?U0NPVVQbJEIkTiVGJTklSCRLGyhC?= =?ISO-2022-JP?B?GyRCJEQkJCRGGyhC?= In-Reply-To: <68d154a20805210120s6e60a434s637f0061372c41ff@mail.gmail.com> References: <68d154a20805200433r34d85ad1y98c12ed3eddd8a0b@mail.gmail.com> <483374AA.8070809@pccluster.org> <68d154a20805202145l69a0f9a6uc46b6481988c6e9d@mail.gmail.com> <4833C1AF.4000803@pccluster.org> <68d154a20805210120s6e60a434s637f0061372c41ff@mail.gmail.com> Message-ID: <4833E04F.5050806@pccluster.org> 亀山です. eiichi ooyama さんは書きました: > ところで、パッチを当ててコンパイルしていると、以下のワーニングが出てたの > ですが、これは問題ないですよね? > (テストもパスしたし、、) 多分... > 亀山さんのパッチを当てるため今回初めてkcompat.hを見たのですが、#if ( > LINUX_VERSION_CODE が多くて > 大変そうですね。linuxもソース変え過ぎですよねえ。。。 e1000 では kernel の version で変更のあるものを kcompat.[ch] に集めるという方針なので, 結果的にこの file に #if が多くなります. 今回の patch は linux kernel の version の違いに加えて, redhat が (update を出すときに) 更に header を変更しているというものです. Kameyama Toyohisa From serizawa @ star.fielding.nec.co.jp Thu May 29 13:37:21 2008 From: serizawa @ star.fielding.nec.co.jp (=?iso-2022-jp?b?c2VyaXphd2EgGyRCIXcbKEIgc3Rhci5maWVsZGluZy5uZWMuY28uanA=?=) Date: Thu, 29 May 2008 13:37:21 +0900 Subject: [SCore-users-jp] SCORE5.4 =?iso-2022-jp?b?GyRCJSshPCVNJWskSyREJCQkRhsoQg==?= In-Reply-To: <47F9B598.3090202@pccluster.org> References: <47F9B598.3090202@pccluster.org> Message-ID: <20080529133721serizawa@mail02.star.fielding.nec.co.jp> NECフィールディング(株) CSIセンター 芹沢です。  いつもお世話になっております。  4年前にSCORE5.4を導入していただいたお客様から、 問い合わせが来ておりご支援を戴きたくご連絡を差し上げました。  お忙しいところ申し訳ありませんが、サポートをいただければ 幸いです。 【現象】  外付けSCSIディスクを接続したいとのことで、指定のドライバ をインストールしたところ、起動途中でカーネルパニックを起こし 起動しない。  (添付の携帯画像を参照願います)  Scoreカーネル以外の、linux及びlinux-upでは正常に起動し、 外付けSCSIディスクもアクセス可能です。 【希望】   Scoreカーネルで外付けSCSIディスクを接続したい 【システム環境】  ■サーバ機器    Express5800/120Rd-1      CPU : Xeon 3.20GHz × 2個     メモリ : 1.5MB DISK : Ultra320 SCSI 15000rpm 18.1GB  ■OS    Redhat7.3  ■Score    バージョン 5.4.0  ■外付けSCSIディスク機器     1. Adaptec 社製 Ultra160 SCSI カード ASC-29160     2. デジタルテクノロジー社製 D-RAID DSP2U12i-20012       (Ultra160 ストレージ(200GB×12 本))     3. Adaptec 社製 SCSI ケーブル ACK-LVD-3M-U320  ■インストールしたドライバ(お客様が実施)    下記のページからダウンロードするように指示を受けました。(どこから指示されたかは未確認)     http://www.adaptec.com/en-US/speed/scsi/linux/aic7xxx-6_3_9-rh73_i686_rpm.htm    以下のコマンドの実行を指示され、実行しています。     # rpm -ivh aic7xxx-6.3.9-rh73.i686.rpm  その他必要な情報がございましたら、お送り致します。  お手数お掛け致しますがよろしくお願い致します。 --------------------------------------------------- 芹沢 健久 TAKEHISA SERIZAWA  NECフィールディング?   東日本システムサービス事業部    サーバストレージ構築部     クラスタシステムインテグレーションセンター   E-Mail:serizawa @ star.fielding.nec.co.jp  TEL : 03-3452-7359 FAX : 03-3452-7387 TELNET : 8-303-2102 TENET(FAX) : 8-303-2927 --------------------------------------------------- -------------- next part -------------- テキスト形式以外の添付ファイルを保管しました... ファイル名: Cluster-panic.jpg 型: image/jpeg サイズ: 28316 バイト 説明: 無し URL: From kameyama @ pccluster.org Thu May 29 15:08:05 2008 From: kameyama @ pccluster.org (Kameyama Toyohisa) Date: Thu, 29 May 2008 15:08:05 +0900 Subject: [SCore-users-jp] SCORE5.4 =?ISO-2022-JP?B?GyRCJSshPCVNJWsbKEI=?= =?ISO-2022-JP?B?GyRCJEskRCQkJEYbKEI=?= In-Reply-To: <20080529133721serizawa@mail02.star.fielding.nec.co.jp> References: <47F9B598.3090202@pccluster.org> <20080529133721serizawa@mail02.star.fielding.nec.co.jp> Message-ID: <483E4845.8070304@pccluster.org> 亀山です. serizawa @ star.fielding.nec.co.jp さんは書きました: >  (添付の携帯画像を参照願います) >  Scoreカーネル以外の、linux及びlinux-upでは正常に起動し、 > 外付けSCSIディスクもアクセス可能です。 > > 【希望】 >   Scoreカーネルで外付けSCSIディスクを接続したい > > 【システム環境】 >  ■サーバ機器 >    Express5800/120Rd-1 >      CPU : Xeon 3.20GHz × 2個 >     メモリ : 1.5MB > DISK : Ultra320 SCSI 15000rpm 18.1GB >  ■OS >    Redhat7.3 >  ■Score >    バージョン 5.4.0 >  ■外付けSCSIディスク機器 >     1. Adaptec 社製 Ultra160 SCSI カード ASC-29160 >     2. デジタルテクノロジー社製 D-RAID DSP2U12i-20012 >       (Ultra160 ストレージ(200GB×12 本)) >     3. Adaptec 社製 SCSI ケーブル ACK-LVD-3M-U320 > >  ■インストールしたドライバ(お客様が実施) >    下記のページからダウンロードするように指示を受けました。(どこから指示されたかは未確認) >     http://www.adaptec.com/en-US/speed/scsi/linux/aic7xxx-6_3_9-rh73_i686_rpm.htm SCore 5.x では redhat 7.3 に含まれている kernel を使用せず, オリジナルの kernel に SCore のための patch をあてて使用しています. 上記 rpm には redhat 7.3 に含まれている kernel のための driver しか含まれていないため, SCore 5.x の kernel では使用できません. 代わりに http://www.adaptec.com/ja-JP/speed/scsi/linux/aic7Yxx-2_0_26-6_3_11-linux-2_4_tgz.htm から SCSI driver の source code を download して, SCore kernel をコンパイルしてください. http://www.pccluster.org/score/dist/score-5.4.0/html/ja/installation/kernel-redhat.html を参考にしてください. 上記 tar file を展開すると aic7xxx-2.4 という directory ができます. これを /usr/src/linux-2.4.19score/drivers/scsi/aic7xxx と入れ替えます. # cd /usr/src/linux2.4.19score/drivers/scsi # mv aic7xxx aic7xxx.org # cp -r .../aic7xxx-2.4 aic7xxx あとは上記 html ドキュメントにしたがってください. 特に気を付けることは Adaptec AIC7xxx support と Adaptec AIC79xx support を有効にすること です. boot device が AIC-7902 のようなので, built-in にしてしまったほうが 安全かもしれません. Kameyama Toyohisa From serizawa @ star.fielding.nec.co.jp Thu May 29 17:34:06 2008 From: serizawa @ star.fielding.nec.co.jp (=?iso-2022-jp?b?c2VyaXphd2EgGyRCIXcbKEIgc3Rhci5maWVsZGluZy5uZWMuY28uanA=?=) Date: Thu, 29 May 2008 17:34:06 +0900 Subject: [SCore-users-jp] SCORE5.4 =?ISO-2022-JP?B?GyRCJSsbKEI=?= =?ISO-2022-JP?B?GyRCITwlTSVrJEskRCQkJEYbKEI=?= In-Reply-To: <483E4845.8070304@pccluster.org> References: <483E4845.8070304@pccluster.org> Message-ID: <20080529173406serizawa@mail02.star.fielding.nec.co.jp> To:亀山様    ̄ ̄ ̄ ̄ ̄ NECフィールディング(株) CSIセンター 芹沢です。 いつもお世話になっております。  早速のご返答をありがとうございました。  これから、お教えいただきました手順で当方で確認し、 その後お客様システムを復旧いたします。  ありがとうございました。 >亀山です. > >serizawa @ star.fielding.nec.co.jp さんは書きました: >>  (添付の携帯画像を参照願います) >>  Scoreカーネル以外の、linux及びlinux-upでは正常に起動し、 >> 外付けSCSIディスクもアクセス可能です。 >> >> 【希望】 >>   Scoreカーネルで外付けSCSIディスクを接続したい >> >> 【システム環境】 >>  ■サーバ機器 >>    Express5800/120Rd-1 >>      CPU : Xeon 3.20GHz × 2個 >>     メモリ : 1.5MB >> DISK : Ultra320 SCSI 15000rpm 18.1GB >>  ■OS >>    Redhat7.3 >>  ■Score >>    バージョン 5.4.0 >>  ■外付けSCSIディスク機器 >>     1. Adaptec 社製 Ultra160 SCSI カード ASC-29160 >>     2. デジタルテクノロジー社製 D-RAID DSP2U12i-20012 >>       (Ultra160 ストレージ(200GB×12 本)) >>     3. Adaptec 社製 SCSI ケーブル ACK-LVD-3M-U320 >> >>  ■インストールしたドライバ(お客様が実施) >>    下記のページからダウンロードするように指示を受けました。(どこから指示されたかは未確認) >>     http://www.adaptec.com/en-US/speed/scsi/linux/aic7xxx-6_3_9-rh73_i686_rpm.htm > >SCore 5.x では redhat 7.3 に含まれている kernel を使用せず, >オリジナルの kernel に SCore のための patch をあてて使用しています. > >上記 rpm には redhat 7.3 に含まれている kernel のための driver >しか含まれていないため, SCore 5.x の kernel では使用できません. >代わりに > http://www.adaptec.com/ja-JP/speed/scsi/linux/aic7Yxx-2_0_26-6_3_11-linux-2_4_tgz.htm >から SCSI driver の source code を download して, >SCore kernel をコンパイルしてください. > > http://www.pccluster.org/score/dist/score-5.4.0/html/ja/installation/kernel-redhat.html >を参考にしてください. > >上記 tar file を展開すると > aic7xxx-2.4 >という directory ができます. >これを > /usr/src/linux-2.4.19score/drivers/scsi/aic7xxx >と入れ替えます. > # cd /usr/src/linux2.4.19score/drivers/scsi > # mv aic7xxx aic7xxx.org > # cp -r .../aic7xxx-2.4 aic7xxx >あとは上記 html ドキュメントにしたがってください. >特に気を付けることは > Adaptec AIC7xxx support と Adaptec AIC79xx support を有効にすること >です. >boot device が AIC-7902 のようなので, built-in にしてしまったほうが >安全かもしれません. > >Kameyama Toyohisa --------------------------------------------------- 芹沢 健久 TAKEHISA SERIZAWA  NECフィールディング?   東日本システムサービス事業部    サーバストレージ構築部     クラスタシステムインテグレーションセンター   E-Mail:serizawa @ star.fielding.nec.co.jp  TEL : 03-3452-7359 FAX : 03-3452-7387 TELNET : 8-303-2102 TENET(FAX) : 8-303-2927 --------------------------------------------------- From ri002044 @ se.ritsumei.ac.jp Thu May 29 19:33:49 2008 From: ri002044 @ se.ritsumei.ac.jp (=?iso-2022-jp?B?GyRCNTUwZiEhTToycBsoQg==?=) Date: Thu, 29 May 2008 19:33:49 +0900 (JST) Subject: [SCore-users-jp] SCore-D:ERROR Unable to open PM ethernet/ethernet(error=2). Message-ID: <1212057229.15929.ri002044@se.ritsumei.ac.jp> 立命館大学の 亀井と申します。 現在、SCore環境の構築を行っているのですが、 SCoreプログラムの実行時のエラー対処法で困っております。 よろしければご教授願います。 構築しているPCクラスタは PCはサーバー1台(Cent OS 4.4 , PC名:bronto)と、 クライアン2台(RED HAT ENTERPRISE LINUX 5, CPU*4, PC名:nycto00, nycto01)の、 計3台でSCoreのVersionは6.0.2で、rpmファイルからインストールしました。 3台のPCへのSCoreのインストールは完了し、 SCOUTテストの手順1. $ scorehosts -l -g pcc2 2. $ sceptiv -v -g pcc2 3. $ msgb -group pcc2 & 4. $ scout -g pcc2 SCOUT: Spawan done. SCOUT: session started 5. $ scout ls, scout hostdate などのコマンド 上の1〜5はきちんと通り、よってSCoreは動いていると思われます。 続いてマンデルブローのサンプルプログラムを以下のコマンドで実行しようと すると、 $ scrun -node=2*2 /opt/score/6.0.2/demo/pmandel 以下の様なエラーが出てしまいます。 $ <1> SCore-D:WARNING argv[0] -config $ <0> SCore-D:WARNING argv[0] -config $ <1> SCore-D:WARNING argv[1] /var/score/scoreboard/ bronto.V1:hPMw $ <0> SCore-D:WARNING argv[1] /var/score/scoreboard/ bronto.V1:hPMw $ <1> SCore-D:ERROR Unable to open PM ethernet/ ethernet(error=2). $ <0> SCore-D:ERROR Unable to open PM ethernet/ ethernet(error=2). 現在の /opt/score/6.0.2/etc/scorehost.db の記述は以下のようになってい ます。 ////opt/score/6.0.2/etc/scorehost.db////////////////////////////////// /////////////////// /* PM/Myrinet */ myrinet type=myrinet \ -firmware:file=/opt/score/share/lanai/ lanai.mcp \ -config:file=/opt/score/etc/pm- myrinet.conf #define PCCethernet msgbserv=(bronto.hpc.cs.ritsumei.ac.jp:8766) \ cpugen=pentiun-iv speed=3000 smp=4 \ network=ethernet,shmem0,shmem1,shmem2,shmem3 \ group=pcc2 /* PM/Ethernet */ ethernet type=ethernet \ -config:file=/opt/score/6.0.2/etc/pm- ethernet.conf /* PM/Agent/UDP */ udp type=agent -agent=pmaudp \ -config:file=/opt/score/6.0.2/etc/pm-udp.conf /* PM/SHMEM */ shmem0 type=shmem -node=0 shmem1 type=shmem -node=1 shmem2 type=shmem -node=2 shmem3 type=shmem -node=3 #define PCCallnet msgbserv=(bronto.hpc.cs.ritsumei.ac.jp:8766) \ cpugen=pentiun-iii speed=500 smp=4 \ network=ethernet \ group=pcc2 #define PCCethernet msgbserv=(bronto.hpc.cs.ritsumei.ac.jp:8766) \ cpugen=pentiun-iv speed=3000 smp=4 \ network=ethernet,shmem0,shmem1,shmem2,shmem3 \ group=pcc2 nycto00.hpc.cs.ritsumei.ac.jp PCCethernet nycto01.hpc.cs.ritsumei.ac.jp PCCethernet ////////////////////////////////////////////////////////////////////// ////////////////// また、/opt/score/6.0.2/etc/pm_ethernet.conf の内容は以下のようにしてあ ります。 ////////opt/score/6.0.2/etc/pm_ethernet.conf////////////////////////// ///////////////// unit 0 intreap 0 # maxnsend 0 - 32 # maxnsend 0 # backoff 1000 - 20000 (usec) backoff 4800 # checksum (0 if off, 1 is on) checksum 0 # PE MAC address base hostname # comment # Host Number # Host Name # [IP Address] 0 00:1D:09:64:20:48 nycto00.hpc.cs.ritsumei.ac.jp 1 00:1d:09:64:20:1f nycto01.hpc.cs.ritsumei.ac.jp ////////////////////////////////////////////////////////////////////// ////////////////// 上記の設定で正しいでしょうか。 よろしくお願いします。 From kameyama @ pccluster.org Fri May 30 09:28:59 2008 From: kameyama @ pccluster.org (Kameyama Toyohisa) Date: Fri, 30 May 2008 09:28:59 +0900 Subject: [SCore-users-jp] SCore-D:ERROR Unable to open PM ethernet/ethernet(error=2). In-Reply-To: <1212057229.15929.ri002044@se.ritsumei.ac.jp> References: <1212057229.15929.ri002044@se.ritsumei.ac.jp> Message-ID: <483F4A4B.4090209@pccluster.org> 亀山です. 亀井 雄介 さんは書きました: > 3台のPCへのSCoreのインストールは完了し、 > SCOUTテストの手順1. $ scorehosts -l -g pcc2 > 2. $ sceptiv -v -g pcc2 > 3. $ msgb -group pcc2 & > 4. $ scout -g pcc2 > SCOUT: Spawan done. > SCOUT: session started > 5. $ scout ls, scout hostdate などのコマンド > > 上の1〜5はきちんと通り、よってSCoreは動いていると思われます。 インストールガイド http://www.pccluster.org/score/dist/score/html/ja/installation/index.html のシステムテストの SCOUT TEST Procedure までは OK のようです. > 続いてマンデルブローのサンプルプログラムを以下のコマンドで実行しようと > すると、 これは上記インストールガイドの "デモンストレーション" の内容ですが, PM テスト手順 SCore テスト手順 は実行してみましたでしょうか? (pmandel が動けば必要無いのですが, 失敗したときは, PM レベルの問題なのかもっと上かが切り分けられると思います.) > $ scrun -node=2*2 /opt/score/6.0.2/demo/pmandel > > 以下の様なエラーが出てしまいます。 > $ <1> SCore-D:WARNING argv[0] -config > $ <0> SCore-D:WARNING argv[0] -config > $ <1> SCore-D:WARNING argv[1] /var/score/scoreboard/ > bronto.V1:hPMw > $ <0> SCore-D:WARNING argv[1] /var/score/scoreboard/ > bronto.V1:hPMw > $ <1> SCore-D:ERROR Unable to open PM ethernet/ > ethernet(error=2). > $ <0> SCore-D:ERROR Unable to open PM ethernet/ > ethernet(error=2). 計算ホストに /vat/score/scoreboard はありますでしょうか? Kameyama Toyohisa From ri002044 @ se.ritsumei.ac.jp Fri May 30 18:19:34 2008 From: ri002044 @ se.ritsumei.ac.jp (=?iso-2022-jp?B?GyRCNTUwZiEhTToycBsoQg==?=) Date: Fri, 30 May 2008 18:19:34 +0900 (JST) Subject: [SCore-users-jp] SCore-D:ERROR Unable to open PM ethernet/ethernet( Message-ID: <1212139174.12665.ri002044@se.ritsumei.ac.jp> 立命館大学の亀井です。 亀山さん、回答ありがとうございます。 ご指摘頂いた通り、 インストールガイドの システムテスト   ・SCOUT Test Procedure   ・PMテスト手順   ・SCoreテスト手順   ・デモンストレーション の、1つ目のSCOUT Test Procedureまでしか実行していませんでした。 なので、2つ目のPMテスト手順(PM/Ethernetのテスト方法)を 行ってみました。 計算ホストPCのブート時に pm_ethernet は実行されていなかったので PMテスト手順(Ethernet)の # /etc/rc.d/init.d/pm_ethernet start と打つと、 Starting PM/Ethernet: NO PM/ethernet device is enables. If you want to use PM/Ethernet, please edit /etc/pm_ethernet.conf. このようになってしまいました。 また、計算ホストPCで # chkconfig --list pm_ethernet を行うと、 pm_ethernet 0:off 1:off 2:on 3:on 4:on 5:on 6:off のように on にはなっています。 どのようにすれば、pm_ethernet を start できますでしょうか。 >> $ scrun -node=2*2 /opt/score/6.0.2/demo/pmandel >> >> 以下の様なエラーが出てしまいます。 >> $ <1> SCore-D:WARNING argv[0] -config >> $ <0> SCore-D:WARNING argv[0] -config >> $ <1> SCore-D:WARNING argv[1] /var/score/scoreboard/ >> bronto.V1:hPMw >> $ <0> SCore-D:WARNING argv[1] /var/score/scoreboard/ >> bronto.V1:hPMw >> $ <1> SCore-D:ERROR Unable to open PM ethernet/ >> >> ethernet(error=2). >> $ <0> SCore-D:ERROR Unable to open PM ethernet/ >> ethernet(error=2). > >計算ホストに > /vat/score/scoreboard >はありますでしょうか? はい、計算ホスト2台ともに /var/score/scoreboard はあります。 よろしくお願いします。 亀井 雄介 From kameyama @ pccluster.org Fri May 30 19:07:53 2008 From: kameyama @ pccluster.org (Kameyama Toyohisa) Date: Fri, 30 May 2008 19:07:53 +0900 Subject: [SCore-users-jp] SCore-D:ERROR Unable to open PM ethernet/ethernet( In-Reply-To: <1212139174.12665.ri002044@se.ritsumei.ac.jp> References: <1212139174.12665.ri002044@se.ritsumei.ac.jp> Message-ID: <483FD1F9.2060405@pccluster.org> 亀山です. 亀井 雄介 さんは書きました: > 計算ホストPCのブート時に pm_ethernet は実行されていなかったので > PMテスト手順(Ethernet)の > # /etc/rc.d/init.d/pm_ethernet start と打つと、 > Starting PM/Ethernet: NO PM/ethernet device is enables. > If you want to use PM/Ethernet, please edit /etc/pm_ethernet.conf. > このようになってしまいました。 SCore SystemのCompute Hostへのインストール http://www.pccluster.org/score/dist/score/html/ja/installation/sys-compute.html の 4. を見てください. Kameyama Toyohisa