From yagishin @ cello.ocn.ne.jp Sun Apr 2 23:45:59 2006 From: yagishin @ cello.ocn.ne.jp (Shinnosuke Yagi) Date: Sun, 02 Apr 2006 23:45:59 +0900 Subject: [SCore-users-jp] =?iso-2022-jp?b?bWtkZXZmaWxlGyRCJEskRCQkGyhC?= =?iso-2022-jp?b?GyRCJEYbKEI=?= Message-ID: <20060402232100.2387.YAGISHIN@cello.ocn.ne.jp> お世話になります。 八木と申します。 以前とは別件でRHEL4をインストールしたXeonEM64TマシンにSCoreを導入したいのですが、 計算ホストのインストールで行き詰まってしまいました。 症状としては、 /opt/score/install/setup -score_comp -pbs_comp を実行したところ、 エラーが発生して memory、myrinet、ethernet、shmemがインストールできません。 エラメッセージは make device memory /opt/score/install/setup: line 203: ../mkdevfile: No such file or directory となっていました。 memory以外のデバイスについても、memoryの部分が myrinet, ethernet, shmem にそれぞれ変わった以外は全く同じエラーメッセージでした。 とりあえず /opt/score/score-src/SCore/tools/pm2/mkdevfile を /opt/score/install/にコピーしてみたのですが、 make device memory ../mkdevfile: line 26: /opt/score/score-src/SCore/pm2/tools/obj.x86_64-redhat-li nux2_6/mkdevfile.exe: No such file or directory ../mkdevfile: line 26: exec: /opt/score/score-src/SCore/pm2/tools/obj.x86_64-red hat-linux2_6/mkdevfile.exe: cannot execute: No such file or directory と若干エラーメッセージが変化しただけで状況は進展せず、 ここで行き詰まってしまいました。 ちなみにサーバーマシンはソースからmakeしており、 カーネルはlinux-2.6.11.12にpatchを適用しました。 menuconfigでは PM/Shmem driver、PM/Ethernet driver、PM/Memory (common) driver を選択し、 PM/Ethernet -nkp driverとPM/Myrinet driverは選択しませんでした。 どなたか原因、解決法等ご存じであればご助言いただけませんでしょうか。 よろしくお願い致します。 -- Shinnosuke Yagi From kameyama @ pccluster.org Mon Apr 3 10:04:52 2006 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Mon, 03 Apr 2006 10:04:52 +0900 Subject: [SCore-users-jp] =?ISO-2022-JP?B?bWtkZXZmaWxlGyRCJEsbKEI=?= =?ISO-2022-JP?B?GyRCJEQkJCRGGyhC?= In-Reply-To: Your message of "Sun, 02 Apr 2006 23:45:59 JST." <20060402232100.2387.YAGISHIN@cello.ocn.ne.jp> Message-ID: <20060403010452.6D68721EF56@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <20060402232100.2387.YAGISHIN @ cello.ocn.ne.jp> Shinnosuke Yagi wrotes: > とりあえず > /opt/score/score-src/SCore/tools/pm2/mkdevfile を > /opt/score/install/にコピーしてみたのですが、 work directory にできる mkdevfile は wrapper です. 実際の program は obj.`config.nickname`/mkdevfile.exe にあります. この diretory の make に成功していれば mkdevfile も正しい位置に コピーされるはずなのですが... > make device memory > ../mkdevfile: line 26: /opt/score/score-src/SCore/pm2/tools/obj.x86_64-redhat > -li > nux2_6/mkdevfile.exe: No such file or directory できていないようです... この directory の make は成功しているでしょうか? from Kameyama Toyohisa From shimada @ kanto-gakuin.ac.jp Mon Apr 3 13:47:38 2006 From: shimada @ kanto-gakuin.ac.jp (Kazuhiro Shimada) Date: Mon, 3 Apr 2006 13:47:38 +0900 Subject: [SCore-users-jp] =?iso-2022-jp?b?U0NPUkU6IBskQiUoJWkhPBsoQg==?= In-Reply-To: <20060403010452.6D68721EF56@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <003901c656d9$bc529ae0$2e652696@ezuqpy1dn0icvqh> 関東学院大の島田と申します。 プログラムを実行すると、以下のようなエラーが出るのですが、これはどういうエ ラーでしょうか。mpi_allreduceでのエラーのようですが。。。 x86_64システムで、intel fortran compiler 9を使っています。 SCore-D 5.8.3 connected (jid=10,reconnect=32897). <0:0> SCORE: 4 nodes (2x2) ready. SCORE: Deadlock detected <0:0> Trying to attach GDB (no DISPLAY): Exception signal (SIGHUP) <0:1> Trying to attach GDB (no DISPLAY): Exception signal (SIGHUP) <1:0> Trying to attach GDB (no DISPLAY): Exception signal (SIGHUP) <1:1> Trying to attach GDB (no DISPLAY): Exception signal (SIGHUP) <0:1> GDB invoked by SCore (batch) Using host libthread_db library "/lib64/tls/libthread_db.so.1". Using host libthread_db library "/lib64/tls/libthread_db.so.1". Using host libthread_db library "/lib64/tls/libthread_db.so.1". 0x00000000007a37f9 in syscall () #0 0x00000000007a37f9 in syscall () #1 0x00000000006f37da in nanosleep_caller (handle=0x7fffffffc5d0, retp=0x7fffffffc414, args=0x18) at ../scwrap.c:316 #2 0x00000000006f469b in vsyscall (handle=0x7fffffffc5d0, retp=0x7fffffffc5d0, args=0x246) at ../scwrap.c:832 #3 0x00000000006f4725 in score_syscall (handle=0x7fffffffc5d0, retp=0x7fffffffc5d0) at ../scwrap.c:847 #4 0x00000000006f62a2 in __nanosleep (req=0x7fffffffc5d0, rem=0x7fffffffc5d0) at ../scwrap.c:1059 #5 0x00000000007a097c in sleep () #6 0x00000000006ae1ce in score_wait_forever () at ../libsc_util.c:169 #7 0x00000000006ae7ce in sc_inspectme (x_display=0x7fffffffff25 "", signal=1) at ../libscio.c:243 #8 0x00000000006a22c1 in MPID_SCORE_Exception () #9 #10 0x00000000007a29a9 in ioctl () #11 0x00000000006c742d in pmEthernetReceive (pmc=0x23d3910, bufp=0x7fffffffcb68, lengthp=0x7fffffffcb70) at ../pm_ethernet.c:2433 #12 0x00000000006c1c91 in comp_receive (pmc=0x23cecb0, bufp=0x7fffffffcb68, lenp=0x7fffffffcb70) at ../pm_composite.c:999 #13 0x00000000006a0903 in MPID_SCORE_Recv_Message () #14 0x000000000069fa96 in MPID_SCORE_PIbrecv () #15 0x00000000006a6b39 in MPID_CH_Check_incoming () #16 0x00000000006a544e in MPID_RecvComplete () #17 0x00000000006a2c90 in MPI_Waitall () #18 0x00000000006a2fdd in MPI_Sendrecv () #19 0x00000000006987cf in intra_Allreduce () #20 0x000000000069285e in MPI_Allreduce () #21 0x000000000068a2ad in mpi_allreduce_ () #22 0x00000000005431de in m_xc_potential_mp_xcpotf_ () #23 0x000000000053fb4a in m_xc_potential_mp_m_xc_cal_potential_ () #24 0x00000000005e82b7 in initial_electronic_structure_ () #25 0x00000000005a9fc6 in MAIN__ () #26 0x0000000000400296 in main () From kameyama @ pccluster.org Mon Apr 3 13:57:24 2006 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Mon, 03 Apr 2006 13:57:24 +0900 Subject: [SCore-users-jp] SCORE: =?ISO-2022-JP?B?GyRCJSglaSE8GyhC?= In-Reply-To: Your message of "Mon, 03 Apr 2006 13:47:38 JST." <003901c656d9$bc529ae0$2e652696@ezuqpy1dn0icvqh> Message-ID: <20060403045724.89E1A21EF56@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <003901c656d9$bc529ae0$2e652696 @ ezuqpy1dn0icvqh> "Kazuhiro Shimada" wrotes: > プログラムを実行すると、以下のようなエラーが出るのですが、これはどういうエ > ラーでしょうか。mpi_allreduceでのエラーのようですが。。。 > x86_64システムで、intel fortran compiler 9を使っています。 > > SCore-D 5.8.3 connected (jid=10,reconnect=32897). > <0:0> SCORE: 4 nodes (2x2) ready. > SCORE: Deadlock detected MPI プロセスが Deadlock をおこしているようです. (全部のプロセスが受信待ちになっているとか...) > #20 0x000000000069285e in MPI_Allreduce () > #21 0x000000000068a2ad in mpi_allreduce_ () > #22 0x00000000005431de in m_xc_potential_mp_xcpotf_ () > #23 0x000000000053fb4a in m_xc_potential_mp_m_xc_cal_potential_ () > #24 0x00000000005e82b7 in initial_electronic_structure_ () > #25 0x00000000005a9fc6 in MAIN__ () > #26 0x0000000000400296 in main () 場所は m_xc_potential_mp_xcpotf の MPI_Allreduce の呼び出しの あたりのようですけど... from Kameyama Toyohisa From yagishin @ cello.ocn.ne.jp Tue Apr 4 19:56:09 2006 From: yagishin @ cello.ocn.ne.jp (Shinnosuke Yagi) Date: Tue, 04 Apr 2006 19:56:09 +0900 Subject: [SCore-users-jp] =?ISO-2022-JP?B?bWtkZXZmaWxlGyRCJEskRCQkJEYbKEI=?= In-Reply-To: <20060404020058.A4F4621EF56@neal.il.is.s.u-tokyo.ac.jp> References: <20060403215417.F1F3.YAGISHIN@cello.ocn.ne.jp> <20060404020058.A4F4621EF56@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <20060404195407.C316.YAGISHIN@cello.ocn.ne.jp> 八木です。お手数をおかけします。 score-src/SCore/pm2でのmakeで発生するエラーは以下のようなものでした。 ちなみに、score-src/SCore/build/config/x86_64-redhat-linux2_6にある KERNELINCLUDEを空欄(x86_64-fedoracore3-linux2_6と同じ)にすると、 HDDいっぱいにファイルが作成されてエラーが出てしまいます。 (パーティションを2Gほど確保しても状況が変わらなかったのでおそらく  makeのどこかでループが生じているのではないかと思われます。) 以下、makeで出力されたエラーメッセージです。 (これと同様のものが5回ほど発生しました。  それぞれ、pm_myri_sys.c、pm_myri2k_sys、pm_myrixp_sys、pm_myry2xp_sys  などに対応しているようです) In file included from /usr/src/kernels/linux-2.6.11.12/include/linux/pci.h:20, from ../pm_myri_sys.c:88: /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:18: error: 文法 エラー が "__u32" の前にあります /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:18: 警告: struc t や union の最後にセミコロンがありません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:19: 警告: `subv endor' の宣言で型がデフォルトの `int' とされました /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:19: 警告: `subd evice' の宣言で型がデフォルトの `int' とされました /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:19: 警告: デー タ定義が型や記憶クラスを持っていません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:20: error: 文法 エラー が "class" の前にあります /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:20: 警告: `clas s' の宣言で型がデフォルトの `int' とされました /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:20: 警告: `clas s_mask' の宣言で型がデフォルトの `int' とされました /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:20: 警告: デー タ定義が型や記憶クラスを持っていません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:21: error: 文法 エラー が "driver_data" の前にあります /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:21: 警告: `driv er_data' の宣言で型がデフォルトの `int' とされました /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:21: 警告: デー タ定義が型や記憶クラスを持っていません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:31: error: 文法 エラー が "__u32" の前にあります /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:31: 警告: struc t や union の最後にセミコロンがありません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:32: 警告: `vend or_id' の宣言で型がデフォルトの `int' とされました /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:32: 警告: デー タ定義が型や記憶クラスを持っていません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:33: error: 文法 エラー が "model_id" の前にあります /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:33: 警告: `mode l_id' の宣言で型がデフォルトの `int' とされました /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:33: 警告: デー タ定義が型や記憶クラスを持っていません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:34: error: 文法 エラー が "specifier_id" の前にあります /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:34: 警告: `spec ifier_id' の宣言で型がデフォルトの `int' とされました /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:34: 警告: デー タ定義が型や記憶クラスを持っていません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:35: error: 文法 エラー が "version" の前にあります /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:35: 警告: `vers ion' の宣言で型がデフォルトの `int' とされました /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:35: 警告: デー タ定義が型や記憶クラスを持っていません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:36: error: 文法 エラー が "driver_data" の前にあります /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:36: 警告: `driv er_data' の宣言で型がデフォルトの `int' とされました /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:36: 警告: デー タ定義が型や記憶クラスを持っていません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:99: error: 文法 エラー が "__u16" の前にあります /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:99: 警告: struc t や union の最後にセミコロンがありません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:102: 警告: `idV endor' の宣言で型がデフォルトの `int' とされました /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:102: 警告: デー タ定義が型や記憶クラスを持っていません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:103: error: 文 法エラー が "idProduct" の前にあります /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:103: 警告: `idP roduct' の宣言で型がデフォルトの `int' とされました /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:103: 警告: デー タ定義が型や記憶クラスを持っていません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:104: error: 文 法エラー が "bcdDevice_lo" の前にあります /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:104: 警告: `bcd Device_lo' の宣言で型がデフォルトの `int' とされました /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:104: 警告: デー タ定義が型や記憶クラスを持っていません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:105: error: 文 法エラー が "bcdDevice_hi" の前にあります /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:105: 警告: `bcd Device_hi' の宣言で型がデフォルトの `int' とされました /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:105: 警告: デー タ定義が型や記憶クラスを持っていません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:108: error: 文 法エラー が "bDeviceClass" の前にあります /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:108: 警告: `bDe viceClass' の宣言で型がデフォルトの `int' とされました /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:108: 警告: デー タ定義が型や記憶クラスを持っていません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:109: error: 文 法エラー が "bDeviceSubClass" の前にあります /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:109: 警告: `bDe viceSubClass' の宣言で型がデフォルトの `int' とされました /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:109: 警告: デー タ定義が型や記憶クラスを持っていません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:110: error: 文 法エラー が "bDeviceProtocol" の前にあります /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:110: 警告: `bDe viceProtocol' の宣言で型がデフォルトの `int' とされました /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:110: 警告: デー タ定義が型や記憶クラスを持っていません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:113: error: 文 法エラー が "bInterfaceClass" の前にあります /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:113: 警告: `bIn terfaceClass' の宣言で型がデフォルトの `int' とされました /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:113: 警告: デー タ定義が型や記憶クラスを持っていません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:114: error: 文 法エラー が "bInterfaceSubClass" の前にあります /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:114: 警告: `bIn terfaceSubClass' の宣言で型がデフォルトの `int' とされました /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:114: 警告: デー タ定義が型や記憶クラスを持っていません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:115: error: 文 法エラー が "bInterfaceProtocol" の前にあります /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:115: 警告: `bIn terfaceProtocol' の宣言で型がデフォルトの `int' とされました /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:115: 警告: デー タ定義が型や記憶クラスを持っていません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:118: error: 文 法エラー が "driver_info" の前にあります /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:118: 警告: `dri ver_info' の宣言で型がデフォルトの `int' とされました /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:118: 警告: デー タ定義が型や記憶クラスを持っていません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:135: error: 文 法エラー が "__u16" の前にあります /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:135: 警告: stru ct や union の最後にセミコロンがありません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:137: 警告: `cu_ type' の宣言で型がデフォルトの `int' とされました /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:137: 警告: デー タ定義が型や記憶クラスを持っていません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:138: error: 文 法エラー が "dev_type" の前にあります /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:138: 警告: `dev _type' の宣言で型がデフォルトの `int' とされました /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:138: 警告: デー タ定義が型や記憶クラスを持っていません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:139: error: 文 法エラー が "cu_model" の前にあります /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:139: 警告: `cu_ model' の宣言で型がデフォルトの `int' とされました /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:139: 警告: デー タ定義が型や記憶クラスを持っていません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:140: error: 文 法エラー が "dev_model" の前にあります /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:140: 警告: `dev _model' の宣言で型がデフォルトの `int' とされました /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:140: 警告: デー タ定義が型や記憶クラスを持っていません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:142: error: 文 法エラー が "driver_info" の前にあります /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:142: 警告: `dri ver_info' の宣言で型がデフォルトの `int' とされました /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:142: 警告: デー タ定義が型や記憶クラスを持っていません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:155: error: 文 法エラー が "__u8" の前にあります /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:155: 警告: stru ct や union の最後にセミコロンがありません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:156: 警告: `dri ver_data' の宣言で型がデフォルトの `int' とされました /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:156: 警告: デー タ定義が型や記憶クラスを持っていません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:160: error: 文 法エラー が "__u8" の前にあります /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:160: 警告: stru ct や union の最後にセミコロンがありません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:161: 警告: `dri ver_data' の宣言で型がデフォルトの `int' とされました /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:161: 警告: デー タ定義が型や記憶クラスを持っていません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:163: error: 文 法エラー が "__u8" の前にあります /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:163: 警告: stru ct や union の最後にセミコロンがありません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:164: 警告: `dev s' の宣言で型がデフォルトの `int' とされました /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:164: 警告: デー タ定義が型や記憶クラスを持っていません /usr/src/kernels/linux-2.6.11.12/include/linux/mod_devicetable.h:165: error: 文 法エラー が '}' トークンの前にあります ../pm_myri_sys.c:29: 警告: 'rcsid' defined but not used make[4]: *** [pm_myri_sys.o] エラー 1 make[4]: Leaving directory `/opt/score/score-src/SCore/pm2/arch/myrinet/lib/obj. x86_64-redhat-linux2_6' make[3]: *** [srcdir-all] エラー 2 make[3]: Leaving directory `/opt/score/score-src/SCore/pm2/arch/myrinet/lib' make[2]: Leaving directory `/opt/score/score-src/SCore/pm2/arch/myrinet' -- Shinnosuke Yagi From kameyama @ pccluster.org Tue Apr 4 20:29:35 2006 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Tue, 04 Apr 2006 20:29:35 +0900 Subject: [SCore-users-jp] =?ISO-2022-JP?B?bWtkZXZmaWxlGyRCJEsbKEI=?= =?ISO-2022-JP?B?GyRCJEQkJCRGGyhC?= In-Reply-To: Your message of "Tue, 04 Apr 2006 19:56:09 JST." <20060404195407.C316.YAGISHIN@cello.ocn.ne.jp> Message-ID: <20060404112935.B301E21EF56@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <20060404195407.C316.YAGISHIN @ cello.ocn.ne.jp> Shinnosuke Yagi wrotes: > score-src/SCore/pm2でのmakeで発生するエラーは以下のようなものでした。 ここは /usr/include/linux/pci.h のほうをみれば動きそうなので, KERNELINCLUDE を null にすれば良さそうですが... > ちなみに、score-src/SCore/build/config/x86_64-redhat-linux2_6にある > KERNELINCLUDEを空欄(x86_64-fedoracore3-linux2_6と同じ)にすると、 > HDDいっぱいにファイルが作成されてエラーが出てしまいます。 つまり, disk full になってしまう, ということでしょうか? > (パーティションを2Gほど確保しても状況が変わらなかったのでおそらく >  makeのどこかでループが生じているのではないかと思われます。) 必要な容量は mpich の数や oprional compiler によっても変化します. 現在, PM が出来ていなくてほとんどの program が出来ていない状況 だと推測しますので, 成功したときと比較すると多くの容量に なることが考えられます. (さすがに, SCore だけで 2 GB 消費するとは思いませんが...) とりあえず, SCore だけコンパイルしてみてください. % cd score-src % make distclean;./configure ... % cd SCore % make;make install これが成功したら個別に make してみてください. だいたい % cd ..,/score-src % cd runtime/mpi % /opt/score/bin/smake distclean % /opt/score/bin/smake % /opt/score/bin/smake install のように top directory で smake distclean;smake;smake install すれば make できると思います. from Kameyama Toyohisa From yagishin @ cello.ocn.ne.jp Wed Apr 5 22:43:07 2006 From: yagishin @ cello.ocn.ne.jp (Shinnosuke Yagi) Date: Wed, 05 Apr 2006 22:43:07 +0900 Subject: [SCore-users-jp] =?ISO-2022-JP?B?bWtkZXZmaWxlGyRCJEskRCQkJEYbKEI=?= In-Reply-To: <20060404112935.B301E21EF56@neal.il.is.s.u-tokyo.ac.jp> References: <20060404195407.C316.YAGISHIN@cello.ocn.ne.jp> <20060404112935.B301E21EF56@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <20060405224008.8212.YAGISHIN@cello.ocn.ne.jp> 八木です。 ご助言の通り KERNELINCULDEをnullにした上で、個別に一つ一つmakeしていったら 無事インストールすることができました。 どうもありがとうございました。 -- Shinnosuke Yagi From yagishin @ cello.ocn.ne.jp Mon Apr 10 12:26:48 2006 From: yagishin @ cello.ocn.ne.jp (Shinnosuke Yagi) Date: Mon, 10 Apr 2006 12:26:48 +0900 Subject: [SCore-users-jp] ERROR pmAttachContext Message-ID: <20060410112501.2507.YAGISHIN@cello.ocn.ne.jp> 八木です。いつもお世話になっております。 先日のSCOREシステム( RHEL4 WS , XeonEM64T Dual )なのですが、 Ethernetのrpmtestで以下のようなエラーが出てしまいます。 #rpmtest host1 ethernet -reply (別のシェルで) #rpmtest host2 ethernet -dest 1 -ping pmEthernetGetSendBuffer(0x6306a0, 1, 0x7ffffffd4c8, 8) : Send to myself 1 その前に Invalid argument のエラーメッセージが出たため、 PM_DEBUGは1にしてあります。 気になる点として、/opt/score/etc/pm-ethernet.conf ファイルで設定した ノード番号と -dest の値が一致しない(Nodenumber が0のhost1に対するpingは -dest 1でないと届かず、-dest 0 ではタイムアウトになってしまう。また NodeNumberが1のhost2の場合はその逆になる)ということがありますが、 いろいろ試してみたものの対処法がわからず悩んでいます。 どなたか対処法等ご存じでしたらご助言いただけないでしょうか。 -- Shinnosuke Yagi From kameyama @ pccluster.org Mon Apr 10 12:30:32 2006 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Mon, 10 Apr 2006 12:30:32 +0900 Subject: [SCore-users-jp] Re: [SCore-users] Armci problem with lammpi Message-ID: <20060410033032.0F51B21EF56@neal.il.is.s.u-tokyo.ac.jp> Note that SCore-users mailling list is supported SCore cluster system. SCore dose not include LAM or ARMCI. In article <57334b600604070707w19eb0e82s34b8ebeffa04317e @ mail.gmail.com> "Pee yush Jain" wrotes: > I am doing ARMCI with lammpi-7.1.1 on two processor. When I check > test.x on one processor, it works fine but when i check it on more > than two computers, then i get > the following error: > > $mpirun -np 2 -v ./test.x > 7605 ./test.x running on n0 (o) > 3168 ./test.x running on n1 > ARMCI configured for 2 cluster nodes. Network protocol is 'TCP/IP Sockets'. > 1:trying connect to host=3Dpeeyush, port=3D37912 t=3D5 111 The ARMCI program exchange gethostname() as hostname. And the program try to connect the hostname. This means all host must be able to connect by each gethostname(). But your 2 hosts cannot connect gethostname (peeyush and localhost). Please check hostname on each hosts. from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Mon Apr 10 12:48:32 2006 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Mon, 10 Apr 2006 12:48:32 +0900 Subject: [SCore-users-jp] ERROR pmAttachContext In-Reply-To: Your message of "Mon, 10 Apr 2006 12:26:48 JST." <20060410112501.2507.YAGISHIN@cello.ocn.ne.jp> Message-ID: <20060410034832.AF16F21EF56@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <20060410112501.2507.YAGISHIN @ cello.ocn.ne.jp> Shinnosuke Yagi wrotes: > 先日のSCOREシステム( RHEL4 WS , XeonEM64T Dual )なのですが、 > Ethernetのrpmtestで以下のようなエラーが出てしまいます。 > #rpmtest host1 ethernet -reply > (別のシェルで) > #rpmtest host2 ethernet -dest 1 -ping > pmEthernetGetSendBuffer(0x6306a0, 1, 0x7ffffffd4c8, 8) : Send to myself 1 > > その前に Invalid argument のエラーメッセージが出たため、 > PM_DEBUGは1にしてあります。 pm-ethernet.conf の指定は 0 host1 1 host2 になっているのですね. rpmtest host2 ethernet -dest 1 -ping で "-dest 1" という指定は -ping を送る相手が pm-ethernet.conf の host2 すなわち自分自身に送るという意味です. それで, PM/Ethernet は自分自身への送信はサポートしていないのでエラーになります. ここで rpmtest host2 ethernet -dest 0 -ping を行なうと host2 の rpmtest が host 番号 0 の host1 に送られて 成功すると思います. > 気になる点として、/opt/score/etc/pm-ethernet.conf ファイルで設定した > ノード番号と -dest の値が一致しない(Nodenumber が0のhost1に対するpingは > -dest 1でないと届かず、-dest 0 ではタイムアウトになってしまう。また > NodeNumberが1のhost2の場合はその逆になる)ということがありますが、 > いろいろ試してみたものの対処法がわからず悩んでいます。 上記の例では逆になっているような... from Kameyama Toyohisa