From si011015 @ fh-stpoelten.ac.at Fri Apr 1 19:32:43 2005 From: si011015 @ fh-stpoelten.ac.at (=?iso-2022-jp?b?c2kwMTEwMTUgGyRCIXcbKEIgZmgtc3Rwb2VsdGVuLmFjLmF0?=) Date: Fri, 1 Apr 2005 12:32:43 +0200 (CEST) Subject: [SCore-users-jp] [SCore-users] Problems with MPI when running CHARMM Message-ID: <40721.131.130.40.20.1112351563.squirrel@mail.fh-stpoelten.ac.at> Hello score users, I sucessefully compiled SCore from source on two dual-pentium III machines. One is the server and both are compute hosts. The provided examples run without any errors. The only difference to the installation documentation is: [root @ omega sbin]# sceptic -v -g pcc omega.mdy.univie.ac.at: scping FAILED sheet.mdy.univie.ac.at: scping FAILED sheet.mdy.univie.ac.at: OK omega.mdy.univie.ac.at: OK All host responding. But I didn't pay it much attention. Should I? I compiled CHARMM which is used in our group (molecular dynamic simulations) and linked it with the /opt/score/mpi/mpich-1.2.5/ library. I start CHARMM with the following command: scrun -nodes=$n /opt/c32a1_MPICH_CMPI_GENCOMM/exec/gnu/charmm < charmm.inp > test.$n If $n=1 --> I run on the local machine and 1 cpu everything works out fine. If $n=1x2 --> I run on 2 machines with 1 cpu some communication is done, but somethings going wrong because the results are bad, and the program aborts with the following error message on stderror: <0:0> SCORE: 2 nodes (1x2) ready. <0:0>SCore: *** SIGNAL EXCEPTION eip=0x08698790, cr2=0x 37daf88 *** <0:0>SCore: gs=0x0000, fs=0x0000, es=0x002b, ds=0x002b <0:0>SCore: edi=0x037daf88, esi=0x80000001, ebp=0xbfffda08, esp=0xbfffd6b0 <0:0>SCore: ebx=0xffffffff, edx=0x0d5c4d60, ecx=0x0d5dbd78, eax=0x0d5dbd78 <0:0>SCore: trapno=0x0000000e, err=0x00000004, eip=0x08698790, cs=0x0023 <0:0>SCore: esp_at_signal=0xbfffd6b0, ss=0x002b, oldmask=0x00000000, cr2=0x037daf88 <0:0> Trying to attach GDB (DISPLAY=localhost:11.0): Exception signal (SIGSEGV) <1:1>SCore: *** SIGNAL EXCEPTION eip=0x08698790, cr2=0x 37daf88 *** <1:1>SCore: gs=0x0000, fs=0x0000, es=0x002b, ds=0x002b <1:1>SCore: edi=0x037daf88, esi=0x80000001, ebp=0xbfffda08, esp=0xbfffd6b0 <1:1>SCore: ebx=0xffffffff, edx=0x0d5c4518, ecx=0x0d5db530, eax=0x0d5db530 <1:1>SCore: trapno=0x0000000e, err=0x00000004, eip=0x08698790, cs=0x0023 <1:1>SCore: esp_at_signal=0xbfffd6b0, ss=0x002b, oldmask=0x00000000, cr2=0x037daf88 <0:1> Trying to attach GDB (DISPLAY=localhost:11.0): Exception signal (SIGSEGV) SCORE: Program aborted. If $n=2x1 --> I run on the local machine with 2 cpus it is the same, only the error message is shorter: 0:0> SCORE: 2 nodes (2x1) ready. <1:0>SCore: *** SIGNAL EXCEPTION eip=0x08698790, cr2=0x 37daf88 *** <1:0>SCore: gs=0x0000, fs=0x0000, es=0x002b, ds=0x002b <1:0>SCore: edi=0x037daf88, esi=0x80000001, ebp=0xbfffda08, esp=0xbfffd6b0 <1:0>SCore: ebx=0xffffffff, edx=0x0d5c4518, ecx=0x0d5db530, eax=0x0d5db530 <1:0>SCore: trapno=0x0000000e, err=0x00000004, eip=0x08698790, cs=0x0023 <1:0>SCore: esp_at_signal=0xbfffd6b0, ss=0x002b, oldmask=0x00000000, cr2=0x037daf88 <1:0> Trying to attach GDB (DISPLAY=localhost:11.0): Exception signal (SIGSEGV) SCORE: Program aborted. If $n=4 --> 2 machines with 2 cpus the program hangs before any communication is done, but scrun doesn't abort and all 4 cpus run on almost 100% I attached the outputfiles ( test.{1,1x2,2x1,4} ). If anyone is using CHARMM, it might help. Any help is appreciated! Thank you! Best regards, Alfred Karl University of Vienna University of Applied Sience St. Poelten -------------- next part -------------- テキスト形式以外の添付ファイルを保管しました... ファイル名: test.1 型: application/octet-stream サイズ: 72356 バイト 説明: 無し URL: -------------- next part -------------- テキスト形式以外の添付ファイルを保管しました... ファイル名: test.1x2 型: application/octet-stream サイズ: 16982 バイト 説明: 無し URL: -------------- next part -------------- テキスト形式以外の添付ファイルを保管しました... ファイル名: test.2x1 型: application/octet-stream サイズ: 16982 バイト 説明: 無し URL: -------------- next part -------------- テキスト形式以外の添付ファイルを保管しました... ファイル名: test.4 型: application/octet-stream サイズ: 16883 バイト 説明: 無し URL: From kameyama @ pccluster.org Fri Apr 1 20:27:26 2005 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Fri, 01 Apr 2005 20:27:26 +0900 Subject: [SCore-users-jp] Re: [SCore-users] Problems with MPI when running CHARMM In-Reply-To: Your message of "Fri, 01 Apr 2005 12:32:43 JST." <40721.131.130.40.20.1112351563.squirrel@mail.fh-stpoelten.ac.at> Message-ID: <20050401112726.22EC821EF52@neal.il.is.s.u-tokyo.ac.jp> In article <40721.131.130.40.20.1112351563.squirrel @ mail.fh-stpoelten.ac.at> si011015 @ fh-stpoelten.ac.at wrotes: > I compiled CHARMM which is used in our group (molecular dynamic > simulations) and linked it with the /opt/score/mpi/mpich-1.2.5/ library. > > I start CHARMM with the following command: > scrun -nodes=$n /opt/c32a1_MPICH_CMPI_GENCOMM/exec/gnu/charmm < charmm.inp > > test.$n > > If $n=1 --> I run on the local machine and 1 cpu > everything works out fine. > > If $n=1x2 --> I run on 2 machines with 1 cpu scrun -nodes=1x2 means 1 macines with 2 cpus. http://www.pccluster.org/score/dist/score/html/en/man/man1/scrun.html > some communication is done, but somethings going wrong because the results > are bad, and the program aborts with the following error message on > stderror: > > <0:0> SCORE: 2 nodes (1x2) ready. > <0:0>SCore: *** SIGNAL EXCEPTION eip=0x08698790, cr2=0x 37daf88 *** > <0:0>SCore: gs=0x0000, fs=0x0000, es=0x002b, ds=0x002b > <0:0>SCore: edi=0x037daf88, esi=0x80000001, ebp=0xbfffda08, esp=0xbfffd6b0 > <0:0>SCore: ebx=0xffffffff, edx=0x0d5c4d60, ecx=0x0d5dbd78, eax=0x0d5dbd78 > <0:0>SCore: trapno=0x0000000e, err=0x00000004, eip=0x08698790, cs=0x0023 > <0:0>SCore: esp_at_signal=0xbfffd6b0, ss=0x002b, oldmask=0x00000000, > cr2=0x037daf88 > <0:0> Trying to attach GDB (DISPLAY=localhost:11.0): Exception signal > (SIGSEGV) > <1:1>SCore: *** SIGNAL EXCEPTION eip=0x08698790, cr2=0x 37daf88 *** > <1:1>SCore: gs=0x0000, fs=0x0000, es=0x002b, ds=0x002b > <1:1>SCore: edi=0x037daf88, esi=0x80000001, ebp=0xbfffda08, esp=0xbfffd6b0 > <1:1>SCore: ebx=0xffffffff, edx=0x0d5c4518, ecx=0x0d5db530, eax=0x0d5db530 > <1:1>SCore: trapno=0x0000000e, err=0x00000004, eip=0x08698790, cs=0x0023 > <1:1>SCore: esp_at_signal=0xbfffd6b0, ss=0x002b, oldmask=0x00000000, > cr2=0x037daf88 > <0:1> Trying to attach GDB (DISPLAY=localhost:11.0): Exception signal > (SIGSEGV) > SCORE: Program aborted. Program aborted at address 0x08698790 by SIGSEGV. If your program is compiled and linked with -g option, please run with debug option on scrun: % env DISPLAY= scrun -nodes=1x2,debug /opt/c32a1_MPICH_CMPI_GENCOMM/exec/gnu/charmm < charmm.inp If DISPLAY environment variable is set, scrun execute "xterm -e gdb (pid_of_the_program)" with -debug option on compute hosts to attach the program. But localhost:11 will not access on the compute hosts. If DISPLAY environment variable is not set, scrun execut gdb bt subcommand on the compute hosts. So you must set correect DISPLAY variable or unset it. from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From tkikukawa @ mpcnet.co.jp Thu Apr 7 13:07:35 2005 From: tkikukawa @ mpcnet.co.jp (Takaaki Kikukawa) Date: Thu, 07 Apr 2005 13:07:35 +0900 Subject: [SCore-users-jp] EITでの計算ホストインストール Message-ID: <200504070407.AA00926@IWS0220.mpcnet.co.jp> お世話になります。 三菱プレシジョン 菊川と申します。 過去に同様の質問があり、恐縮ですが、解決しなかったので質問させ ていただきます。 RedHat7.2 SCore5.0.1でPCクラスタを構築しようとしています。 構成はサーバー、ホスト共に次のものです。 ・マザーボード : SuperMicro製 X6DAT-G ・CPU : Intel製  Xeon-3.2GHz ・オンボードNIC: Intel製  82541PI Gigabit Ethernet Controller ・メモリ:1024MB しかし、EITでの計算ホストインストール中、ブート時に次の表示で 止まってしまいました。 ------------------------------------------------------------- ・ ・ No dhcp_server specified. Used Broadcast SIOCSIFADDR: No such device Try it again SIOCSIFADDR: No such device Try it again SIOCSIFADDR: No such device Try it again Configure Network fails done NFS mount : /mnt/runtime Cannot mount exiting See the documentation for this trouble -------------------------------------------------------------- そこで、計算ホストにおいて、ALT-CNTL-F3で確認したところ、 次の表示でした。 -------------------------------------------------------------- probing buses finished bus probing found nothing writing /tmp/modules.conf going to insmod sunrpc.o ( path is NULL ) going to insmod locked.o ( path is NULL ) going to insmod nfs.o ( path is NULL ) -------------------------------------------------------------- ブート用のフロッピーディスクにNICのドライバーが入っていないと考え、 下を参考にフロッピーディスクを編集しました。 pcitableには、vender ID 8086、 product ID 1076 を追記しました。 ドライバー e1000.oは、サーバーが使っているものをコピーしました。 このとき、ディスク容量が足りなかったので、不要なドライバを削除し ました。 -------------------------------------------------------------- 1. Create boot floppy by EIT. 2. mount this floppy. # mount /dev/fd0 /mnt/floppy 3. extract initrd image and mount it. # gunzip < initrd.img > /tmp/initrd # mkdir /mnt/tmp # mount -o loop /tmp/initrd /mnt/tmp 4. extract modules cpio file # cd /tmp # mkdir work # cd work # zcat /mnt/tmp/modules/modules.cgz | cpio --extract -d 5. extract pro/1000 driver. Pro/1000 driver is included in CD-ROM. # mkdir /mnt/tmp2 # mount -o loop /mnt/cdrom/setup/RedHat/images/drvnet.img /mnt/tmp2 # mkdir /tmp/work2 # cd /tmp/work2 # zcat /mnt/tmp2/modules.cgz | cpio --extract -d 6. copy e1000 driver to modules cpio file # cp */e1000.o /tmp/work/*/ # cd /tmp/work # find * -type f | cpio --quiet -H crc -o | gzip -9 > /mnt//tmp/modules/modules.cgz 7. edit other file # cat >> module-info e1000 eth0 "Intel EtherExpress/1000 gigabit" ^D # grep e1000 /mnt/tmp2/pcitable >> pcitable 8. umount initrd and copy back to floppy # umount /mnt/tmp2 # umount /mnt/tmp # gzip -9 /tmp/initrd # cp /tmp/initrd.gz /mnt/floppy/initrd.img If your floppy is full, you must remove another driver in modules cpio file. -------------------------------------------------------------- すると、計算ホストブート時、下の表示で停止してしまいました。 -------------------------------------------------------------- ・ ・ NET4: Unix domain socket 1.0/SMP for Linux NET4.0 RAMDISK : Compressed image found at block 0 -------------------------------------------------------------- 間違っている点、他に調査すべき点がありましたら、ご教授をお願い いたします。 ------------------------------ 菊川 孝明 三菱プレシジョン株式会社 開発部・画像情報グループ 〒247-8505 鎌倉市上町屋345番地 TEL 0467-42-5732 FAX 0467-42-5737 From kameyama @ pccluster.org Thu Apr 7 13:46:20 2005 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Thu, 07 Apr 2005 13:46:20 +0900 Subject: [SCore-users-jp] EITでの計算ホストインストール In-Reply-To: Your message of "Thu, 07 Apr 2005 13:07:35 JST." <200504070407.AA00926@IWS0220.mpcnet.co.jp> Message-ID: <20050407044620.19AE721EF52@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <200504070407.AA00926 @ IWS0220.mpcnet.co.jp> Takaaki Kikukawa wrotes: > お世話になります。 > 三菱プレシジョン 菊川と申します。 > > 過去に同様の質問があり、恐縮ですが、解決しなかったので質問させ > ていただきます。 > > RedHat7.2 SCore5.0.1でPCクラスタを構築しようとしています。 > > 構成はサーバー、ホスト共に次のものです。 > ・マザーボード : SuperMicro製 X6DAT-G > ・CPU : Intel製  Xeon-3.2GHz > ・オンボードNIC: Intel製  82541PI Gigabit Ethernet Controller > ・メモリ:1024MB > > しかし、EITでの計算ホストインストール中、ブート時に次の表示で > 止まってしまいました。 > ------------------------------------------------------------- > ・ > ・ > No dhcp_server specified. Used Broadcast > SIOCSIFADDR: No such device > Try it again > SIOCSIFADDR: No such device > Try it again > SIOCSIFADDR: No such device > Try it again > Configure Network fails > done > NFS mount : /mnt/runtime > Cannot mount > exiting > See the documentation for this trouble > -------------------------------------------------------------- > > > そこで、計算ホストにおいて、ALT-CNTL-F3で確認したところ、 > 次の表示でした。 > -------------------------------------------------------------- > probing buses > finished bus probing > found nothing > writing /tmp/modules.conf > going to insmod sunrpc.o ( path is NULL ) > going to insmod locked.o ( path is NULL ) > going to insmod nfs.o ( path is NULL ) > -------------------------------------------------------------- > > > ブート用のフロッピーディスクにNICのドライバーが入っていないと考え、 > 下を参考にフロッピーディスクを編集しました。 確かに SCore 5.0.1 付属 kernel には e1000 は入っていません. > pcitableには、vender ID 8086、 product ID 1076 を追記しました。 この product ID ですと, e1000 の version は 5.2.15 (2003 年 8 月 8 日) 以降のドライバを使用する必要が あります. (SCore 5.6.0 以降には標準で入っていますけど...) > ドライバー e1000.oは、サーバーが使っているものをコピーしました。 この e1000.o はどのようにインストールしたのでしょうか? (redhat 7.2 に付属の e1000 はこの NIC をサポートしていないようですが...) driver と kernel の version が合わないと module が load できない 可能性があります. > このとき、ディスク容量が足りなかったので、不要なドライバを削除し > ました。 (中略) > すると、計算ホストブート時、下の表示で停止してしまいました。 > -------------------------------------------------------------- > ・ > ・ > NET4: Unix domain socket 1.0/SMP for Linux NET4.0 > RAMDISK : Compressed image found at block 0 > -------------------------------------------------------------- ramdisk が cpio の作り方の問題かもしれませんけど, 上記のような情況なので, ここが解決されても e1000 が認識できるかどうかは 怪しそうなのですが... > from Kameyama Toyohisa From tkikukawa @ mpcnet.co.jp Thu Apr 7 21:17:21 2005 From: tkikukawa @ mpcnet.co.jp (Takaaki Kikukawa) Date: Thu, 07 Apr 2005 21:17:21 +0900 Subject: [SCore-users-jp] EITでの計算ホストインストール In-Reply-To: <20050407044620.19AE721EF52@neal.il.is.s.u-tokyo.ac.jp> References: <20050407044620.19AE721EF52@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <200504071217.AA00927@IWS0220.mpcnet.co.jp> 亀山様 三菱プレシジョン 菊川です。 ご回答ありがとうございます。 >この e1000.o はどのようにインストールしたのでしょうか? >(redhat 7.2 に付属の e1000 はこの NIC をサポートしていないようですが...) >driver と kernel の version が合わないと module が load できない >可能性があります. redhat 7.2 ではサポートされていないので、メーカのサイトからドライバ(Ver.8.4 Linux 7.2 SMP (kernel 2.4.7-10smp)と記載されていました) をダウンロードし、redhat 7.2をインストールしたサーバPCで、マニュアルに従っ てコンパイルしました。 その後、SCore5.0.1をインストールしました。 この場合、version の整合性がとれないでしょうか? サーバPCでは問題ないよう なのですが。 >ramdisk が cpio の作り方の問題かもしれませんけど, RAMDISK : Compressed image found at block 0 で止まるようになったのは、 driver や pcitableの内容とは無関係と考えたほうがよろしいでしょうか。 >上記のような情況なので, ここが解決されても e1000 が認識できるかどうかは >怪しそうなのですが... やはり難しいでしょうか... kameyama @ pccluster.org さんは書きました: >亀山です. > >In article <200504070407.AA00926 @ IWS0220.mpcnet.co.jp> Takaaki Kikukawa wrotes: >> お世話になります。 >> 三菱プレシジョン 菊川と申します。 >> >> 過去に同様の質問があり、恐縮ですが、解決しなかったので質問させ >> ていただきます。 >> >> RedHat7.2 SCore5.0.1でPCクラスタを構築しようとしています。 >> >> 構成はサーバー、ホスト共に次のものです。 >> ・マザーボード : SuperMicro製 X6DAT-G >> ・CPU : Intel製  Xeon-3.2GHz >> ・オンボードNIC: Intel製  82541PI Gigabit Ethernet Controller >> ・メモリ:1024MB >> >> しかし、EITでの計算ホストインストール中、ブート時に次の表示で >> 止まってしまいました。 >> ------------------------------------------------------------- >> ・ >> ・ >> No dhcp_server specified. Used Broadcast >> SIOCSIFADDR: No such device >> Try it again >> SIOCSIFADDR: No such device >> Try it again >> SIOCSIFADDR: No such device >> Try it again >> Configure Network fails >> done >> NFS mount : /mnt/runtime >> Cannot mount >> exiting >> See the documentation for this trouble >> -------------------------------------------------------------- >> >> >> そこで、計算ホストにおいて、ALT-CNTL-F3で確認したところ、 >> 次の表示でした。 >> -------------------------------------------------------------- >> probing buses >> finished bus probing >> found nothing >> writing /tmp/modules.conf >> going to insmod sunrpc.o ( path is NULL ) >> going to insmod locked.o ( path is NULL ) >> going to insmod nfs.o ( path is NULL ) >> -------------------------------------------------------------- >> >> >> ブート用のフロッピーディスクにNICのドライバーが入っていないと考え、 >> 下を参考にフロッピーディスクを編集しました。 > >確かに SCore 5.0.1 付属 kernel には e1000 は入っていません. > >> pcitableには、vender ID 8086、 product ID 1076 を追記しました。 > >この product ID ですと, e1000 の version は >5.2.15 (2003 年 8 月 8 日) 以降のドライバを使用する必要が >あります. >(SCore 5.6.0 以降には標準で入っていますけど...) > >> ドライバー e1000.oは、サーバーが使っているものをコピーしました。 > >この e1000.o はどのようにインストールしたのでしょうか? >(redhat 7.2 に付属の e1000 はこの NIC をサポートしていないようですが...) > >driver と kernel の version が合わないと module が load できない >可能性があります. > >> このとき、ディスク容量が足りなかったので、不要なドライバを削除し >> ました。 > >(中略) >> すると、計算ホストブート時、下の表示で停止してしまいました。 >> -------------------------------------------------------------- >> ・ >> ・ >> NET4: Unix domain socket 1.0/SMP for Linux NET4.0 >> RAMDISK : Compressed image found at block 0 >> -------------------------------------------------------------- > >ramdisk が cpio の作り方の問題かもしれませんけど, >上記のような情況なので, ここが解決されても e1000 が認識できるかどうかは >怪しそうなのですが... >> > from Kameyama Toyohisa >_______________________________________________ >SCore-users-jp mailing list >SCore-users-jp @ pccluster.org >http://www.pccluster.org/mailman/listinfo/score-users-jp From kameyama @ pccluster.org Fri Apr 8 09:47:42 2005 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Fri, 08 Apr 2005 09:47:42 +0900 Subject: [SCore-users-jp] EITでの計算ホストインストール In-Reply-To: Your message of "Thu, 07 Apr 2005 21:17:21 JST." <200504071217.AA00927@IWS0220.mpcnet.co.jp> Message-ID: <20050408004742.6106921EF52@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <200504071217.AA00927 @ IWS0220.mpcnet.co.jp> Takaaki Kikukawa wrotes: > >この e1000.o はどのようにインストールしたのでしょうか? > >(redhat 7.2 に付属の e1000 はこの NIC をサポートしていないようですが...) > >driver と kernel の version が合わないと module が load できない > >可能性があります. > > redhat 7.2 ではサポートされていないので、メーカのサイトからドライバ(Ver.8.4 > Linux 7.2 SMP (kernel 2.4.7-10smp)と記載されていました) > をダウンロードし、redhat 7.2をインストールしたサーバPCで、マニュアルに従っ > てコンパイルしました。 > その後、SCore5.0.1をインストールしました。 > この場合、version の整合性がとれないでしょうか? サーバPCでは問題ないよう > なのですが。 (Intel にある最新は 5.7.6 のようですが...) compute host およびその install で使用する kernel は 2.4.18 (kernel-smp-2.4.18-2SCORE, kernel-BOOT-2.4.18-2SCORE) です. 多分, version check で文句を言われるか, load して 動かなくなるかだと思います. > >ramdisk が cpio の作り方の問題かもしれませんけど, > > RAMDISK : Compressed image found at block 0 で止まるようになったのは、 > driver や pcitableの内容とは無関係と考えたほうがよろしいでしょうか。 driver の load に失敗したのでしたらそのように表示されても 良いはずですので, それ以前の問題であると思います. (driver が load されて暴走して表示もできなくなった可能性はありますが...) > >上記のような情況なので, ここが解決されても e1000 が認識できるかどうかは > >怪しそうなのですが... > > やはり難しいでしょうか... 多分, e1000 を kernel-BOOT-2.4.18-2SCORE 上で compile しなおす 必要はあるかと... (で, install してからももう一度 kernel-smp-2.4.18-2SCORE 環境で compile, install する必要があります.) from Kameyama Toyohisa From iida @ st-systems.co.jp Tue Apr 12 10:37:45 2005 From: iida @ st-systems.co.jp (Masayasu Iida) Date: Tue, 12 Apr 2005 10:37:45 +0900 Subject: [SCore-users-jp] Fortran でWRITE文使用すると発生する問題について Message-ID: <425B2669.7020304@st-systems.co.jp> お世話になります。STSの飯田です。 RedHat9+SCore5.8.2+Intel Compiler Ver8.1(C++/Fortran) の環境を構成し使用しているのですが、 Fortranのコード内にWRITE文を記述すると出力された ファイルに以下の異常が発生します。(標準出力では問題が 起こりません。) ・ls -lでファイルサイズを見ると異常に大きな サイズになります。テストコードは000.datという ファイルにssssssssssssssssssssssと出力するだけなのですが、 ls -lの実行結果では92GBのファイルサイズになっています。 -rw--w-r-- 1 root root 98784247807 Apr 12 09:39 000.dat ^^^^^^^^^^^ ところがdu -skの実行結果は、 4 000.dat のように4KBでしかありません。 また、dfコマンドでファイルシステムの使用量を確認しても、 使用量は4KBしか使用していません。ファイルシステムはext3です。 ファイルの内容ですがheadコマンドで確認すると正常な出力結果 (ssssssssssssssssssssss)を確認することができるのですが、 後ろに何か入っているのかviやtailを実行するとシェルが固まって しまいます。(もしかすると92GBのファイルをロードしようとして 時間がかかっているだけかもしれません。) 上記の問題について切り分けを行なったのですが、 (1)mpif77 -compiler=gnuでコンパイルすると問題は発生しません。 → テスト用のソースコードの問題ではないと判断しました。 (2)Intel Compilerでmpich-1.2.6をコンパイルし、SCoreを用いない MPIで検証したところ問題は発生しませんでした。 → Intel Compilerの問題ではないと判断しました。 (3) (2)の検証をSCore用のカーネル(2.4.21)とRedHat9のカーネル (2.4.20-8smp)で行なったところ、どちらのカーネルも 問題は発生しませんでした。 → カーネルによる問題ではないと判断しました。 (4)SCoreのmpif77でコンパイルした実行バイナリをReiserFS パーティションに配置し、実行結果の出力先もReiserFS上に 出力したところ、同様の問題が確認されました。 → ファイルシステムの問題ではないと判断しました。 (5)SCoreのmpichのバージョン1.2.5と1.2.4で検証を行ないましたが、 同様の問題が発生しました。 → SCoreのMPICHのバージョンの問題ではないと判断しました。 (5)別のマシンにFedora Core1をインストールし、PCCのサイトで 公開されているFedora Core1用のisoイメージから新たに SCoreクラスターを構築し検証を行ないましたが、 SCoreのmpichを利用すると問題が再現しました。 → 現在使用している環境(RedHat9 + SCore5.8.2 + Intel Ver8.1) の構築手順の問題ではないと判断しました。 以上の結果から、SCoreのMPICHとIntel Compiler Ver8.1を 使用した場合にのみ問題が発生しているようです。 テストに使用したコードは以下の通りです。 IMPLICIT REAL*4(a-h,o-z) c include 'mpif.h' c c call mpi_init(ierr) call mpi_comm_size(mpi_comm_world,npe,ierr) call mpi_comm_rank(mpi_comm_world,id,ierr) c open(unit=10,file='000.dat',status='unknown') write(10,*) 'ssssssssssssssssssssss' close(10) c call mpi_finalize(ierr) c stop end Fortran77はバックエンドコンパイラにGNUを使用することで 回避できるのですが、Fortran90の環境を使用するため Intel Compilerを導入しており回避策を検討しております。 アドバイス頂けますと幸いです。 ※以前、石川様からご連絡頂きましたPCCへの加入の件ですが、 4月8日に準会員として申し込ませて頂きました。 ------------------------------------------------ 飯田 昌康 サイエンス・テクノロジー・システムズ株式会社 東日本営業部 営業技術グループ マネージャー Tel:03-5774-6833 Fax:03-5774-5180 E-mail: iida @ st-systems.co.jp Web: http://www.st-systems.co.jp 〒150-0002 東京都渋谷区渋谷1-20-1 三進ビル4F ------------------------------------------------ From kameyama @ pccluster.org Tue Apr 12 12:05:35 2005 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Tue, 12 Apr 2005 12:05:35 +0900 Subject: [SCore-users-jp] Fortran でWRITE 文使用すると発生する問題について In-Reply-To: Your message of "Tue, 12 Apr 2005 10:37:45 JST." <425B2669.7020304@st-systems.co.jp> Message-ID: <20050412030535.776DF21EF52@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <425B2669.7020304 @ st-systems.co.jp> Masayasu Iida wrotes: > Fortranのコード内にWRITE文を記述すると出力された > ファイルに以下の異常が発生します。(標準出力では問題が > 起こりません。) > > ・ls -lでファイルサイズを見ると異常に大きな > サイズになります。テストコードは000.datという > ファイルにssssssssssssssssssssssと出力するだけなのですが、 > ls -lの実行結果では92GBのファイルサイズになっています。 > > -rw--w-r-- 1 root root 98784247807 Apr 12 09:39 000.dat > ^^^^^^^^^^^ > ところがdu -skの実行結果は、 > 4 000.dat > のように4KBでしかありません。 現象としては, write(2) してから変な値で llseek() している 可能性が高そうです. > (5)別のマシンにFedora Core1をインストールし、PCCのサイトで > 公開されているFedora Core1用のisoイメージから新たに > SCoreクラスターを構築し検証を行ないましたが、 > SCoreのmpichを利用すると問題が再現しました。 > → 現在使用している環境(RedHat9 + SCore5.8.2 + Intel Ver8.1) > の構築手順の問題ではないと判断しました。 こちらで, Fedora Core 1 + SCore 5.8.2 (rpm による install というか rpm を作成した host なんですが...) + Intel voompiler 8.0-47 および Intel Fortran compiler 8.1-020 で実行しましたが, 問題はおこりませんでした. ただ, strace すると llseek() を使用しているようなので, http://www.pccluster.org/pipermail/score-users/2005-February/002409.html の patch をあてると改善されるかもしれません. from Kameyama Toyohisa From nick @ streamline-computing.com Tue Apr 12 19:53:51 2005 From: nick @ streamline-computing.com (Nick Birkett) Date: Tue, 12 Apr 2005 11:53:51 +0100 Subject: [SCore-users-jp] [SCore-users] mpcxxFuncMarshal Message-ID: <425BA8BF.8060509@streamline-computing.com> does anyone know the cause of this: <7> ULT:PANIC mpcxxFuncMarshal: Cannot find 0x411ae0 ? Suse 9.2 EM64T 64 bit servers. Score 5.8.2 + kernel 2.6 _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Tue Apr 12 20:14:23 2005 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Tue, 12 Apr 2005 20:14:23 +0900 Subject: [SCore-users-jp] Re: [SCore-users] mpcxxFuncMarshal In-Reply-To: Your message of "Tue, 12 Apr 2005 11:53:51 JST." <425BA8BF.8060509@streamline-computing.com> Message-ID: <20050412111423.66A3D21EF52@neal.il.is.s.u-tokyo.ac.jp> In article <425BA8BF.8060509 @ streamline-computing.com> Nick Birkett wrotes: > does anyone know the cause of this: > > <7> ULT:PANIC mpcxxFuncMarshal: Cannot find 0x411ae0 > > ? This message is outputed in score-src/SCore/mttl-ult/ult/hetero.cc:mpcxxFuncMarshal(). This means the function name of the address 0x411ae0 is not find in the program file (probabry scored). The SCore-D program search function name in the self binary file for hetero environment. Do you strip the scored execute file? from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From iida @ st-systems.co.jp Tue Apr 12 21:52:14 2005 From: iida @ st-systems.co.jp (Masayasu Iida) Date: Tue, 12 Apr 2005 21:52:14 +0900 Subject: [SCore-users-jp] Fortran でWRITE 文使用すると発生する問題について In-Reply-To: <20050412030535.776DF21EF52@neal.il.is.s.u-tokyo.ac.jp> References: <20050412030535.776DF21EF52@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <425BC47E.1030306@st-systems.co.jp> 亀山様 お世話になります。STS飯田です。 パッチを適用したところ問題がでなくなりました。 ありがとうございました。 kameyama @ pccluster.org wrote: > 亀山です. > > In article <425B2669.7020304 @ st-systems.co.jp> Masayasu Iida wrotes: > >>Fortranのコード内にWRITE文を記述すると出力された >>ファイルに以下の異常が発生します。(標準出力では問題が >>起こりません。) >> >>・ls -lでファイルサイズを見ると異常に大きな >> サイズになります。テストコードは000.datという >> ファイルにssssssssssssssssssssssと出力するだけなのですが、 >> ls -lの実行結果では92GBのファイルサイズになっています。 >> >>-rw--w-r-- 1 root root 98784247807 Apr 12 09:39 000.dat >> ^^^^^^^^^^^ >> ところがdu -skの実行結果は、 >>4 000.dat >> のように4KBでしかありません。 > > > 現象としては, write(2) してから変な値で llseek() している > 可能性が高そうです. > > >>(5)別のマシンにFedora Core1をインストールし、PCCのサイトで >> 公開されているFedora Core1用のisoイメージから新たに >> SCoreクラスターを構築し検証を行ないましたが、 >> SCoreのmpichを利用すると問題が再現しました。 >> → 現在使用している環境(RedHat9 + SCore5.8.2 + Intel Ver8.1) >> の構築手順の問題ではないと判断しました。 > > > こちらで, Fedora Core 1 + SCore 5.8.2 (rpm による install > というか rpm を作成した host なんですが...) + Intel voompiler 8.0-47 > および Intel Fortran compiler 8.1-020 > で実行しましたが, 問題はおこりませんでした. > > ただ, strace すると llseek() を使用しているようなので, > http://www.pccluster.org/pipermail/score-users/2005-February/002409.html > の patch をあてると改善されるかもしれません. > > from Kameyama Toyohisa > > -- ------------------------------------------------ 飯田 昌康 サイエンス・テクノロジー・システムズ株式会社 東日本営業部 営業技術グループ マネージャー Tel:03-5774-6833 Fax:03-5774-5180 E-mail: iida @ st-systems.co.jp Web: http://www.st-systems.co.jp 〒150-0002 東京都渋谷区渋谷1-20-1 三進ビル4F ------------------------------------------------ From kameyama @ pccluster.org Mon Apr 18 09:53:03 2005 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Mon, 18 Apr 2005 09:53:03 +0900 Subject: [SCore-users-jp] Re: [SCore-users] netwrok restart In-Reply-To: Your message of "Fri, 15 Apr 2005 15:06:09 JST." <20050415140609.98342.qmail@web26908.mail.ukl.yahoo.com> Message-ID: <20050418005303.BFABD21EF52@neal.il.is.s.u-tokyo.ac.jp> In article <20050415140609.98342.qmail @ web26908.mail.ukl.yahoo.com> Gabriel Dimitriu wrotes: > I have installed from binary distribution (CDROM) > SCORE 5.8.2 on Fedora core 1. The cluster is composed > from 3 computers 1PIV, 1 PIII and 1 PII, link y > ethernet 100 MBs and switch at 100 MBs. The PIV is in > same time the server and compute machine and the rest > are only computer machine. What do you use NIC and driver? > "eth0: Too much work at interrupt, IntrStatus=0x0010" Please add following NIC module parametar when NIC driver is added: max_interrupt_work=1000 from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From hori @ streamline-computing.com Tue Apr 19 22:44:17 2005 From: hori @ streamline-computing.com (Atsushi HORI) Date: Tue, 19 Apr 2005 22:44:17 +0900 Subject: [SCore-users-jp] Re: [SCore-users] netwrok restart In-Reply-To: <20050419125310.27300.qmail@web26902.mail.ukl.yahoo.com> References: <20050419125310.27300.qmail@web26902.mail.ukl.yahoo.com> Message-ID: <2b882deb11a904641de188dbe7168d8c@streamline-computing.com> Hi, On 2005/04/19, at 21:53, Gabriel Dimitriu wrote: > I had put this in ifcfg-eth0 and I rerun all servers > and nothing was happening.Did I done corect the > modification ? I think Kameyama-san will give you more informative answer than I. > Before first run the rpmtest works fine. > Is it a problem if I have static adresses and dns > server is a 2000 Server ? > Should I have a NIS server and a name server on SCore > server ? I do not think so. > I mention that the "sceptic -v -g pcc" works fine, so > if it was a configurantion problem sceptic should give > an error, isn't it ? Well, PM, which is the name of low-level communication library inside SCore, has a totally different protocol from well-known protocols such as TCP/IP. Therefor PM stresses Ethernet driver quite a different way. Your problem happens because of this PM protocol. > What solution do you think I have, because I am in a > deep fog ? Don't panic !! Do you need a towel ? _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From gabriel_m_dimitriu @ yahoo.co.uk Tue Apr 19 21:53:09 2005 From: gabriel_m_dimitriu @ yahoo.co.uk (Gabriel Dimitriu) Date: Tue, 19 Apr 2005 13:53:09 +0100 (BST) Subject: [SCore-users-jp] Re: [SCore-users] netwrok restart In-Reply-To: 6667 Message-ID: <20050419125310.27300.qmail@web26902.mail.ukl.yahoo.com> Dear Kameyama-san > What do you use NIC and driver? I use Realtek 8139C card with 8139too driver provided by SCore kernel (binary version). > > "eth0: Too much work at interrupt, > IntrStatus=0x0010" > > Please add following NIC module parametar when NIC > driver is added: > max_interrupt_work=1000 > > from Kameyama Toyohisa > I had put this in ifcfg-eth0 and I rerun all servers and nothing was happening.Did I done corect the modification ? Before first run the rpmtest works fine. Is it a problem if I have static adresses and dns server is a 2000 Server ? Should I have a NIS server and a name server on SCore server ? I mention that the "sceptic -v -g pcc" works fine, so if it was a configurantion problem sceptic should give an error, isn't it ? What solution do you think I have, because I am in a deep fog ? Best wishes, Gabriel. Send instant messages to your online friends http://uk.messenger.yahoo.com _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Wed Apr 20 09:27:06 2005 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Wed, 20 Apr 2005 09:27:06 +0900 Subject: [SCore-users-jp] Re: [SCore-users] netwrok restart In-Reply-To: Your message of "Tue, 19 Apr 2005 22:44:17 JST." <2b882deb11a904641de188dbe7168d8c@streamline-computing.com> Message-ID: <20050420002706.C2EA921EF52@neal.il.is.s.u-tokyo.ac.jp> In article <2b882deb11a904641de188dbe7168d8c @ streamline-computing.com> Atsushi HORI wrotes: > On 2005/04/19, at 21:53, Gabriel Dimitriu wrote: > > > I had put this in ifcfg-eth0 and I rerun all servers > > and nothing was happening.Did I done corect the > > modification ? The max_interrupt_work is parameter of network driver module. You must modify /etc/modules.conf for example, if you use eepro100 network driver, please add following line in /etc/modules.conf: options eepro100 max_interrupt_work=100000 > > I mention that the "sceptic -v -g pcc" works fine, so > > if it was a configurantion problem sceptic should give > > an error, isn't it ? > > Well, PM, which is the name of low-level communication library inside > SCore, has a totally different protocol from well-known protocols such > as TCP/IP. Therefor PM stresses Ethernet driver quite a different way. > Your problem happens because of this PM protocol. So if you want to work PM/ethernet better, you may modifies NIC driver setting and pm-ethernet.conf parameters. (These settings are depended NIC hardware and NIC device driver.) from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From s-sumi @ flab.fujitsu.co.jp Wed Apr 20 10:34:08 2005 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Wed, 20 Apr 2005 10:34:08 +0900 (JST) Subject: [SCore-users-jp] Re: [SCore-users] netwrok restart In-Reply-To: <20050420002706.C2EA921EF52@neal.il.is.s.u-tokyo.ac.jp> References: <2b882deb11a904641de188dbe7168d8c@streamline-computing.com> <20050420002706.C2EA921EF52@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <20050420.103408.71114741.s-sumi@flab.fujitsu.co.jp> Hi. From: kameyama @ pccluster.org Subject: Re: [SCore-users] netwrok restart Date: Wed, 20 Apr 2005 09:27:06 +0900 Message-ID: <20050420002706.C2EA921EF52 @ neal.il.is.s.u-tokyo.ac.jp> kameyama> In article <2b882deb11a904641de188dbe7168d8c @ streamline-computing.com> Atsushi HORI wrotes: kameyama> > On 2005/04/19, at 21:53, Gabriel Dimitriu wrote: kameyama> > kameyama> > > I had put this in ifcfg-eth0 and I rerun all servers kameyama> > > and nothing was happening.Did I done corect the kameyama> > > modification ? kameyama> kameyama> The max_interrupt_work is parameter of network driver module. kameyama> You must modify /etc/modules.conf for example, if you use eepro100 network kameyama> driver, please add following line in /etc/modules.conf: kameyama> options eepro100 max_interrupt_work=100000 Also, you have to reload the driver or reboot the cluster system. Shinji. kameyama> > > I mention that the "sceptic -v -g pcc" works fine, so kameyama> > > if it was a configurantion problem sceptic should give kameyama> > > an error, isn't it ? kameyama> > kameyama> > Well, PM, which is the name of low-level communication library inside kameyama> > SCore, has a totally different protocol from well-known protocols such kameyama> > as TCP/IP. Therefor PM stresses Ethernet driver quite a different way. kameyama> > Your problem happens because of this PM protocol. kameyama> kameyama> So if you want to work PM/ethernet better, you may modifies kameyama> NIC driver setting and pm-ethernet.conf parameters. kameyama> (These settings are depended NIC hardware and NIC device driver.) kameyama> kameyama> from Kameyama Toyohisa kameyama> _______________________________________________ kameyama> SCore-users mailing list kameyama> SCore-users @ pccluster.org kameyama> http://www.pccluster.org/mailman/listinfo/score-users kameyama> ------ Shinji Sumimoto, Fujitsu Labs _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From ishikawa @ is.s.u-tokyo.ac.jp Thu Apr 21 09:36:33 2005 From: ishikawa @ is.s.u-tokyo.ac.jp (Yutaka Ishikawa) Date: Thu, 21 Apr 2005 09:36:33 +0900 (JST) Subject: [SCore-users-jp] 理研スーパー・コンバインド・クラスタが文部科学大臣賞授賞 Message-ID: <20050421.093633.291446335.ishikawa@is.s.u-tokyo.ac.jp> SCoreユーザの皆様、 コンソーシアムメンバである理研および富士通が共同で開発した「理研スーパー・ コンバインド・クラスタ」により、4月13日に第34回日本産業技術大賞・文部 科学大臣賞を受賞されましたので、皆様にご案内します。 当該クラスタでは、富士通によるInfiniband上での拡張が施されたSCoreが利 用されております。 授賞の様子は、以下のURLから http://accc.riken.jp/HPC/prize/index.html 日刊工業新聞社および各組織からのアナウンスは、以下のURLから御覧になれます。 http://www.nikkan.co.jp/port/34sangitaisho.html http://www.riken.go.jp/r-world/topics/050323.html http://pr.fujitsu.com/jp/news/2005/03/23.html 本システムは、2048CPU数を有するクラスタ上で、SCoreにより本格的計算セン タ運用を始めたものです。PCクラスタコンソーシアムとしても非常に喜ばしい 限りであり、また、関係者の皆様の本格運用に向けての御努力に対し敬意を表 する次第です。 石川@PCクラスタ会長 From tkikukawa @ mpcnet.co.jp Fri Apr 22 10:38:35 2005 From: tkikukawa @ mpcnet.co.jp (Takaaki Kikukawa) Date: Fri, 22 Apr 2005 10:38:35 +0900 Subject: [SCore-users-jp] デバイスドライバについて Message-ID: <200504220138.AA00933@IWS0220.mpcnet.co.jp> 三菱プレシジョン 菊川です お世話になっております。 今回、次の構成でPCクラスタを構築するとしました。 linux 2.4.21kernel + llinux2.4.21.score.patch + SCore5.8.1 Intel E7525 chip set Dual Xeon 3.2GHz EM64T FSB 800MHz PCクラスタは正常に動作しているようです。 ただ、以前から使っているデバイスドライバの動作に異常があるよう なのです。 デバイスドライバはPCI32スロット拡張ボードにアクセスするものです。 SCoreとは無関係とは考えているのですが、原因がわかりません。 一般的に、CPUがEM64Tとなったことで、デバイスドライバの動作が おかしくなることは考えられるでしょうか? その他、何かございましたらアドバイスをお願いいたします。 ------------------------------ 菊川 孝明 三菱プレシジョン株式会社 開発部・画像情報グループ 〒247-8505 鎌倉市上町屋345番地 TEL 0467-42-5732 FAX 0467-42-5737 From kameyama @ pccluster.org Fri Apr 22 10:57:34 2005 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Fri, 22 Apr 2005 10:57:34 +0900 Subject: [SCore-users-jp] デバイスドライバについて In-Reply-To: Your message of "Fri, 22 Apr 2005 10:38:35 JST." <200504220138.AA00933@IWS0220.mpcnet.co.jp> Message-ID: <20050422015734.9204E21EF52@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <200504220138.AA00933 @ IWS0220.mpcnet.co.jp> Takaaki Kikukawa wrotes: > 今回、次の構成でPCクラスタを構築するとしました。 > > linux 2.4.21kernel + llinux2.4.21.score.patch + SCore5.8.1 > Intel E7525 chip set > Dual Xeon 3.2GHz EM64T FSB 800MHz distribution 及び kernel は i386 のものでしょうか? それとも x86-64 でしょうか? > PCクラスタは正常に動作しているようです。 > ただ、以前から使っているデバイスドライバの動作に異常があるよう > なのです。 > デバイスドライバはPCI32スロット拡張ボードにアクセスするものです。 memory はどの程度実装していますでしょうか? > SCoreとは無関係とは考えているのですが、原因がわかりません。 > 一般的に、CPUがEM64Tとなったことで、デバイスドライバの動作が > おかしくなることは考えられるでしょうか? kernel が i386 base であれば EM64T の影響は無いと思います. x86-64 になっていると移植上の問題があるかも知れません. memory が 4 GB 以上あると PCI32 からアクセスできない領域が でてきますので, PCI ボードから直接メモリにアクセスしていると 問題がおこるかも知れません. from Kameyama Toyohisa From tkikukawa @ mpcnet.co.jp Fri Apr 22 14:18:52 2005 From: tkikukawa @ mpcnet.co.jp (Takaaki Kikukawa) Date: Fri, 22 Apr 2005 14:18:52 +0900 Subject: [SCore-users-jp] デバイスドライバについて In-Reply-To: <20050422015734.9204E21EF52@neal.il.is.s.u-tokyo.ac.jp> References: <20050422015734.9204E21EF52@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <200504220518.AA00934@IWS0220.mpcnet.co.jp> 亀山様 三菱プレシジョン 菊川です。 ご回答ありがとうございます。 >distribution 及び kernel は i386 のものでしょうか? >それとも x86-64 でしょうか? distribution は、RedHat Linux 9 で、linux 2.4.21 kernelはi386です。 >memory はどの程度実装していますでしょうか? メモリは32MB実装しています。 以上からは問題ないように見えます。 kameyama @ pccluster.org さんは書きました: >亀山です. > >In article <200504220138.AA00933 @ IWS0220.mpcnet.co.jp> Takaaki Kikukawa wrotes: >> 今回、次の構成でPCクラスタを構築するとしました。 >> >> linux 2.4.21kernel + llinux2.4.21.score.patch + SCore5.8.1 >> Intel E7525 chip set >> Dual Xeon 3.2GHz EM64T FSB 800MHz > >distribution 及び kernel は i386 のものでしょうか? >それとも x86-64 でしょうか? > >> PCクラスタは正常に動作しているようです。 >> ただ、以前から使っているデバイスドライバの動作に異常があるよう >> なのです。 >> デバイスドライバはPCI32スロット拡張ボードにアクセスするものです。 > >memory はどの程度実装していますでしょうか? > >> SCoreとは無関係とは考えているのですが、原因がわかりません。 >> 一般的に、CPUがEM64Tとなったことで、デバイスドライバの動作が >> おかしくなることは考えられるでしょうか? > >kernel が i386 base であれば EM64T の影響は無いと思います. >x86-64 になっていると移植上の問題があるかも知れません. > >memory が 4 GB 以上あると PCI32 からアクセスできない領域が >でてきますので, PCI ボードから直接メモリにアクセスしていると >問題がおこるかも知れません. > > from Kameyama Toyohisa From kameyama @ pccluster.org Fri Apr 22 14:34:22 2005 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Fri, 22 Apr 2005 14:34:22 +0900 Subject: [SCore-users-jp] デバイスドライバについて In-Reply-To: Your message of "Fri, 22 Apr 2005 14:18:52 JST." <200504220518.AA00934@IWS0220.mpcnet.co.jp> Message-ID: <20050422053422.1093C21EF52@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <200504220518.AA00934 @ IWS0220.mpcnet.co.jp> Takaaki Kikukawa wrotes: > >distribution 及び kernel は i386 のものでしょうか? > >それとも x86-64 でしょうか? > > distribution は、RedHat Linux 9 で、linux 2.4.21 kernelはi386です。 > > > >memory はどの程度実装していますでしょうか? > > メモリは32MB実装しています。 memory 32 MB だと少なすぎて redhat 9 自体が動かないと思うのですが... from Kameyama Toyohisa From tkikukawa @ mpcnet.co.jp Fri Apr 22 15:00:42 2005 From: tkikukawa @ mpcnet.co.jp (Takaaki Kikukawa) Date: Fri, 22 Apr 2005 15:00:42 +0900 Subject: [SCore-users-jp] デバイスドライバについて In-Reply-To: <20050422053422.1093C21EF52@neal.il.is.s.u-tokyo.ac.jp> References: <20050422053422.1093C21EF52@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <200504220600.AA00935@IWS0220.mpcnet.co.jp> 亀山様 菊川です。 >memory 32 MB だと少なすぎて redhat 9 自体が動かないと思うのですが... すみません。メインメモリは1GB実装しております。 kameyama @ pccluster.org さんは書きました: >亀山です. > >In article <200504220518.AA00934 @ IWS0220.mpcnet.co.jp> Takaaki Kikukawa wrotes: >> >distribution 及び kernel は i386 のものでしょうか? >> >それとも x86-64 でしょうか? >> >> distribution は、RedHat Linux 9 で、linux 2.4.21 kernelはi386です。 >> >> >> >memory はどの程度実装していますでしょうか? >> >> メモリは32MB実装しています。 > >memory 32 MB だと少なすぎて redhat 9 自体が動かないと思うのですが... > > from Kameyama Toyohisa >_______________________________________________ >SCore-users-jp mailing list >SCore-users-jp @ pccluster.org >http://www.pccluster.org/mailman/listinfo/score-users-jp From kameyama @ pccluster.org Fri Apr 22 15:13:52 2005 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Fri, 22 Apr 2005 15:13:52 +0900 Subject: [SCore-users-jp] デバイスドライバについて In-Reply-To: Your message of "Fri, 22 Apr 2005 15:00:42 JST." <200504220600.AA00935@IWS0220.mpcnet.co.jp> Message-ID: <20050422061352.A313D21EF52@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <200504220600.AA00935 @ IWS0220.mpcnet.co.jp> Takaaki Kikukawa wrotes: > >memory 32 MB だと少なすぎて redhat 9 自体が動かないと思うのですが... > すみません。メインメモリは1GB実装しております。 それでしたら, 通常の Xeon machine と同じと考えてよいと思います. from Kameyama Toyohisa