From e973220 @ eve.u-ryukyu.ac.jp Thu Jan 2 15:53:43 2003 From: e973220 @ eve.u-ryukyu.ac.jp (金城 尚志) Date: Thu, 2 Jan 2003 15:53:43 +0900 Subject: [SCore-users-jp] 【ネットワークトランキング】テスト評価&チップセット In-Reply-To: Message-ID: あけましておめでとうございます。 琉球大の金城です。 早速ですが、また質問をさせてもらってもよろしいでしょうか。 どうかよろしくおねがいします。 ━━━━━━━━━━━━━━━━━━━━━━━━ 【質問1:Test Procedure of Multiple Networkの評価】 ━━━━━━━━━━━━━━━━━━━━━━━━ Network Trunking機構(PM/Ethernet)のシステム管理者ガイド http://www.pccluster.org/score/dist/score/html/ja/reference/pm/ether-trunkin g.html#rcstest を参考にrcstestを実行しました。 そうしたら次のようなメッセージがでてきました。 このメッセージをどのように評価したらよいのでしょうか? NIC4枚でのネットワークトランキングの設定はできているのでしょうか? アスタリスクとドットの間隔が、ガイドに掲載されているメッセージとは 異なっている点が気になります。 -------メッセージ(はじまり)-------------------- starting master 0 : pe=8 starting slave: 4 5 1 2 3 6 7. testing*.*.**.*.*.*.*.**..**.*..*.**.*..*.**.*.**.*.**.*.*.**.*.*.*.*.*.*.*. *.*.**.*.**.*.*.**..**.**.*.*.**.*.*.*.*.*.**.*.*.**.*.*.**.*.*.*.**.*.*.*.* *.*.*.**.*.*.**.**.*.*.**.*.*.**.*.*.*.*.*.**.*.*.*.*.*.comp7( 7) Signal: Interrupted system call(4) comp5( 5) Signal: Interrupted system call(4) comp6( 6) Signal: Interrupted system call(4) comp4( 4) Signal: Interrupted system call(4) comp3( 3) Signal: Interrupted system call(4) comp2( 2) Signal: Interrupted system call(4) comp0( 0) Signal: Interrupted system call(4) comp1( 1) Signal: Interrupted system call(4) -------メッセージ(おわり)-------------------- 【補足】 Network Trunking機構(PM/Ethernet)のシステム管理者ガイド http://www.pccluster.org/score/dist/score/html/ja/reference/pm/ether-trunkin g.html を参考にNIC4枚でのクラスタを構築しました。 設定は上のガイドの通りに行いましたが、ただpm-ethernet-[0-4].confの作成につい ては 次のコマンドオプションで行いました。 # mkpmethernetconf -unit 0 -speed 100 -device eth0 -g sougen pm-ethernet-0.conf ( sougen はグループ名) (参考:ガイドのコマンドオプション) # mkpmethernetconf -unit 0 -speed 100 -device eth0 pm-udp.conf pm-ethernet-0.conf ━━━━━━━━━━━━━━━━━━━━━━━━ 【質問2:VIAのチップセット】 ━━━━━━━━━━━━━━━━━━━━━━━━ Network Trunking機構(PM/Ethernet)のシステム管理者ガイドに 次のような記述があります。 >Comments: VIAのチップセットを用いたNICは2枚以上ではハードウェアエラーのため 動作しませんでした。 これはNICのチップセットのことなのでしょうか?それともマザーボードの チップセットのことなのでしょうか? すみません、ハードウェアについても無知なためよくわかりません。 が、アスキーデジタル用語辞典に書いてあるとおり、 http://yougo.ascii24.com/gh/00/000070.html チップセットとは、マザーボードのチップセットをさすのでしょうか? ━━━━━━━━━━━━━━━━━━━━━━━━ 【まとめ:なぜ上記の質問をしたのか】 ━━━━━━━━━━━━━━━━━━━━━━━━ 実は、計算ホストへNICを1枚ずつの時、 計算ホストへNICを2枚ずつの時、 計算ホストへNICを3枚ずつの時、 計算ホストへNICを4枚ずつの時と して、NPB(Nas Parallel Benchmarks)を実行させて 見ました。 そうすると、計算ホストが8台の時、 NIC2枚、NIC3枚、NIC4枚の時の結果が ほぼ同じだったのです。 なので、僕のネットワークトランキング機構の設定が 間違っているのか、それともハードウェアが悪いのかを はっきりさせたいのです。 【参考】 NPBのLUのログを書きに示します。 計算ホストの数、NICの数を変えていってログを取りました。 1、2、4、8は計算ホストの数です。NIC-1, NIC-2 ,,, はNICの数です。 NPB2.4 LU Class=A 1 2 4 8 NIC-1 271.228 496.384 697.825 1224.17 NIC-2 271.904 516.218 907.962 1423.96 NIC-3 272.097 518.271 892.178 1414.24 NIC-4 272.394 524.728 901.533 1429.2 (それぞれのログの数値は10回計測してその平均をとりました) ━┛━┛━┛━┛━┛━┛━┛━┛━┛   琉球大学理学部 物質地球科学科   金城 尚志 (キンジョウヒサシ) ━┛━┛━┛━┛━┛━┛━┛━┛━┛ From emile.carcamo @ nec.fr Thu Jan 2 19:46:39 2003 From: emile.carcamo @ nec.fr (Emile CARCAMO) Date: Thu, 02 Jan 2003 11:46:39 +0100 Subject: [SCore-users-jp] Re: [SCore-users] GM availability on SCore, when ??? In-Reply-To: Your message of "Wed, 25 Dec 2002 18:29:37 +0900." <20021225.182937.41640146.s-sumi@flab.fujitsu.co.jp> Message-ID: <200301021046.h02AkdX08339@emilepc.ess.nec.fr> s-sumi @ flab.fujitsu.co.jp said: > Could you let me know your measurement envinronment? > 1) Which Myrinet Cards are you using, PCI64B or PCI64C? > 2) How about your host environment, CPU, chipset and memory? Dear Shinji-san, Concerning the Myrinet card type, I'm not 100% sure of it but the nodes are Express5800 120rc1 model (this info may help, just in case). I've also enclosed some infos like : memory available per node, lspci -vv (run as root !), the contents of /proc/cpuinfo. Let me know if you need some more inputs from me ? Thanks again for your help, and best regards. -- Emile_CARCAMO NEC European http://www.ess.nec.de System Engineer Supercomputer mailto:emile.carcamo @ nec.fr Systems France GSM mailto:emile.carcamo @ orange.fr (+33)1-3930-6601 FAX (+33)1-3930-6613 PHONE / Your mouse has moved. Windows NT must be restarted \ (+33)6-8063-7003 GSM \ for the change to take effect. Reboot now? [ OK ] / ------------------------------------------------------------------------------- [ecarcamo]<115>rsh-all -g essfrance dmesg | grep Memory node01.ess.nec.fr: Memory: 899708k/917504k available (1676k kernel code, 17392k reserved, 500k data, 232k init, 0k highmem) node05.ess.nec.fr: Memory: 899724k/917504k available (1676k kernel code, 17392k reserved, 500k data, 232k init, 0k highmem) node02.ess.nec.fr: Memory: 899708k/917504k available (1676k kernel code, 17392k reserved, 500k data, 232k init, 0k highmem) node03.ess.nec.fr: Memory: 899708k/917504k available (1676k kernel code, 17392k reserved, 500k data, 232k init, 0k highmem) node04.ess.nec.fr: Memory: 899708k/917504k available (1676k kernel code, 17392k reserved, 500k data, 232k init, 0k highmem) node06.ess.nec.fr: Memory: 899724k/917504k available (1676k kernel code, 17392k reserved, 500k data, 232k init, 0k highmem) node07.ess.nec.fr: Memory: 899708k/917504k available (1676k kernel code, 17392k reserved, 500k data, 232k init, 0k highmem) [ecarcamo]<116> ------------------------------------------------------------------------------- 00:00.0 Host bridge: Intel Corp. e7500 DRAM Controller (rev 03) Subsystem: Intel Corp.: Unknown device 3415 Control: I/O- Mem+ BusMaster+ SpecCycle- MemWINV- VGASnoop- ParErr- Stepping- SERR- FastB2B- Status: Cap- 66Mhz- UDF- FastB2B+ ParErr- DEVSEL=fast >TAbort- SERR- TAbort- SERR- TAbort- SERR- Reset- FastB2B- 00:03.1 Class ff00: Intel Corp. e7500 HI_C Virtual PCI-to-PCI Bridge (F1) (rev 03) Subsystem: Intel Corp.: Unknown device 3415 Control: I/O- Mem- BusMaster- SpecCycle- MemWINV- VGASnoop- ParErr- Stepping- SERR+ FastB2B- Status: Cap- 66Mhz- UDF- FastB2B- ParErr- DEVSEL=fast >TAbort- SERR- TAbort- SERR- TAbort- SERR- TAbort- SERR- Reset- FastB2B- 00:1f.0 ISA bridge: Intel Corp. 82801CA ISA Bridge (LPC) (rev 02) Control: I/O+ Mem+ BusMaster+ SpecCycle+ MemWINV- VGASnoop- ParErr+ Stepping- SERR+ FastB2B- Status: Cap- 66Mhz- UDF- FastB2B+ ParErr- DEVSEL=medium >TAbort- SERR- TAbort- SERR- [size=8] Region 1: I/O ports at [size=4] Region 2: I/O ports at [size=8] Region 3: I/O ports at [size=4] Region 4: I/O ports at 03a0 [size=16] Region 5: Memory at 80000000 (32-bit, non-prefetchable) [disabled] [size=1K] 00:1f.3 SMBus: Intel Corp. 82801CA/CAM SMBus (rev 02) Subsystem: Intel Corp.: Unknown device 3415 Control: I/O+ Mem- BusMaster- SpecCycle- MemWINV- VGASnoop- ParErr- Stepping- SERR- FastB2B- Status: Cap- 66Mhz- UDF- FastB2B+ ParErr- DEVSEL=medium >TAbort- SERR- TAbort- SERR- TAbort- SERR- TAbort- SERR- Reset- FastB2B- Capabilities: [50] PCI-X non-bridge device. Command: DPERE+ ERO+ RBC=0 OST=0 Status: Bus=0 Dev=0 Func=0 64bit- 133MHz- SCD- USC-, DC=simple, DMMRBC=0, DMOST=0, DMCRS=0, RSCEM- 02:1e.0 PIC: Intel Corp. 82870P2 P64H2 I/OxAPIC (rev 03) (prog-if 20 [IO(X)-APIC]) Subsystem: Intel Corp.: Unknown device 3415 Control: I/O- Mem+ BusMaster+ SpecCycle- MemWINV- VGASnoop- ParErr- Stepping- SERR+ FastB2B- Status: Cap+ 66Mhz+ UDF- FastB2B- ParErr- DEVSEL=fast >TAbort- SERR- TAbort- SERR- Reset- FastB2B- Capabilities: [50] PCI-X non-bridge device. Command: DPERE+ ERO+ RBC=0 OST=0 Status: Bus=0 Dev=0 Func=0 64bit- 133MHz- SCD- USC-, DC=simple, DMMRBC=0, DMOST=0, DMCRS=0, RSCEM- 03:07.0 Ethernet controller: Intel Corp. 82546EB Gigabit Ethernet Controller (rev 01) Subsystem: Intel Corp.: Unknown device 3415 Control: I/O+ Mem+ BusMaster+ SpecCycle- MemWINV- VGASnoop- ParErr- Stepping- SERR+ FastB2B- Status: Cap+ 66Mhz+ UDF- FastB2B- ParErr- DEVSEL=medium >TAbort- SERR- TAbort- SERR- TAbort- SERR- TAbort- SERR- References: <20021225.182937.41640146.s-sumi@flab.fujitsu.co.jp> <200301021046.h02AkdX08339@emilepc.ess.nec.fr> Message-ID: <20030105.170440.74755929.s-sumi@bd6.so-net.ne.jp> Hi. Thank you for the information. The type of Myrinet NIC is shown using following command. cat /proc/pm/myrinet/0/info Following is sample output. =========================================================== [s-sumi @ pdspcc700 s-sumi]$ cat /proc/pm/myrinet/0/info PM Myrinet 2.2.1 Version : "$Id: pm_myrinet.c,v 1.2 2002/02/21 09:58:25 kameyama Exp $" cpu_version : 0x900 clockval : 0x82082a0 fpga_version : "Thu Dec 9 16:13:40 1999" product code : 0053 serial_number : 00016711 revision : 0x3 board_label : "M3F-PCI64B-2-91921" max_lanai_speed : 134 MHz sram_size : 2048 KBytes sram_addr : 0xf88de000 ISR : 0xc0a06081 CRC errors : 0 Seq num errors : 0 Inv dest errors : 0 =========================================================== I have add some tuning to PM/Myrinet firmware. Here are results on PIII 1GHz PCI64B Myrinet NIC. The performance of tuned version is 20MB/s higher than that of original. PS: The PM/Myrinet level bi-directional performance is around 370 MB/s. I think you are using PCI64C NIC from the performance results of Myricom page. http://www.myri.com/myrinet/performance/index.html =============================================================================== =============================================================================== Original (PALLS PMB) #----------------------------------------------------------------------------- # Benchmarking Sendrecv # ( #processes = 2 ) # ( 14 additional processes waiting in MPI_Barrier) #----------------------------------------------------------------------------- #bytes #repetitions t_min[usec] t_max[usec] t_avg[usec] Mbytes/sec 0 1000 10.36 10.36 10.36 0.00 1 1000 10.58 10.58 10.58 0.18 2 1000 10.60 10.60 10.60 0.36 4 1000 10.53 10.53 10.53 0.72 8 1000 10.98 10.98 10.98 1.39 16 1000 10.74 10.74 10.74 2.84 32 1000 11.37 11.37 11.37 5.37 64 1000 12.17 12.17 12.17 10.03 128 1000 13.34 13.34 13.34 18.30 256 1000 15.39 15.40 15.39 31.71 512 1000 19.33 19.34 19.34 50.49 1024 1000 27.71 27.73 27.72 70.44 2048 1000 45.98 46.00 45.99 84.91 4096 1000 77.80 77.83 77.81 100.38 8192 1000 141.07 141.12 141.09 110.72 16384 1000 197.21 197.21 197.21 158.46 32768 1000 286.03 286.03 286.03 218.51 65536 1000 465.88 465.88 465.88 268.31 131072 1000 847.32 847.32 847.32 295.05 262144 640 1589.94 1589.96 1589.95 314.47 524288 320 3121.36 3121.38 3121.37 320.37 1048576 160 6121.23 6121.32 6121.27 326.73 2097152 80 14025.73 14025.80 14025.76 285.19 4194304 40 28754.43 28754.75 28754.59 278.21 =============================================================================== =============================================================================== Tuned (PALLS PMB) #----------------------------------------------------------------------------- # Benchmarking Sendrecv # ( #processes = 2 ) # ( 14 additional processes waiting in MPI_Barrier) #----------------------------------------------------------------------------- #bytes #repetitions t_min[usec] t_max[usec] t_avg[usec] Mbytes/sec 0 1000 10.55 10.55 10.55 0.00 1 1000 10.77 10.77 10.77 0.18 2 1000 10.85 10.86 10.86 0.35 4 1000 10.80 10.80 10.80 0.71 8 1000 11.19 11.19 11.19 1.36 16 1000 10.80 10.81 10.81 2.82 32 1000 11.30 11.31 11.31 5.39 64 1000 12.19 12.20 12.20 10.00 128 1000 13.42 13.42 13.42 18.19 256 1000 15.40 15.41 15.41 31.68 512 1000 19.49 19.50 19.50 50.07 1024 1000 27.72 27.72 27.72 70.45 2048 1000 45.93 45.94 45.94 85.02 4096 1000 77.67 77.69 77.68 100.56 8192 1000 140.16 140.21 140.18 111.44 16384 1000 169.23 169.24 169.24 184.65 32768 1000 258.15 258.16 258.16 242.10 65536 1000 443.68 443.69 443.69 281.73 131072 1000 800.38 800.38 800.38 312.35 262144 640 1521.31 1521.33 1521.32 328.66 524288 320 2971.09 2971.13 2971.11 336.57 1048576 160 5961.91 5962.01 5961.96 335.46 2097152 80 12011.04 12011.15 12011.09 333.02 4194304 40 23131.40 23131.75 23131.57 345.85 =============================================================================== =============================================================================== Shinji. From: Emile CARCAMO Subject: Re: [SCore-users-jp] Re: [SCore-users] GM availability on SCore, when ??? Date: Thu, 02 Jan 2003 11:46:39 +0100 Message-ID: <200301021046.h02AkdX08339 @ emilepc.ess.nec.fr> emile.carcamo> emile.carcamo> emile.carcamo> s-sumi @ flab.fujitsu.co.jp said: emile.carcamo> > Could you let me know your measurement envinronment? emile.carcamo> > 1) Which Myrinet Cards are you using, PCI64B or PCI64C? emile.carcamo> > 2) How about your host environment, CPU, chipset and memory? emile.carcamo> emile.carcamo> Dear Shinji-san, emile.carcamo> emile.carcamo> Concerning the Myrinet card type, I'm not 100% sure of it emile.carcamo> but the nodes are Express5800 120rc1 model (this info may emile.carcamo> help, just in case). I've also enclosed some infos like : emile.carcamo> memory available per node, lspci -vv (run as root !), the emile.carcamo> contents of /proc/cpuinfo. Let me know if you need some emile.carcamo> more inputs from me ? emile.carcamo> emile.carcamo> Thanks again for your help, and best regards. emile.carcamo> emile.carcamo> -- emile.carcamo> Emile_CARCAMO NEC European http://www.ess.nec.de emile.carcamo> System Engineer Supercomputer mailto:emile.carcamo @ nec.fr emile.carcamo> Systems France GSM mailto:emile.carcamo @ orange.fr emile.carcamo> (+33)1-3930-6601 FAX emile.carcamo> (+33)1-3930-6613 PHONE / Your mouse has moved. Windows NT must be restarted \ emile.carcamo> (+33)6-8063-7003 GSM \ for the change to take effect. Reboot now? [ OK ] / emile.carcamo> emile.carcamo> ------------------------------------------------------------------------------- emile.carcamo> [ecarcamo]<115>rsh-all -g essfrance dmesg | grep Memory emile.carcamo> node01.ess.nec.fr: Memory: 899708k/917504k available (1676k kernel code, emile.carcamo> 17392k reserved, 500k data, 232k init, 0k highmem) emile.carcamo> node05.ess.nec.fr: Memory: 899724k/917504k available (1676k kernel code, emile.carcamo> 17392k reserved, 500k data, 232k init, 0k highmem) emile.carcamo> node02.ess.nec.fr: Memory: 899708k/917504k available (1676k kernel code, emile.carcamo> 17392k reserved, 500k data, 232k init, 0k highmem) emile.carcamo> node03.ess.nec.fr: Memory: 899708k/917504k available (1676k kernel code, emile.carcamo> 17392k reserved, 500k data, 232k init, 0k highmem) emile.carcamo> node04.ess.nec.fr: Memory: 899708k/917504k available (1676k kernel code, emile.carcamo> 17392k reserved, 500k data, 232k init, 0k highmem) emile.carcamo> node06.ess.nec.fr: Memory: 899724k/917504k available (1676k kernel code, emile.carcamo> 17392k reserved, 500k data, 232k init, 0k highmem) emile.carcamo> node07.ess.nec.fr: Memory: 899708k/917504k available (1676k kernel code, emile.carcamo> 17392k reserved, 500k data, 232k init, 0k highmem) emile.carcamo> [ecarcamo]<116> emile.carcamo> emile.carcamo> ------------------------------------------------------------------------------- emile.carcamo> 00:00.0 Host bridge: Intel Corp. e7500 DRAM Controller (rev 03) emile.carcamo> Subsystem: Intel Corp.: Unknown device 3415 emile.carcamo> Control: I/O- Mem+ BusMaster+ SpecCycle- MemWINV- VGASnoop- ParErr- Stepping- emile.carcamo> SERR- FastB2B- emile.carcamo> Status: Cap- 66Mhz- UDF- FastB2B+ ParErr- DEVSEL=fast >TAbort- SERR- Latency: 0 emile.carcamo> emile.carcamo> 00:00.1 Class ff00: Intel Corp. e7500 DRAM Controller Error Reporting (rev 03) emile.carcamo> Subsystem: Intel Corp.: Unknown device 3415 emile.carcamo> Control: I/O- Mem- BusMaster- SpecCycle- MemWINV- VGASnoop- ParErr- Stepping- emile.carcamo> SERR+ FastB2B- emile.carcamo> Status: Cap- 66Mhz- UDF- FastB2B- ParErr- DEVSEL=fast >TAbort- SERR- emile.carcamo> 00:03.0 PCI bridge: Intel Corp. e7500 HI_C Virtual PCI-to-PCI Bridge (F0) (rev emile.carcamo> 03) (prog-if 00 [Normal decode]) emile.carcamo> Control: I/O+ Mem+ BusMaster+ SpecCycle- MemWINV- VGASnoop- ParErr- Stepping- emile.carcamo> SERR- FastB2B- emile.carcamo> Status: Cap- 66Mhz+ UDF- FastB2B+ ParErr- DEVSEL=fast >TAbort- SERR- Latency: 64 emile.carcamo> Bus: primary=00, secondary=02, subordinate=04, sec-latency=0 emile.carcamo> I/O behind bridge: 00002000-00003fff emile.carcamo> Memory behind bridge: fe900000-febfffff emile.carcamo> BridgeCtl: Parity+ SERR+ NoISA- VGA- MAbort- >Reset- FastB2B- emile.carcamo> emile.carcamo> 00:03.1 Class ff00: Intel Corp. e7500 HI_C Virtual PCI-to-PCI Bridge (F1) (rev emile.carcamo> 03) emile.carcamo> Subsystem: Intel Corp.: Unknown device 3415 emile.carcamo> Control: I/O- Mem- BusMaster- SpecCycle- MemWINV- VGASnoop- ParErr- Stepping- emile.carcamo> SERR+ FastB2B- emile.carcamo> Status: Cap- 66Mhz- UDF- FastB2B- ParErr- DEVSEL=fast >TAbort- SERR- emile.carcamo> 00:1d.0 USB Controller: Intel Corp. 82801CA/CAM USB (Hub (rev 02) (prog-if 00 emile.carcamo> [UHCI]) emile.carcamo> Subsystem: Intel Corp.: Unknown device 3415 emile.carcamo> Control: I/O+ Mem- BusMaster+ SpecCycle- MemWINV- VGASnoop- ParErr- Stepping- emile.carcamo> SERR- FastB2B- emile.carcamo> Status: Cap- 66Mhz- UDF- FastB2B+ ParErr- DEVSEL=medium >TAbort- SERR- Latency: 0 emile.carcamo> Interrupt: pin A routed to IRQ 16 emile.carcamo> Region 4: I/O ports at 4020 [size=32] emile.carcamo> emile.carcamo> 00:1d.1 USB Controller: Intel Corp. 82801CA/CAM USB (Hub (rev 02) (prog-if 00 emile.carcamo> [UHCI]) emile.carcamo> Subsystem: Intel Corp.: Unknown device 3415 emile.carcamo> Control: I/O+ Mem- BusMaster+ SpecCycle- MemWINV- VGASnoop- ParErr- Stepping- emile.carcamo> SERR- FastB2B- emile.carcamo> Status: Cap- 66Mhz- UDF- FastB2B+ ParErr- DEVSEL=medium >TAbort- SERR- Latency: 0 emile.carcamo> Interrupt: pin B routed to IRQ 19 emile.carcamo> Region 4: I/O ports at 4000 [size=32] emile.carcamo> emile.carcamo> 00:1e.0 PCI bridge: Intel Corp. 82801BA/CA PCI Bridge (rev 42) (prog-if 00 emile.carcamo> [Normal decode]) emile.carcamo> Control: I/O+ Mem+ BusMaster+ SpecCycle- MemWINV- VGASnoop- ParErr+ Stepping- emile.carcamo> SERR+ FastB2B- emile.carcamo> Status: Cap- 66Mhz- UDF- FastB2B+ ParErr- DEVSEL=fast >TAbort- SERR- Latency: 0 emile.carcamo> Bus: primary=00, secondary=01, subordinate=01, sec-latency=32 emile.carcamo> I/O behind bridge: 00001000-00001fff emile.carcamo> Memory behind bridge: fc800000-fe8fffff emile.carcamo> BridgeCtl: Parity+ SERR+ NoISA- VGA+ MAbort- >Reset- FastB2B- emile.carcamo> emile.carcamo> 00:1f.0 ISA bridge: Intel Corp. 82801CA ISA Bridge (LPC) (rev 02) emile.carcamo> Control: I/O+ Mem+ BusMaster+ SpecCycle+ MemWINV- VGASnoop- ParErr+ Stepping- emile.carcamo> SERR+ FastB2B- emile.carcamo> Status: Cap- 66Mhz- UDF- FastB2B+ ParErr- DEVSEL=medium >TAbort- SERR- Latency: 0 emile.carcamo> emile.carcamo> 00:1f.1 IDE interface: Intel Corp. 82801CA IDE U100 (rev 02) (prog-if 8a emile.carcamo> [Master SecP PriP]) emile.carcamo> Subsystem: Intel Corp.: Unknown device 3415 emile.carcamo> Control: I/O+ Mem- BusMaster+ SpecCycle- MemWINV- VGASnoop- ParErr- Stepping- emile.carcamo> SERR- FastB2B- emile.carcamo> Status: Cap- 66Mhz- UDF- FastB2B+ ParErr- DEVSEL=medium >TAbort- SERR- Latency: 0 emile.carcamo> Interrupt: pin A routed to IRQ 17 emile.carcamo> Region 0: I/O ports at [size=8] emile.carcamo> Region 1: I/O ports at [size=4] emile.carcamo> Region 2: I/O ports at [size=8] emile.carcamo> Region 3: I/O ports at [size=4] emile.carcamo> Region 4: I/O ports at 03a0 [size=16] emile.carcamo> Region 5: Memory at 80000000 (32-bit, non-prefetchable) [disabled] [size=1K] emile.carcamo> emile.carcamo> 00:1f.3 SMBus: Intel Corp. 82801CA/CAM SMBus (rev 02) emile.carcamo> Subsystem: Intel Corp.: Unknown device 3415 emile.carcamo> Control: I/O+ Mem- BusMaster- SpecCycle- MemWINV- VGASnoop- ParErr- Stepping- emile.carcamo> SERR- FastB2B- emile.carcamo> Status: Cap- 66Mhz- UDF- FastB2B+ ParErr- DEVSEL=medium >TAbort- SERR- Interrupt: pin B routed to IRQ 17 emile.carcamo> Region 4: I/O ports at 0580 [size=32] emile.carcamo> emile.carcamo> 01:0c.0 VGA compatible controller: ATI Technologies Inc Rage XL (rev 27) emile.carcamo> (prog-if 00 [VGA]) emile.carcamo> Subsystem: Intel Corp.: Unknown device 3415 emile.carcamo> Control: I/O+ Mem+ BusMaster+ SpecCycle- MemWINV- VGASnoop- ParErr- Stepping+ emile.carcamo> SERR- FastB2B- emile.carcamo> Status: Cap+ 66Mhz- UDF- FastB2B+ ParErr- DEVSEL=medium >TAbort- SERR- Latency: 64 (2000ns min), cache line size 10 emile.carcamo> Interrupt: pin A routed to IRQ 17 emile.carcamo> Region 0: Memory at fd000000 (32-bit, non-prefetchable) [size=16M] emile.carcamo> Region 1: I/O ports at 1000 [size=256] emile.carcamo> Region 2: Memory at fe6f0000 (32-bit, non-prefetchable) [size=4K] emile.carcamo> Expansion ROM at fe6c0000 [disabled] [size=128K] emile.carcamo> Capabilities: [5c] Power Management version 2 emile.carcamo> Flags: PMEClk- DSI- D1+ D2+ AuxCurrent=0mA PME(D0-,D1-,D2-,D3hot-,D3cold-) emile.carcamo> Status: D0 PME-Enable- DSel=0 DScale=0 PME- emile.carcamo> emile.carcamo> 02:1c.0 PIC: Intel Corp. 82870P2 P64H2 I/OxAPIC (rev 03) (prog-if 20 emile.carcamo> [IO(X)-APIC]) emile.carcamo> Subsystem: Intel Corp.: Unknown device 3415 emile.carcamo> Control: I/O- Mem+ BusMaster+ SpecCycle- MemWINV- VGASnoop- ParErr- Stepping- emile.carcamo> SERR+ FastB2B- emile.carcamo> Status: Cap+ 66Mhz+ UDF- FastB2B- ParErr- DEVSEL=fast >TAbort- SERR- Latency: 0 emile.carcamo> Region 0: Memory at febe0000 (32-bit, non-prefetchable) [size=4K] emile.carcamo> Capabilities: [50] PCI-X non-bridge device. emile.carcamo> Command: DPERE- ERO- RBC=0 OST=0 emile.carcamo> Status: Bus=0 Dev=0 Func=0 64bit- 133MHz- SCD- USC-, DC=simple, DMMRBC=0, emile.carcamo> DMOST=0, DMCRS=0, RSCEM- emile.carcamo> emile.carcamo> 02:1d.0 PCI bridge: Intel Corp. 82870P2 P64H2 Hub PCI Bridge (rev 03) (prog-if emile.carcamo> 00 [Normal decode]) emile.carcamo> Control: I/O+ Mem+ BusMaster+ SpecCycle- MemWINV- VGASnoop- ParErr+ Stepping- emile.carcamo> SERR+ FastB2B- emile.carcamo> Status: Cap+ 66Mhz+ UDF- FastB2B- ParErr- DEVSEL=fast >TAbort- SERR- Latency: 64, cache line size 10 emile.carcamo> Bus: primary=02, secondary=04, subordinate=04, sec-latency=48 emile.carcamo> I/O behind bridge: 00003000-00003fff emile.carcamo> Memory behind bridge: fea00000-feafffff emile.carcamo> BridgeCtl: Parity+ SERR+ NoISA- VGA- MAbort- >Reset- FastB2B- emile.carcamo> Capabilities: [50] PCI-X non-bridge device. emile.carcamo> Command: DPERE+ ERO+ RBC=0 OST=0 emile.carcamo> Status: Bus=0 Dev=0 Func=0 64bit- 133MHz- SCD- USC-, DC=simple, DMMRBC=0, emile.carcamo> DMOST=0, DMCRS=0, RSCEM- emile.carcamo> emile.carcamo> 02:1e.0 PIC: Intel Corp. 82870P2 P64H2 I/OxAPIC (rev 03) (prog-if 20 emile.carcamo> [IO(X)-APIC]) emile.carcamo> Subsystem: Intel Corp.: Unknown device 3415 emile.carcamo> Control: I/O- Mem+ BusMaster+ SpecCycle- MemWINV- VGASnoop- ParErr- Stepping- emile.carcamo> SERR+ FastB2B- emile.carcamo> Status: Cap+ 66Mhz+ UDF- FastB2B- ParErr- DEVSEL=fast >TAbort- SERR- Latency: 0 emile.carcamo> Region 0: Memory at febf0000 (32-bit, non-prefetchable) [size=4K] emile.carcamo> Capabilities: [50] PCI-X non-bridge device. emile.carcamo> Command: DPERE- ERO- RBC=0 OST=0 emile.carcamo> Status: Bus=0 Dev=0 Func=0 64bit- 133MHz- SCD- USC-, DC=simple, DMMRBC=0, emile.carcamo> DMOST=0, DMCRS=0, RSCEM- emile.carcamo> emile.carcamo> 02:1f.0 PCI bridge: Intel Corp. 82870P2 P64H2 Hub PCI Bridge (rev 03) (prog-if emile.carcamo> 00 [Normal decode]) emile.carcamo> Control: I/O+ Mem+ BusMaster+ SpecCycle- MemWINV- VGASnoop- ParErr+ Stepping- emile.carcamo> SERR+ FastB2B- emile.carcamo> Status: Cap+ 66Mhz+ UDF- FastB2B- ParErr- DEVSEL=fast >TAbort- SERR- Latency: 64, cache line size 10 emile.carcamo> Bus: primary=02, secondary=03, subordinate=03, sec-latency=64 emile.carcamo> I/O behind bridge: 00002000-00002fff emile.carcamo> Memory behind bridge: fe900000-fe9fffff emile.carcamo> BridgeCtl: Parity+ SERR+ NoISA- VGA- MAbort- >Reset- FastB2B- emile.carcamo> Capabilities: [50] PCI-X non-bridge device. emile.carcamo> Command: DPERE+ ERO+ RBC=0 OST=0 emile.carcamo> Status: Bus=0 Dev=0 Func=0 64bit- 133MHz- SCD- USC-, DC=simple, DMMRBC=0, emile.carcamo> DMOST=0, DMCRS=0, RSCEM- emile.carcamo> emile.carcamo> 03:07.0 Ethernet controller: Intel Corp. 82546EB Gigabit Ethernet Controller emile.carcamo> (rev 01) emile.carcamo> Subsystem: Intel Corp.: Unknown device 3415 emile.carcamo> Control: I/O+ Mem+ BusMaster+ SpecCycle- MemWINV- VGASnoop- ParErr- Stepping- emile.carcamo> SERR+ FastB2B- emile.carcamo> Status: Cap+ 66Mhz+ UDF- FastB2B- ParErr- DEVSEL=medium >TAbort- SERR- Latency: 64 (63750ns min), cache line size 10 emile.carcamo> Interrupt: pin A routed to IRQ 30 emile.carcamo> Region 0: Memory at fe940000 (64-bit, non-prefetchable) [size=128K] emile.carcamo> Region 4: I/O ports at 2040 [size=64] emile.carcamo> Capabilities: [dc] Power Management version 2 emile.carcamo> Flags: PMEClk+ DSI+ D1- D2- AuxCurrent=0mA PME(D0+,D1-,D2-,D3hot+,D3cold+) emile.carcamo> Status: D0 PME-Enable- DSel=0 DScale=1 PME- emile.carcamo> Capabilities: [e4] PCI-X non-bridge device. emile.carcamo> Command: DPERE- ERO+ RBC=0 OST=0 emile.carcamo> Status: Bus=0 Dev=0 Func=0 64bit- 133MHz- SCD- USC-, DC=simple, DMMRBC=0, emile.carcamo> DMOST=0, DMCRS=0, RSCEM- emile.carcamo> Capabilities: [f0] Message Signalled Interrupts: 64bit+ Queue=0/0 Enable- emile.carcamo> Address: 0000000000000000 Data: 0000 emile.carcamo> emile.carcamo> 03:07.1 Ethernet controller: Intel Corp. 82546EB Gigabit Ethernet Controller emile.carcamo> (rev 01) emile.carcamo> Subsystem: Intel Corp.: Unknown device 3415 emile.carcamo> Control: I/O+ Mem+ BusMaster+ SpecCycle- MemWINV+ VGASnoop- ParErr- Stepping- emile.carcamo> SERR+ FastB2B- emile.carcamo> Status: Cap+ 66Mhz+ UDF- FastB2B- ParErr- DEVSEL=medium >TAbort- SERR- Latency: 64 (63750ns min), cache line size 10 emile.carcamo> Interrupt: pin B routed to IRQ 31 emile.carcamo> Region 0: Memory at fe960000 (64-bit, non-prefetchable) [size=128K] emile.carcamo> Region 4: I/O ports at 2000 [size=64] emile.carcamo> Capabilities: [dc] Power Management version 2 emile.carcamo> Flags: PMEClk+ DSI+ D1- D2- AuxCurrent=0mA PME(D0+,D1-,D2-,D3hot+,D3cold+) emile.carcamo> Status: D0 PME-Enable- DSel=0 DScale=1 PME- emile.carcamo> Capabilities: [e4] PCI-X non-bridge device. emile.carcamo> Command: DPERE- ERO+ RBC=0 OST=0 emile.carcamo> Status: Bus=0 Dev=0 Func=0 64bit- 133MHz- SCD- USC-, DC=simple, DMMRBC=0, emile.carcamo> DMOST=0, DMCRS=0, RSCEM- emile.carcamo> Capabilities: [f0] Message Signalled Interrupts: 64bit+ Queue=0/0 Enable- emile.carcamo> Address: 0000000000000000 Data: 0000 emile.carcamo> emile.carcamo> 04:07.0 SCSI storage controller: Adaptec AIC-7899P U160/m (rev 01) emile.carcamo> Subsystem: Intel Corp.: Unknown device 3415 emile.carcamo> Control: I/O- Mem+ BusMaster+ SpecCycle- MemWINV+ VGASnoop- ParErr- Stepping- emile.carcamo> SERR+ FastB2B- emile.carcamo> Status: Cap+ 66Mhz+ UDF- FastB2B+ ParErr- DEVSEL=medium >TAbort- SERR- Latency: 64 (10000ns min, 6250ns max), cache line size 10 emile.carcamo> Interrupt: pin A routed to IRQ 50 emile.carcamo> BIST result: 00 emile.carcamo> Region 0: I/O ports at 3400 [disabled] [size=256] emile.carcamo> Region 1: Memory at fea30000 (64-bit, non-prefetchable) [size=4K] emile.carcamo> Expansion ROM at fea00000 [disabled] [size=128K] emile.carcamo> Capabilities: [dc] Power Management version 2 emile.carcamo> Flags: PMEClk- DSI- D1- D2- AuxCurrent=0mA PME(D0-,D1-,D2-,D3hot-,D3cold-) emile.carcamo> Status: D0 PME-Enable- DSel=0 DScale=0 PME- emile.carcamo> emile.carcamo> 04:07.1 SCSI storage controller: Adaptec AIC-7899P U160/m (rev 01) emile.carcamo> Subsystem: Intel Corp.: Unknown device 3415 emile.carcamo> Control: I/O- Mem+ BusMaster+ SpecCycle- MemWINV+ VGASnoop- ParErr- Stepping- emile.carcamo> SERR+ FastB2B- emile.carcamo> Status: Cap+ 66Mhz+ UDF- FastB2B+ ParErr- DEVSEL=medium >TAbort- SERR- Latency: 64 (10000ns min, 6250ns max), cache line size 10 emile.carcamo> Interrupt: pin B routed to IRQ 49 emile.carcamo> BIST result: 00 emile.carcamo> Region 0: I/O ports at 3000 [disabled] [size=256] emile.carcamo> Region 1: Memory at feae0000 (64-bit, non-prefetchable) [size=4K] emile.carcamo> Expansion ROM at fea40000 [disabled] [size=128K] emile.carcamo> Capabilities: [dc] Power Management version 2 emile.carcamo> Flags: PMEClk- DSI- D1- D2- AuxCurrent=0mA PME(D0-,D1-,D2-,D3hot-,D3cold-) emile.carcamo> Status: D0 PME-Enable- DSel=0 DScale=0 PME- emile.carcamo> emile.carcamo> ------------------------------------------------------------------------------- emile.carcamo> processor : 0 emile.carcamo> vendor_id : GenuineIntel emile.carcamo> cpu family : 15 emile.carcamo> model : 2 emile.carcamo> model name : Intel(R) XEON(TM) CPU 2.40GHz emile.carcamo> stepping : 4 emile.carcamo> cpu MHz : 2392.975 emile.carcamo> cache size : 512 KB emile.carcamo> fdiv_bug : no emile.carcamo> hlt_bug : no emile.carcamo> f00f_bug : no emile.carcamo> coma_bug : no emile.carcamo> fpu : yes emile.carcamo> fpu_exception : yes emile.carcamo> cpuid level : 2 emile.carcamo> wp : yes emile.carcamo> flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat emile.carcamo> pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm emile.carcamo> bogomips : 4771.02 emile.carcamo> emile.carcamo> processor : 1 emile.carcamo> vendor_id : GenuineIntel emile.carcamo> cpu family : 15 emile.carcamo> model : 2 emile.carcamo> model name : Intel(R) XEON(TM) CPU 2.40GHz emile.carcamo> stepping : 4 emile.carcamo> cpu MHz : 2392.975 emile.carcamo> cache size : 512 KB emile.carcamo> fdiv_bug : no emile.carcamo> hlt_bug : no emile.carcamo> f00f_bug : no emile.carcamo> coma_bug : no emile.carcamo> fpu : yes emile.carcamo> fpu_exception : yes emile.carcamo> cpuid level : 2 emile.carcamo> wp : yes emile.carcamo> flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat emile.carcamo> pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm emile.carcamo> bogomips : 4784.12 emile.carcamo> emile.carcamo> ------------------------------------------------------------------------------- emile.carcamo> emile.carcamo> emile.carcamo> _______________________________________________ emile.carcamo> SCore-users mailing list emile.carcamo> SCore-users @ pccluster.org emile.carcamo> http://www.pccluster.org/mailman/listinfo/score-users emile.carcamo> ----- Shinji Sumimoto E-Mail: s-sumi @ bd6.so-net.ne.jp _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From s-sumi @ flab.fujitsu.co.jp Sun Jan 5 17:17:57 2003 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Sun, 05 Jan 2003 17:17:57 +0900 (JST) Subject: [SCore-users-jp] 【ネットワークトランキング】テスト評価&チップセット In-Reply-To: References: Message-ID: <20030105.171757.74727230.s-sumi@flab.fujitsu.co.jp> 富士通研の住元です。 From: "金城 尚志" Subject: [SCore-users-jp] 【ネットワークトランキング】テスト評価&チップセット Date: Thu, 2 Jan 2003 15:53:43 +0900 Message-ID: e973220> あけましておめでとうございます。 e973220> 琉球大の金城です。 e973220> e973220> e973220> 早速ですが、また質問をさせてもらってもよろしいでしょうか。 e973220> どうかよろしくおねがいします。 e973220> e973220> e973220> ━━━━━━━━━━━━━━━━━━━━━━━━ e973220> 【質問1:Test Procedure of Multiple Networkの評価】 e973220> ━━━━━━━━━━━━━━━━━━━━━━━━ e973220> e973220> Network Trunking機構(PM/Ethernet)のシステム管理者ガイド e973220> http://www.pccluster.org/score/dist/score/html/ja/reference/pm/ether-trunkin e973220> g.html#rcstest e973220> を参考にrcstestを実行しました。 e973220> そうしたら次のようなメッセージがでてきました。 e973220> このメッセージをどのように評価したらよいのでしょうか? e973220> NIC4枚でのネットワークトランキングの設定はできているのでしょうか? e973220> アスタリスクとドットの間隔が、ガイドに掲載されているメッセージとは e973220> 異なっている点が気になります。 この出力は、"*"が送信、"."が受信を表しています。1文字当たり10000パケッ トです。単に送受信のパケット数を示しているだけなので、途中で途切れなけ れば気にする必要はありません。 e973220> -------メッセージ(はじまり)-------------------- e973220> e973220> starting master 0 : pe=8 e973220> starting slave: 4 5 1 2 3 6 7. e973220> testing*.*.**.*.*.*.*.**..**.*..*.**.*..*.**.*.**.*.**.*.*.**.*.*.*.*.*.*.*. e973220> *.*.**.*.**.*.*.**..**.**.*.*.**.*.*.*.*.*.**.*.*.**.*.*.**.*.*.*.**.*.*.*.* e973220> *.*.*.**.*.*.**.**.*.*.**.*.*.**.*.*.*.*.*.**.*.*.*.*.*.comp7( 7) Signal: e973220> Interrupted system call(4) e973220> comp5( 5) Signal: Interrupted system call(4) e973220> comp6( 6) Signal: Interrupted system call(4) e973220> comp4( 4) Signal: Interrupted system call(4) e973220> comp3( 3) Signal: Interrupted system call(4) e973220> comp2( 2) Signal: Interrupted system call(4) e973220> comp0( 0) Signal: Interrupted system call(4) e973220> comp1( 1) Signal: Interrupted system call(4) e973220> e973220> -------メッセージ(おわり)-------------------- e973220> e973220> e973220> e973220> 【補足】 e973220> Network Trunking機構(PM/Ethernet)のシステム管理者ガイド e973220> http://www.pccluster.org/score/dist/score/html/ja/reference/pm/ether-trunkin e973220> g.html e973220> を参考にNIC4枚でのクラスタを構築しました。 e973220> 設定は上のガイドの通りに行いましたが、ただpm-ethernet-[0-4].confの作成につい e973220> ては e973220> 次のコマンドオプションで行いました。 e973220> # mkpmethernetconf -unit 0 -speed 100 -device eth0 -g sougen e973220> pm-ethernet-0.conf e973220> ( sougen はグループ名) e973220> e973220> (参考:ガイドのコマンドオプション) e973220> # mkpmethernetconf -unit 0 -speed 100 -device eth0 pm-udp.conf e973220> pm-ethernet-0.conf e973220> e973220> e973220> e973220> e973220> ━━━━━━━━━━━━━━━━━━━━━━━━ e973220> 【質問2:VIAのチップセット】 e973220> ━━━━━━━━━━━━━━━━━━━━━━━━ e973220> e973220> Network Trunking機構(PM/Ethernet)のシステム管理者ガイドに e973220> 次のような記述があります。 e973220> >Comments: VIAのチップセットを用いたNICは2枚以上ではハードウェアエラーのため e973220> 動作しませんでした。 e973220> e973220> これはNICのチップセットのことなのでしょうか?それともマザーボードの e973220> チップセットのことなのでしょうか? これは、VIAの”VI AVT86C100 Rhien".NICのことです。 e973220> すみません、ハードウェアについても無知なためよくわかりません。 e973220> が、アスキーデジタル用語辞典に書いてあるとおり、 e973220> http://yougo.ascii24.com/gh/00/000070.html e973220> チップセットとは、マザーボードのチップセットをさすのでしょうか? e973220> ━━━━━━━━━━━━━━━━━━━━━━━━ e973220> 【まとめ:なぜ上記の質問をしたのか】 e973220> ━━━━━━━━━━━━━━━━━━━━━━━━ e973220> e973220> 実は、計算ホストへNICを1枚ずつの時、 e973220> 計算ホストへNICを2枚ずつの時、 e973220> 計算ホストへNICを3枚ずつの時、 e973220> 計算ホストへNICを4枚ずつの時と e973220> して、NPB(Nas Parallel Benchmarks)を実行させて e973220> 見ました。 e973220> e973220> そうすると、計算ホストが8台の時、 e973220> NIC2枚、NIC3枚、NIC4枚の時の結果が e973220> ほぼ同じだったのです。 e973220> e973220> e973220> なので、僕のネットワークトランキング機構の設定が e973220> 間違っているのか、それともハードウェアが悪いのかを e973220> はっきりさせたいのです。 まず、rpmtestでバンド幅性能が向上しているかを確認してください。性能向 上していない場合は、pm-ethernet.confの設定でmaxnsend, backoffの値を変 えて性能が変わるか見てください。 LU Class A だとそんなに差はでないと思います。Class BのIS, FT, CGくらい を試すのが良いと思います。 e973220> 【参考】 e973220> NPBのLUのログを書きに示します。 e973220> 計算ホストの数、NICの数を変えていってログを取りました。 e973220> 1、2、4、8は計算ホストの数です。NIC-1, NIC-2 ,,, はNICの数です。 e973220> e973220> NPB2.4 LU Class=A e973220> e973220> 1 2 4 8 e973220> NIC-1 271.228 496.384 697.825 1224.17 e973220> NIC-2 271.904 516.218 907.962 1423.96 e973220> NIC-3 272.097 518.271 892.178 1414.24 e973220> NIC-4 272.394 524.728 901.533 1429.2 e973220> e973220> (それぞれのログの数値は10回計測してその平均をとりました) e973220> e973220> e973220> e973220> ━┛━┛━┛━┛━┛━┛━┛━┛━┛ e973220>   琉球大学理学部 物質地球科学科 e973220>   金城 尚志 (キンジョウヒサシ) e973220> ━┛━┛━┛━┛━┛━┛━┛━┛━┛ e973220> e973220> _______________________________________________ e973220> SCore-users-jp mailing list e973220> SCore-users-jp @ pccluster.org e973220> http://www.pccluster.org/mailman/listinfo/score-users-jp e973220> ------ Shinji Sumimoto, Fujitsu Labs From e973220 @ eve.u-ryukyu.ac.jp Sun Jan 5 18:24:33 2003 From: e973220 @ eve.u-ryukyu.ac.jp (金城 尚志) Date: Sun, 5 Jan 2003 18:24:33 +0900 Subject: [SCore-users-jp] 【ネットワークトランキング】テスト評価&チップセット In-Reply-To: <20030105.171757.74727230.s-sumi@flab.fujitsu.co.jp> Message-ID: 住元さま: 琉球大の金城です。 アドバイスありがとうございます。 それでは、rpmtestと、NPBのクラスBなどを もう一度実行して確認してみます。 ただ、現在クラスタが事情により使えない状況になっているので、 数日後に結果を報告させてもらいます。 ありがとうございました。 ━┛━┛━┛━┛━┛━┛━┛━┛━┛   琉球大学理学部 物質地球科学科   金城 尚志 (キンジョウヒサシ) ━┛━┛━┛━┛━┛━┛━┛━┛━┛ From emile.carcamo @ nec.fr Mon Jan 6 17:28:55 2003 From: emile.carcamo @ nec.fr (Emile CARCAMO) Date: Mon, 06 Jan 2003 09:28:55 +0100 Subject: [SCore-users-jp] Re: [SCore-users] GM availability on SCore, when ??? In-Reply-To: Your message of "Sun, 05 Jan 2003 17:04:40 +0900." <20030105.170440.74755929.s-sumi@bd6.so-net.ne.jp> Message-ID: <200301060828.h068Su503311@emilepc.ess.nec.fr> s-sumi @ bd6.so-net.ne.jp said: > Thank you for the information. > The type of Myrinet NIC is shown using following command. > cat /proc/pm/myrinet/0/info > Following is sample output. Dear Shinji-san, Thanks for this info. My problem is that the Myrinet hardware (PCI boards, cables and switch) was on load until mid-december so I'm not able to test anything right now ... However I could call our Myrinet supplier who confirmed that the model he gave us was PCI64C (CPU and memory running at 200 Mhz). Sorry but I can't tell you more for the moment :-( Best regards, -- Emile_CARCAMO NEC European http://www.ess.nec.de System Engineer Supercomputer mailto:emile.carcamo @ nec.fr Systems France GSM mailto:emile.carcamo @ orange.fr (+33)1-3930-6601 FAX (+33)1-3930-6613 PHONE / Your mouse has moved. Windows NT must be restarted \ (+33)6-8063-7003 GSM \ for the change to take effect. Reboot now? [ OK ] / _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From s-sumi @ bd6.so-net.ne.jp Mon Jan 6 17:53:36 2003 From: s-sumi @ bd6.so-net.ne.jp (=?iso-2022-jp?b?cy1zdW1pIBskQiF3GyhCIGJkNi5zby1uZXQubmUuanA=?=) Date: Mon, 06 Jan 2003 17:53:36 +0900 (JST) Subject: [SCore-users-jp] Re: [SCore-users] GM availability on SCore, when ??? In-Reply-To: <200301060828.h068Su503311@emilepc.ess.nec.fr> References: <20030105.170440.74755929.s-sumi@bd6.so-net.ne.jp> <200301060828.h068Su503311@emilepc.ess.nec.fr> Message-ID: <20030106.175336.730555410.s-sumi@bd6.so-net.ne.jp> Hi. emile.carcamo> s-sumi @ bd6.so-net.ne.jp said: emile.carcamo> > Thank you for the information. emile.carcamo> > The type of Myrinet NIC is shown using following command. emile.carcamo> > cat /proc/pm/myrinet/0/info emile.carcamo> > Following is sample output. emile.carcamo> emile.carcamo> emile.carcamo> Dear Shinji-san, emile.carcamo> emile.carcamo> Thanks for this info. My problem is that the Myrinet hardware emile.carcamo> (PCI boards, cables and switch) was on load until mid-december emile.carcamo> so I'm not able to test anything right now ... However I could emile.carcamo> call our Myrinet supplier who confirmed that the model he gave emile.carcamo> us was PCI64C (CPU and memory running at 200 Mhz). Sorry but I emile.carcamo> can't tell you more for the moment :-( Best regards, Ok, I understand. The updated PM/Myrinet firmware will be released next SCore version (maybe the end of February). Please test the firmware, and, when you have any problems about troubles and performance issues, please let us know. PS: The feature that PM/Myrinet driver can be disabled by kernel boot option, is also added to the next SCore kernel. Shinji. emile.carcamo> emile.carcamo> -- emile.carcamo> Emile_CARCAMO NEC European http://www.ess.nec.de emile.carcamo> System Engineer Supercomputer mailto:emile.carcamo @ nec.fr emile.carcamo> Systems France GSM mailto:emile.carcamo @ orange.fr emile.carcamo> (+33)1-3930-6601 FAX emile.carcamo> (+33)1-3930-6613 PHONE / Your mouse has moved. Windows NT must be restarted \ emile.carcamo> (+33)6-8063-7003 GSM \ for the change to take effect. Reboot now? [ OK ] / emile.carcamo> emile.carcamo> emile.carcamo> ----- Shinji Sumimoto Fujitsu Labs _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From sugawara @ mlab.jks.ynu.ac.jp Thu Jan 9 23:08:41 2003 From: sugawara @ mlab.jks.ynu.ac.jp (Taira Sugawara) Date: Thu, 09 Jan 2003 23:08:41 +0900 Subject: [SCore-users-jp] Point-to-pointテスト失敗 Message-ID: <20030109225813.410F.SUGAWARA@mlab.jks.ynu.ac.jp> 横浜国立大学の菅原と申します。 現在ギガビットイーサでSCoreを構築しているのですが、 Point-to-pointテストで失敗しました。 マシン環境ですが、使用しているマシンが、 オンボードで100Mのイーサがあり、 後付けでIntel Pro/1000があります。 以前(2002/10/11)、ベストシステムズの中田さんに教えていただき、 その方法でインストールしました。 > でEITでインストールするときは、オンボードNICにネットワークケーブルを差し、 > インストールを行い、インストール終了後/etc/modules.confを書き換えて、 > e1000をeth0にしています。 > また、/opt/score/etc/pm-ethernet.confも3Com用になっていたので、 > あらたにe1000用に書き直しています。 計算ホストの方でeth0とeth1と入れ替え、 サーバで/opt/score/etc/pm-ethernet.confを 100Mの内容(MACアドレス)からギガビットのものへ書き換えました。 SCOUTテストは問題なく動きましたが、 PM/Ethernetのテストで、 Point-to-pointテストを実行した際に、 "pmOpenDevice: No such file or directory"と表示されます。 ウェブ上のマニュアルを見ると、これは設定ファイル (たとえば、pm-ethernet.conf)が存在しないとなっています。 上記の通り、pm-ethernet.confはちゃんと書き換えたと思うのですが、 他にも問題になりそうな設定ファイルはあるでしょうか? すいませんがよろしくお願いいたします。 菅原 平 横浜国立大学大学院 環境情報学府 情報メディア環境学専攻 情報メディア学コース 松本研究室 sugawara @ mlab.jks.ynu.ac.jp From kameyama @ pccluster.org Fri Jan 10 10:02:06 2003 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Fri, 10 Jan 2003 10:02:06 +0900 Subject: [SCore-users-jp] Point-to-pointテスト失敗 In-Reply-To: Your message of "Thu, 09 Jan 2003 23:08:41 JST." <20030109225813.410F.SUGAWARA@mlab.jks.ynu.ac.jp> Message-ID: <20030110010207.158B72003E@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <20030109225813.410F.SUGAWARA @ mlab.jks.ynu.ac.jp> Taira Sugawara wrotes: > マシン環境ですが、使用しているマシンが、 > オンボードで100Mのイーサがあり、 > 後付けでIntel Pro/1000があります。 > 以前(2002/10/11)、ベストシステムズの中田さんに教えていただき、 > その方法でインストールしました。 ちなみに, SCore 5.2.0 では boot floppy の作成のときに 1 Gbps Ethernet を選択すれば Intel Pro/1000 でも install できます. > SCOUTテストは問題なく動きましたが、 > PM/Ethernetのテストで、 > Point-to-pointテストを実行した際に、 > "pmOpenDevice: No such file or directory"と表示されます。 > ウェブ上のマニュアルを見ると、これは設定ファイル > (たとえば、pm-ethernet.conf)が存在しないとなっています。 そのほかに, hostname が正しくないなども考えられます. SCore 5.2.0 でしたら % score_entwork_check -g pcc で設定ファイルの一応のチェックができます. (MAC address まではチェックしていませんけど...) っそれでも原因が分からない, もしくは score_entwork_check コマンドが無い 場合は環境変数 PM_DEBUG を 1 に設定して動かしてみてください. from Kameyama Toyohisa From hori @ swimmy-soft.com Fri Jan 10 10:02:04 2003 From: hori @ swimmy-soft.com (Atsushi HORI) Date: Fri, 10 Jan 2003 10:02:04 +0900 Subject: [SCore-users-jp] Point-to-pointテスト失敗 In-Reply-To: <20030109225813.410F.SUGAWARA@mlab.jks.ynu.ac.jp> References: <20030109225813.410F.SUGAWARA@mlab.jks.ynu.ac.jp> Message-ID: <3125037724.hori0003@swimmy-soft.com> 堀@スイミー・ソフトウェアです. >計算ホストの方でeth0とeth1と入れ替え、 >サーバで/opt/score/etc/pm-ethernet.confを >100Mの内容(MACアドレス)からギガビットのものへ書き換えました。 /etc/rc.d/init.d/pm_ethernet も書き換える必要があります.ただし,この ファイルを書き換えた後は,(安全のため) reboot することをお薦めします. ---- 堀 敦史(ほり あつし) スイミー・ソフトウェア株式会社 From sugawara @ mlab.jks.ynu.ac.jp Fri Jan 10 12:22:45 2003 From: sugawara @ mlab.jks.ynu.ac.jp (Taira Sugawara) Date: Fri, 10 Jan 2003 12:22:45 +0900 Subject: [SCore-users-jp] Point-to-pointテスト失敗 In-Reply-To: <3125037724.hori0003@swimmy-soft.com> References: <20030109225813.410F.SUGAWARA@mlab.jks.ynu.ac.jp> <3125037724.hori0003@swimmy-soft.com> Message-ID: <20030110122054.411F.SUGAWARA@mlab.jks.ynu.ac.jp> 横浜国立大学の菅原です。 アドバイスありがとうございました。 しかし、実際に/etc/rc.d/init.d/pm_ethernetを見てみたのですが、 どこをどう書き換えていいものか悩んでしまいました。 すいませんが具体的に指摘していただけると助かります。 お手数だとは思いますがよろしくお願いいたします。 Atsushi HORI さんは書きました。 > 堀@スイミー・ソフトウェアです. > > >計算ホストの方でeth0とeth1と入れ替え、 > >サーバで/opt/score/etc/pm-ethernet.confを > >100Mの内容(MACアドレス)からギガビットのものへ書き換えました。 > > /etc/rc.d/init.d/pm_ethernet も書き換える必要があります.ただし,この > ファイルを書き換えた後は,(安全のため) reboot することをお薦めします. > > ---- > 堀 敦史(ほり あつし) > スイミー・ソフトウェア株式会社 > 菅原 平 横浜国立大学大学院 環境情報学府 情報メディア環境学専攻 情報メディア学コース 松本研究室 sugawara @ mlab.jks.ynu.ac.jp From pccc @ ics-inc.co.jp Fri Jan 10 13:37:30 2003 From: pccc @ ics-inc.co.jp (PCCC Secretariat) Date: Fri, 10 Jan 2003 13:37:30 +0900 Subject: [SCore-users-jp] 第2回PCクラスタシンポジウム開催のお知らせ Message-ID: <87FF976DCD4CD311BFA500508B2C200901EB4D89@ICSMAIL> This message is in MIME format. Since your mail reader does not understand this format, some or all of this message may not be legible. ------_=_NextPart_001_01C2B861.FC78D130 Content-Type: text/plain; charset="iso-2022-jp" =================================        第2回PCクラスタシンポジウムのご案内 構造解析、流体力学、分子動力学、ゲノム情報処理など、大規模計算を 必要とする計算科学・計算化学分野では、研究機関を中心にPCクラスタ が利用されてきました。最近では、PCクラスタは産業界にも浸透し、例え ば、自動車産業界では、車体設計、衝突シミュレーションなどにPCクラス タが利用されています。 PCクラスタコンソーシアム主催の第2回PCクラスタシンポジウムでは、 会員企業による産業界におけるPCクラスタ導入事例の講演や企業展示 など、PCクラスタに関する最新の動向をお伝えします。皆様の御参加を お待ちしております。 ■開催日時 2003年2月20日(木)〜2003年2月21日(金) 10:00〜17:00 ■開催場所 日本科学未来館7階 2003年2月20日(木):ワークショップ・・・みらいCANホール 2003年2月21日(金):シンポジウム・・・・みらいCANホール 併設企業展示:イノベーションホール なお、2月20日(木)のワークショップの参加対象は会員のみとなります。 ■参加費 無料 ■申込み方法 http://www.pccluster.org/  より お申込み下さい。 ■定員 300名 ■主催 PCクラスタコンソーシアム TEL:03-3263-6474, FAX:03-3263-7537 e-mail:sec @ pccluster.org U R L :http://www.pccluster.org/ ================================= ------_=_NextPart_001_01C2B861.FC78D130 Content-Type: text/html; charset="iso-2022-jp" Content-Transfer-Encoding: quoted-printable
=1B$B!a!a!a!a!a!a!a!a!a!a!a!a!a!a!a!a!a!a!a!a!a!a!a!a!a!a!a!a!a= !a!a!a!a=1B(J
 
=1B$B!!!!!!!!!!!!=1B(J =1B$BBh=1B(J2=1B$B2s=1B(JPC=1B$B%/%= i%9%?%7%s%]%8%&%`$N$40FFb=1B(J
 

   = =1B$B9=3DB$2r @ O!"N.BNNO3X!"J,;RF0NO3X!"%2%N%`>pJs=3DhM}$J$I!"Bg5,LO7W;;$= r=1B(J
  =20 =1B$BI,MW$H$9$k7W;;2J3X!&7W;;2=3D3XJ,Ln$G$O!"8&5f5!4X$rCf?4$K=1B(JPC=1B$= B%/%i%9%?=1B(J
  =20 =1B$B$,MxMQ$5$l$F$-$^$7$?!#:G6a$G$O!"=1B(JPC=1B$B%/%i%9%?$O;:6H3&$K$b?;F= )$7!"Nc$(=1B(J
  =20 =1B$B$P!"<+F0WFM%7%_%e%l!<%7%g%s$J$I$K=1B(JPC=1B= $B%/%i%9=1B(J
   = =1B$B%?$,MxMQ$5$l$F$$$^$9!#=1B(J
  =20 PC=1B$B%/%i%9%?%3%s%=3D!<%7%"%`  =20 =1B$B2q0w4k6H$K$h$k;:6H3&$K$*$1$k=1B(JPC=1B$B%/%i%9%?F3F~;vNc$N9V1i$d4k6= HE8<(=1B(J
  =20 =1B$B$J$I!"=1B(JPC=1B$B%/%i%9%?$K4X$9$k:G?7$NF08~$r$*EA$($7$^$9!#3'MM$N8= f;22C$r=1B(J
   =1B$B$*BT$A$7$F$*$j$^$9!#=1B(J
 
 =1B$B"#3+:EF|;~=1B(J 2003=1B$BG/=1B(J2=1B$B7n=1B(J20=1B$= BF|=1B(J(=1B$BLZ=1B(J)=1B$B!A=1B(J2003=1B$BG/=1B(J2=1B$B7n=1B(J21=1B$BF|= =1B(J(=1B$B6b=1B(J)
   10:00=1B$B!A=1B(J17:00
 
 =1B$B"#3+:E>l=3Dj=1B(J =1B$BF|K\2J3XL$Mh4[=1B(J7=1B$B3,=1B= (J
 
   = 2003=1B$BG/=1B(J2=1B$B7n=1B(J20=1B$BF|=1B(J(=1B$BLZ=1B(J):=1B$B%o!<%/%7%= g%C%W!&!&!&$_$i$$=1B(JCAN=1B$B%[!<%k=1B(J
  =20 2003=1B$BG/=1B(J2=1B$B7n=1B(J21=1B$BF|=1B(J(=1B$B6b=1B(J):=1B$B%7%s%]%8%= &%`!&!&!&!&$_$i$$=1B(JCAN=1B$B%[!<%k=1B(J
  =20 =1B$BJ;@_4k6HE8<(!'%$%N%Y!<%7%g%s%[!<%k=1B(J
   = =1B$B$J$*!"=1B(J2=1B$B7n=1B(J20=1B$BF|=1B(J(=1B$BLZ=1B(J)=1B$B$N%o!<%/%7= %g%C%W$N;22CBP>]$O2q0w$N$_$H$J$j$^$9!#=1B(J
 
 =1B$B"#;22CHq=1B(J =1B$BL5NA=1B(J
 
 =1B$B"#?=3D9~$_J}K!=1B(J http://www.pccluster.org/=1B$B!!$= h$j$*?=3D9~$_2<$5$$!#=1B(J
 
 =1B$B"#Dj0w=1B(J  300=1B$BL>=1B(J
 
 =1B$B"#
 
   TEL:03-3263-6474,=20 FAX:03-3263-7537
   e-mail:sec @ pccluster.org
 =   U=20 R L :http://www.pccluster.org/
 
 =1B$B!a!a!a!a!a!a!a!a!a!a!a!a!a!a!a!a!a!a!a!a!a!a!a!a!a!a!a!a= !a!a!a!a!a=1B(J
------_=_NextPart_001_01C2B861.FC78D130-- From hori @ swimmy-soft.com Fri Jan 10 17:30:39 2003 From: hori @ swimmy-soft.com (Atsushi HORI) Date: Fri, 10 Jan 2003 17:30:39 +0900 Subject: [SCore-users-jp] Point-to-pointテスト失敗 In-Reply-To: <20030110122054.411F.SUGAWARA@mlab.jks.ynu.ac.jp> References: <20030109225813.410F.SUGAWARA@mlab.jks.ynu.ac.jp> Message-ID: <3125064639.hori0001@swimmy-soft.com> 堀@スイミー・ソフトウェアです. >しかし、実際に/etc/rc.d/init.d/pm_ethernetを見てみたのですが、 >どこをどう書き換えていいものか悩んでしまいました。 >すいませんが具体的に指摘していただけると助かります。 > >お手数だとは思いますがよろしくお願いいたします。 > >Atsushi HORI さんは書きました。 > >> 堀@スイミー・ソフトウェアです. >> >> >計算ホストの方でeth0とeth1と入れ替え、 >> >サーバで/opt/score/etc/pm-ethernet.confを >> >100Mの内容(MACアドレス)からギガビットのものへ書き換えました。 現在 eth1 を PM/Ethernet でお使いでしょうか?もし eth0 をお使いでした ら変更しないで大丈夫です. ---- 堀 敦史(ほり あつし) スイミー・ソフトウェア株式会社 From M.Newiger @ deltacomputer.de Fri Jan 10 17:32:14 2003 From: M.Newiger @ deltacomputer.de (Martin Newiger) Date: Fri, 10 Jan 2003 09:32:14 +0100 Subject: [SCore-users-jp] [SCore-users] msgb -group pcc & Command fails Message-ID: Hi, when I use this command I get the following error-message: can't open server SERVERNAME: 8764, couldn't open socket: connection refused When I use this command: scout -g pcc I get this error message: SCOUT: Failed to lock MessageBoard What causes does this problem have? Regards M.Newiger _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From sugawara @ mlab.jks.ynu.ac.jp Fri Jan 10 17:34:38 2003 From: sugawara @ mlab.jks.ynu.ac.jp (Taira Sugawara) Date: Fri, 10 Jan 2003 17:34:38 +0900 Subject: [SCore-users-jp] Point-to-pointテスト失敗 In-Reply-To: <3125064639.hori0001@swimmy-soft.com> References: <20030110122054.411F.SUGAWARA@mlab.jks.ynu.ac.jp> <3125064639.hori0001@swimmy-soft.com> Message-ID: <20030110173318.01D4.SUGAWARA@mlab.jks.ynu.ac.jp> 横浜国立大学の菅原です。 返信ありがとうございます。 サーバはインストールの段階でギガビットをeth0にしていました。 ので、問題なさそうですね。 ありがとうございました。 Atsushi HORI さんは書きました。 > 堀@スイミー・ソフトウェアです. > > >しかし、実際に/etc/rc.d/init.d/pm_ethernetを見てみたのですが、 > >どこをどう書き換えていいものか悩んでしまいました。 > >すいませんが具体的に指摘していただけると助かります。 > > > >お手数だとは思いますがよろしくお願いいたします。 > > > >Atsushi HORI さんは書きました。 > > > >> 堀@スイミー・ソフトウェアです. > >> > >> >計算ホストの方でeth0とeth1と入れ替え、 > >> >サーバで/opt/score/etc/pm-ethernet.confを > >> >100Mの内容(MACアドレス)からギガビットのものへ書き換えました。 > > 現在 eth1 を PM/Ethernet でお使いでしょうか?もし eth0 をお使いでした > ら変更しないで大丈夫です. > > ---- > 堀 敦史(ほり あつし) > スイミー・ソフトウェア株式会社 > 菅原 平 横浜国立大学大学院 環境情報学府 情報メディア環境学専攻 情報メディア学コース 松本研究室 sugawara @ mlab.jks.ynu.ac.jp From kameyama @ pccluster.org Fri Jan 10 17:44:54 2003 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Fri, 10 Jan 2003 17:44:54 +0900 Subject: [SCore-users-jp] Re: [SCore-users] msgb -group pcc & Command fails In-Reply-To: Your message of "Fri, 10 Jan 2003 09:32:14 JST." Message-ID: <20030110084454.8C2BA20041@neal.il.is.s.u-tokyo.ac.jp> In article Martin Newiger wrotes: > when I use this command I get the following error-message: > can't open server SERVERNAME: 8764, couldn't open socket: connection > refused Probably, msgbserv dose not run on SERVERNAME. Please exec following command to check to run msgbserv on SERVERNAME: % ps axwww | grep msgbserv If msgbserv is not running, please execute: # /etc/rc.d/init.d/msgbserv start And try ps again. If msgbserv dose not run, please check scorehosts.db. from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From sugawara @ mlab.jks.ynu.ac.jp Fri Jan 10 20:38:31 2003 From: sugawara @ mlab.jks.ynu.ac.jp (Taira Sugawara) Date: Fri, 10 Jan 2003 20:38:31 +0900 Subject: [SCore-users-jp] Point-to-pointテスト失敗 In-Reply-To: <20030110090010.CABDE20041@neal.il.is.s.u-tokyo.ac.jp> References: <20030110175228.25E7.SUGAWARA@mlab.jks.ynu.ac.jp> <20030110090010.CABDE20041@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <20030110203744.9EA1.SUGAWARA@mlab.jks.ynu.ac.jp> 横浜国立大学の菅原です。 Point-to-pointテスト失敗の件ですが、 かなり恥ずかしい間違いでした。 ないだろうと思ってもう一度チェックしたんですが、 思いっきりつづり間違いでした…。 Point-to-pointテストは問題なく動きました。 お手数おかけしました。 しかし、総合テストをした際に、 networkをethernetで行ったら転送メッセージ数が 100Kまでは表示されるときもあれば、 まったくだめなときもあります。 以前SCoreを実装した際にはずっと表示されていった記憶があります。 また、gigaethernetで行った際にも同様な状況です。 cluster-network-checkを行ったら以下のようになりました。 16 hosts has 2 cpu all hosts has ethernet gigaethernet scored use ethernet ということは、デフォルトでethernetを使うようになっていますよね? これをgigaethernetに変更したいのですが、 どこの設定を変えたらよいでしょうか? 昨年8月あたりのメーリングリストでこのような記述がありました。 --------------------- scoutが起動して、scstestが起動できていれば問題ないと思います。 rcstestの結果はどうでしょうか? --------------------- scstestが起動できているので問題ないということでしょうか。 rcstestを実行してみたところ、 ある程度行ったところでburstしますが、 *と.はほぼきれいに交互に並んでいます。 また、helloプログラムが問題なく動きました。 以上、デフォルトをetherからgigaetherへの変更方法、 また、総合テストが途中でburstするのが問題である場合、 考えられる原因などをお願いします。 何度もお手数をおかけしますがよろしくお願いします。 kameyama @ pccluster.org さんは書きました。 > # すみません. dile は file の typo です. > ethernet および gigaethernet の config file > (多分, /opt/score/etc/pm_ethernet.conf だと思いますが...) の中に > comp01.pccluster.org が無いようです. > hostname のつづり間違いがないかどうかチェックしてみてください. > > from Kameyama Toyohisa 菅原 平 taira @ air.ne.jp From kameyama @ pccluster.org Fri Jan 10 20:55:49 2003 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Fri, 10 Jan 2003 20:55:49 +0900 Subject: [SCore-users-jp] Point-to-pointテスト失敗 In-Reply-To: Your message of "Fri, 10 Jan 2003 20:38:31 JST." <20030110203744.9EA1.SUGAWARA@mlab.jks.ynu.ac.jp> Message-ID: <20030110115549.DD97F2003E@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <20030110203744.9EA1.SUGAWARA @ mlab.jks.ynu.ac.jp> Taira Sugawara wrotes: > また、gigaethernetで行った際にも同様な状況です。 > > cluster-network-checkを行ったら以下のようになりました。 > > 16 hosts has 2 cpu > all hosts has ethernet gigaethernet > scored use ethernet > > ということは、デフォルトでethernetを使うようになっていますよね? そのようです. > これをgigaethernetに変更したいのですが、 > どこの設定を変えたらよいでしょうか? scorehosts.db の各 host の network 指定の最初にみつかったものを default として使用します. 多分, network=ethernet,gigaethernet になっていると思いますが, これを network=gigaethernet,ethernet にしてください. ところで, gigaethernet および ethernet は別の ethernet device を 使用するようになっているでしょうか? /etc/rc.d/init.d/pm_ethernet を触らなかったということは, どちらかしか 有効になっていないような気がするのですが... PM/ethernet で複数の NIC を使用するときは, それぞれの NIC に対して etherpmctl を行う必要があります. etherpmctl は NIC と PM/ethernet の unit 番号 (pm_ethernet.vonf の unit で指定される番号) を結びつけます. たとえば, gigaethernet を unit 番号 0, ethernet を unit 番号 1 を 使用するとすると, ethernet の unit 番号を 1 に変更し, /etc/rc.d/init.d/pm_ethernet で gigaethernet で使用する NIC に対しては -unit 0 を ethernet で使用する NIC に対しては -unit 1 を つけて起動するように書き換える必要があります. from Kameyama Toyohisa From nakata @ bestsystems.co.jp Fri Jan 10 21:06:59 2003 From: nakata @ bestsystems.co.jp (Hisaho Nakata) Date: Fri, 10 Jan 2003 21:06:59 +0900 Subject: [SCore-users-jp] Point-to-pointテスト失敗 In-Reply-To: <20030110203744.9EA1.SUGAWARA@mlab.jks.ynu.ac.jp> References: <20030110175228.25E7.SUGAWARA@mlab.jks.ynu.ac.jp> <20030110090010.CABDE20041@neal.il.is.s.u-tokyo.ac.jp> <20030110203744.9EA1.SUGAWARA@mlab.jks.ynu.ac.jp> Message-ID: <20030110210659.04d1e82e.nakata@bestsystems.co.jp> 中田@ベストシステムズです、。 > scstestが起動できているので問題ないということでしょうか。 > rcstestを実行してみたところ、 > ある程度行ったところでburstしますが、 > *と.はほぼきれいに交互に並んでいます。 > > また、helloプログラムが問題なく動きました。 > > 以上、デフォルトをetherからgigaetherへの変更方法、 > また、総合テストが途中でburstするのが問題である場合、 > 考えられる原因などをお願いします。 PM/Ethernetのチューニングを行う必要があります。 /opt/score/etc/pm-ethernet.conf, or pm-gigaethernet.confファイル内の maxnsend backoff の値を変更してみてください。 「Linuxで並列処理しよう」本の第10章(P106)に詳しくのっています。 ======================================================================== 株式会社 ベストシステムズ システムソリューション事業部テクニカルサポート 中田 寿穗 (nakata @ bestsystems.co.jp) 〒110-0016 東京都台東区台東2-18-8 台東K-1ビル 2,3F Tel: 03-5812-1350 Fax: 03-5812-1351 ======================================================================== From M.Newiger @ deltacomputer.de Fri Jan 10 23:32:02 2003 From: M.Newiger @ deltacomputer.de (Martin Newiger) Date: Fri, 10 Jan 2003 15:32:02 +0100 Subject: [SCore-users-jp] [SCore-users] Retrying to connect to scoreboardserver Message-ID: Hi, okay I'm a score newbie... When I typed in the command scout -g pcc I get the following message: SCBD: Retrying to connect to scoreboardserver (SERVERNAME: 9950). A few hours ago all worked fine.... Greets M.Newiger _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From hori @ swimmy-soft.com Sun Jan 12 12:42:05 2003 From: hori @ swimmy-soft.com (Atsushi HORI) Date: Sun, 12 Jan 2003 12:42:05 +0900 Subject: [SCore-users-jp] Re: [SCore-users] Retrying to connect to scoreboardserver Message-ID: <3125220125.hori0000@swimmy-soft.com> Hi. >okay I'm a score newbie... When I typed in the command scout -g pcc I >get the following message: >SCBD: Retrying to connect to scoreboardserver (SERVERNAME: 9950). > >A few hours ago all worked fine.... Well, check the followings - check the SCBDSERV environment variable. if it is null, check /etc/profile.d/score.[c]sh file. If the profile files are missing, then you have to set the environment variable to the hostname as SERVERNAME. - on the server host, check scoreboard process running if not, do "/etc/rc/d/init.d/scoreboard start" to start the scoreboard server. ---- Atsushi HORI SCore Developer Swimmy Software, Inc. _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From klaas @ ccrl-nece.de Mon Jan 13 19:30:15 2003 From: klaas @ ccrl-nece.de (Jens Klaas) Date: Mon, 13 Jan 2003 11:30:15 +0100 Subject: [SCore-users-jp] [SCore-users] Score malloc In-Reply-To: <20030110084454.8C2BA20041@neal.il.is.s.u-tokyo.ac.jp> References: <20030110084454.8C2BA20041@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <200301131130.16182.klaas@ccrl-nece.de> Der all, I installed a PC cluster, 32 nodes, dual AMD procs, 1GB of memory per box. Some of our user like to use as much memory as possible. They realized a strange behavior of the score malloc routine. I took a deeper look at the problem and made some tests. a) Allocating memory and giving it free without using it. I got a maximum 1090 MB for each of the 64 per processes b) Allocating memory, filling it with 'X' and giving it free. For SCORE malloc, I got 1 CPU 770 MB - 850 MB 32x1 CPU 440 MB <- expected 770-850 MB 32x2 CPUs 240 MB <- expected 385-425 MB c) allocating memory as many small parts (100 X 10 MB), didn't give it free. Fore Score malloc, I got 1 CPU 850 MB 32x1 CPU 820 MB 32x2 CPUs 420 MB There seems to be a problem to allocate big blocks of memory. Is it a bug? Does any of you already got problems with it? cu Jens _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From ashfaq @ cs.uic.edu Tue Jan 14 03:20:52 2003 From: ashfaq @ cs.uic.edu (Ashfaq Khokhar) Date: Mon, 13 Jan 2003 12:20:52 -0600 Subject: [SCore-users-jp] [SCore-users] PC cluster... Message-ID: <3E230384.3C94E01E@cs.uic.edu> Hello, I am planning to buy a collection of PC's on a rack. Any recommendations on vendors. Our usage is more for research purposes and we will be connecting this PC cluster to a 3TB storage unit. Best Ashfaq Khokhar _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From nrcb @ streamline-computing.com Tue Jan 14 08:03:11 2003 From: nrcb @ streamline-computing.com (Nick Birkett) Date: Mon, 13 Jan 2003 23:03:11 +0000 Subject: [SCore-users-jp] [SCore-users] Opteron support Message-ID: <200301132303.h0DN3Bc01881@zeralda.streamline.com> Are there any current plans to support SCore on the 64 bit AMD Opteron platform ? Hopefully this should be straightforward, though I am not sure about PM drivers in 64 bit. I know SCore has support for heterogeneos clusters, so a really nice feature would be a 64 bit Opteron front end and 32 bit compute nodes, or a full 64 bit cluster as you choose. The Opteron will be out in the next few months. Regards, Nick _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From 劉学振\ Tue Jan 14 13:22:19 2003 From: 劉学振\ (LIU XUEZHEN) ) Date: Tue, 14 Jan 2003 13:22:19 +0900 Subject: [SCore-users-jp] Myrinetの変更 References: <20030110122054.411F.SUGAWARA@mlab.jks.ynu.ac.jp> <3125064639.hori0001@swimmy-soft.com> <20030110173318.01D4.SUGAWARA@mlab.jks.ynu.ac.jp> Message-ID: <013f01c2bb84$86f0f250$6c03c9a0@IWS0098> 亀山様 劉@三菱プレシジョン(株)です. Myrinetの設定について質問をさせていただきます. SCoreクラスタでMyrinetを Myrinet(カード:M2M-PCI64/2,スイッチ:M2M-OCT-SW8) から Myrinet2000(カード:M3F-PCI64B-2,スイッチ:M3-E32) に変えて, SCoreを再インストールしなくてもシステムの設定を変えることができますでしょうか. (ServerとCompHost両方) できるなら,やり方を教えていただけませんか. 宜しくお願い致します. 以上 From kameyama @ pccluster.org Tue Jan 14 13:42:20 2003 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Tue, 14 Jan 2003 13:42:20 +0900 Subject: [SCore-users-jp] Re: Myrinetの変更 In-Reply-To: Your message of "Tue, 14 Jan 2003 13:22:19 JST." <013f01c2bb84$86f0f250$6c03c9a0@IWS0098> Message-ID: <20030114044220.D1B4A2003E@neal.il.is.s.u-tokyo.ac.jp> 亀山です. )SCore-users-jp あてで指名されても...) In article <013f01c2bb84$86f0f250$6c03c9a0 @ IWS0098> 劉学振\(LIU XUEZHEN\) wrotes: > SCoreクラスタでMyrinetを > Myrinet(カード:M2M-PCI64/2,スイッチ:M2M-OCT-SW8) > から > Myrinet2000(カード:M3F-PCI64B-2,スイッチ:M3-E32) > に変えて, > SCoreを再インストールしなくてもシステムの設定を変えることができますでしょうか. > (ServerとCompHost両方) > できるなら,やり方を教えていただけませんか. 可能です. 変更するのは, server の scorehosts.db と pm-myrinet.conf になります. compute host は同じドライバが使用できますので, 変更する必要はありません. scorehosts.ldb は該当する network の type を myrinet2k に, firmware:file を /opt/score/share/lanai/lanaiM2k.mcp に変更します. EIT で作成したファイルでしたら, network を myrinet から myrinet2k に しても良いです. 変更ミスがおきなくて, あとで混乱しないほうを実行してください. 問題は pm-myrinet.conf ですが, これは全面的に入れ換える必要があります. /opt/score/lib/tcl/myrinet2k/32 をコピーして, %s の部分を hostname に変更し, 余分な host 部分を削除するのが 一番楽だと思います. なお, 変更した後で scoreboard は restart してください. from Kameyama Toyohisa From emile.carcamo @ nec.fr Tue Jan 14 17:29:15 2003 From: emile.carcamo @ nec.fr (Emile CARCAMO) Date: Tue, 14 Jan 2003 09:29:15 +0100 Subject: [SCore-users-jp] [SCore-users] Hardware performance monitoring on SCore Message-ID: <200301140829.h0E8TFNx005375@emilepc.ess.nec.fr> Dear list members, I was wondering if someone out there was already able to patch a 2.4.18-3SCORE kernel to add the perfctr feature, and consequently implement the lperfex utility. See the WEB page http://www.osc.edu/~troy/lperfex for more infos. The perfctr kernel patch needed as a prerequisite may be found at URL http://www.csd.uu.se/~mikpe/linux/perfctr. Thanks in advance for your suppport, and best regards. -- Emile_CARCAMO NEC European http://www.ess.nec.de System Engineer Supercomputer mailto:emile.carcamo @ nec.fr Systems France GSM mailto:emile.carcamo @ orange.fr (+33)1-3930-6601 FAX (+33)1-3930-6613 PHONE / Your mouse has moved. Windows NT must be restarted \ (+33)6-8063-7003 GSM \ for the change to take effect. Reboot now? [ OK ] / _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From M.Newiger @ deltacomputer.de Tue Jan 14 18:55:45 2003 From: M.Newiger @ deltacomputer.de (Martin Newiger) Date: Tue, 14 Jan 2003 10:55:45 +0100 Subject: [SCore-users-jp] [SCore-users] PGI-Compiler on SCore-CD? Message-ID: Hi all, is there a pgi-compiler on the SCore-CD? Regards M.Newiger _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Tue Jan 14 19:09:51 2003 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Tue, 14 Jan 2003 19:09:51 +0900 Subject: [SCore-users-jp] Re: [SCore-users] PGI-Compiler on SCore-CD? In-Reply-To: Your message of "Tue, 14 Jan 2003 10:55:45 JST." Message-ID: <20030114100952.0ADE62003E@neal.il.is.s.u-tokyo.ac.jp> In article Martin Newiger wrotes: > is there a pgi-compiler on the SCore-CD? PGI compiler itself is not in SCore CD-ROM. Because PGI compiler is commercial product. SCore 5.2.0 includes MPI and Omni OpenMP libraries for PGI compiler. from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From nrcb @ streamline-computing.com Wed Jan 15 06:34:20 2003 From: nrcb @ streamline-computing.com (Nick Birkett) Date: Tue, 14 Jan 2003 21:34:20 +0000 Subject: [SCore-users-jp] Re: [SCore-users] PGI-Compiler on SCore-CD? In-Reply-To: References: Message-ID: <200301142134.h0ELYKB01825@zeralda.streamline.com> On Tuesday 14 January 2003 09:55 am, Martin Newiger wrote: > Hi all, > > is there a pgi-compiler on the SCore-CD? > You can get a 15 day demo license from ftp.pgroup.com Just download the software. If you like it then you can purchase a full license. Anything you compiled with a demo license will have to be recompiled using the fully licensed product. Nick --------------------------------- Dr Nick Birkett Technical Director Streamline Computing Ltd The Innovation Centre Warwick Technology Park Gallows Hill Warwick CV34 6UW Tel : +44 (0)1926 623130 Fax : +44 (0)1926 623140 Mobile: +44 (0)7890 246662 Email : nrcb @ streamline-computing.com Web : http://www.streamline-computing.com _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From nakira @ cogni.cs.kumamoto-u.ac.jp Thu Jan 16 10:31:20 2003 From: nakira @ cogni.cs.kumamoto-u.ac.jp (akira nakagawa) Date: Thu, 16 Jan 2003 10:31:20 +0900 Subject: [SCore-users-jp] NICの問題?,full-duplexで動作しない,scstestで失敗する Message-ID: <20030116103120.5a2f3a94.nakira@cogni.cs.kumamoto-u.ac.jp> 中川@熊本大学 と申します。 初めてこのMLに投稿します。 今回の質問はNICに関するものです。 問題は /opt/score/deploy/scstest が失敗するというものです。 ここから,問題を特定するまでの過程です。 最後の方に質問させていただきたいことが書いてあります。 先ず,マシンの構成ですが, /opt/score/etc/scorehosts.db に以下の様な記述があります。 parallel-a021.cogni.kumamoto-u.ac.jp SEG20 parallel-a022.cogni.kumamoto-u.ac.jp SEG20 parallel-a023.cogni.kumamoto-u.ac.jp SEG20 parallel-a038.cogni.kumamoto-u.ac.jp SEG30 SEG20のマシンにはプラネックスコミュニケーションズ社の GN-1000TEという Gigabit イーサネットアダプタを搭載しています。 SEG30には同社のFNW-9803-Tという100Base-TX対応のNICを用いて います。 (ドライバはtulipで,カーネル2.4.18-2SCORE付属のもの) SEG20のマシンは NETGEARのGS508TというGigabitのスイッチングハブに接続, SEG30のマシンは BayStackの350T-HDという100Baseのスイッチングハブに接続し, 互いのハブをカスケード接続しています。 SEG20のマシンは問題なく動作しており,scstestもきちんと動作します。 問題があるのは新たに導入中のSEG30のマシンのNICです。 scout -g seg20+seg30 とし,scstestを行うと,以下の様な症状が出ます。 ()内は私のコメントです。 [root @ parallel-a021 deploy]# ./scstest -network ethernet SCSTEST: BURST on ethernet(chan=0,ctx=0,len=16) 50 K packets. 100 K packets.(いつも100 K で止まるわけではない。不定) parallel-a021( 0) burst: pmGetSendBuffer: Connection timed out(110) parallel-a022( 1) burst: pmGetSendBuffer: Connection timed out(110) parallel-a023( 2) burst: pmGetSendBuffer: Connection timed out(110) (4,5秒位してから) parallel-a038( 3) burst: pmGetSendBuffer: Connection timed out(110) なにが問題を引き起こしているのか切り分けるために以下の様な テストをしてみました。 ドライバの設定は /etc/modules.conf で以下の様にしました。 alias eth0 tulip #options tulip options=3 ## 100Base-TX (half) #options tulip options=5 ## 100Base-TX (full) (optionsを全てコメントでauto-negothiation) HUBの設定と,NICの設定を組み合わせてうまくいく組み合わせを探しました。 a038は問題のNICを搭載したマシンです。 BayStack(HUB)の AutoNegothiationをONにし,a038の設定を変化させる。 auto-negothiation -> 駄目 100Base-TX half -> 駄目 100Base-TX full -> 駄目 HUBの AutoNegothiationをOFFにし,HUBの設定とNICの設定を同じにする 100Base-TX full -> 駄目 100Base-TX half -> 成功 また,HUBに問題がある可能性があるので,HUBを変えて同様のテストを 行いました。 HUBはNETGEARのGS508Tを用いました。これはポートの設定を変えられないようなので, NICの設定のみを変化させました。 結果,全ての組み合わせで失敗しました。 結局ここまで調べた結果,どうやらNICに問題があるだろうという結論に達し ました。(ドライバのtulipは多分無実?) で,特に気になることですが,NICの動作をhalf,full,どちらにしても diagツールが以下の様なメッセージを吐くことと, (diffとって違いが無いことを確認しました。) [root @ parallel-a038 root]# ./tulip-diag tulip-diag.c:v2.06 1/8/2001 Donald Becker (becker @ scyld.com) http://www.scyld.com/diag/index.html Index #1: Found a ADMtek AL985 Centaur-P adapter at 0xe000. Comet duplex is reported in the MII status registers. Transmit started, Receive started, half-duplex. ←full-duplexにならない The Rx process state is 'Waiting for packets'. The Tx process state is 'Idle'. The transmit unit is set to store-and-forward. Comet MAC address registers 51cc9000 ffff112d Comet multicast filter 0000000040000000. Use '-a' or '-aa' to show device registers, '-e' to show EEPROM contents, -ee for parsed contents, or '-m' or '-mm' to show MII management registers. ( diagツールは http://www.scyld.com/network/tulip.html から Ver 0.9.14 用のものを持ってきました。 ) NICをhalf-duplexに設定してもHUBがfull-duplexで接続されていると 誤認識していることです。 BayStackでポートを100Base full-duplex固定 , NIC を 100Base full-duplex固定 に指定したとき,dmesgには以下のように強制的に full-duplexにすると 表示されるのですが, ( tulip0: Transceiver selection forced to 100baseTx-FDX. ) diagツールではやはり,half-duplexといわれます。 結局,原因はlinux上でNICがhalf-duplexで動作している様なのに HUB側から見るとfull-duplexに見えてしまうというところだろうと 思います。 出来ればfull-duplexできちんと動作させたいので, どの様にすればきちんとfull-duplexで動作させることが 出来るのかをどうぞご教授お願いします。 それでは,よろしくお願いします。 -- ========================================================= 熊本大学 大学院 自然科学研究科 数理科学情報システム専攻 1年 情報認知研究室所属 中川 彰 メールアドレス 大学 : nakira @ cogni.cs.kumamoto-u.ac.jp ======================================================== From kameyama @ pccluster.org Thu Jan 16 12:35:47 2003 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Thu, 16 Jan 2003 12:35:47 +0900 Subject: [SCore-users-jp] NICの問題? ,full-duplexで動作しない,scstest で失敗する In-Reply-To: Your message of "Thu, 16 Jan 2003 10:31:20 JST." <20030116103120.5a2f3a94.nakira@cogni.cs.kumamoto-u.ac.jp> Message-ID: <20030116033547.5BC0C20041@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <20030116103120.5a2f3a94.nakira @ cogni.cs.kumamoto-u.ac.jp> akira nakagawa wrotes: > 先ず,マシンの構成ですが, > /opt/score/etc/scorehosts.db に以下の様な記述があります。 > > parallel-a021.cogni.kumamoto-u.ac.jp SEG20 > parallel-a022.cogni.kumamoto-u.ac.jp SEG20 > parallel-a023.cogni.kumamoto-u.ac.jp SEG20 > parallel-a038.cogni.kumamoto-u.ac.jp SEG30 > > SEG20のマシンにはプラネックスコミュニケーションズ社の > GN-1000TEという Gigabit イーサネットアダプタを搭載しています。 > > SEG30には同社のFNW-9803-Tという100Base-TX対応のNICを用いて > います。 > (ドライバはtulipで,カーネル2.4.18-2SCORE付属のもの) つまり 3 台が gigabit ethernet で 1 台だけ 100 Base-T ということですね. こういう環境で試したことは無いので, 動かない可能性は十分にありますが... 特に scstest というのはデータを連続的におくって反応を調べるものなので, かなり危なそうです. 少なくても maxnsend, backoff などのパラメータを調整する必要がありそうです. > NICをhalf-duplexに設定してもHUBがfull-duplexで接続されていると > 誤認識していることです。 > > BayStackでポートを100Base full-duplex固定 , NIC を 100Base full-duplex固定 > に指定したとき,dmesgには以下のように強制的に full-duplexにすると > 表示されるのですが, > ( tulip0: Transceiver selection forced to 100baseTx-FDX. ) > diagツールではやはり,half-duplexといわれます。 switch の表示より, driver の出力よりも diag tool の出力を信用する根拠が よく分からないのですが... from Kameyama Toyohisa From Yamamoto.Takaya @ wrc.melco.co.jp Thu Jan 16 12:55:09 2003 From: Yamamoto.Takaya @ wrc.melco.co.jp (Takaya Yamamoto) Date: Thu, 16 Jan 2003 12:55:09 +0900 Subject: [SCore-users-jp] CPUのアップグレード Message-ID: <5.0.2.5.2.20030116124442.00c62658@133.141.16.40> 三菱電機 山本です。 以前SCore5.0.0で4CPUクラスタを作ったのですが、 これのCPUをアップグレードしようと考えています。 現在は、4PC全て同じH/Wを使って、  PC0:サーバー兼計算ホスト  PC1,2,3:計算ホスト のように構成しています。CPUは、PentiumIV 2GHzです。 今回、PC1,2,3のみPentiumIVのもう少し速いものと交換したいのですが、 どこか設定ファイルを変更する必要があるでしょうか。 よろしくお願いします。 以上 From kameyama @ pccluster.org Thu Jan 16 13:13:51 2003 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Thu, 16 Jan 2003 13:13:51 +0900 Subject: [SCore-users-jp] CPUのアップグレード In-Reply-To: Your message of "Thu, 16 Jan 2003 12:55:09 JST." <5.0.2.5.2.20030116124442.00c62658@133.141.16.40> Message-ID: <20030116041351.8886D20040@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <5.0.2.5.2.20030116124442.00c62658 @ 133.141.16.40> Takaya Yamamoto wrotes: > 現在は、4PC全て同じH/Wを使って、 >  PC0:サーバー兼計算ホスト >  PC1,2,3:計算ホスト > のように構成しています。CPUは、PentiumIV 2GHzです。 > > 今回、PC1,2,3のみPentiumIVのもう少し速いものと交換したいのですが、 > どこか設定ファイルを変更する必要があるでしょうか。 基本的にはありません. /opt/score/etc/scorehosts.db の各 host の speed を変更しておくと, scrun のときに新しい値で speed 指定が可能 scored multi user 起動時の message の speed が変わる ということはありますが... from Kameyama Toyohisa From s-sumi @ flab.fujitsu.co.jp Thu Jan 16 13:22:14 2003 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Thu, 16 Jan 2003 13:22:14 +0900 (JST) Subject: [SCore-users-jp] NICの問題? ,full-duplexで動作しない,scstest で失敗する In-Reply-To: <20030116103120.5a2f3a94.nakira@cogni.cs.kumamoto-u.ac.jp> References: <20030116103120.5a2f3a94.nakira@cogni.cs.kumamoto-u.ac.jp> Message-ID: <20030116.132214.115907051.s-sumi@flab.fujitsu.co.jp> 富士通研の住元です。 From: akira nakagawa Subject: [SCore-users-jp] NICの問題? ,full-duplexで動作しない,scstest で失敗する Date: Thu, 16 Jan 2003 10:31:20 +0900 Message-ID: <20030116103120.5a2f3a94.nakira @ cogni.cs.kumamoto-u.ac.jp> nakira> SEG30には同社のFNW-9803-Tという100Base-TX対応のNICを用いて nakira> います。 nakira> (ドライバはtulipで,カーネル2.4.18-2SCORE付属のもの) Tulip互換のチップは全てtulipドライバで動作を保証されているわけではあり ません。とくに、Tulipのチップを使ったとしても物理層のチップにバリエー ションがあるので、auto nego周りのトラブルは耐えません。 ベンダの稼働情報、NIC付属のデバイスドライバを調べた上でどのデバイスド ライバを使うべきかを決めるべきです。 PS: de4x5というドライバもあるので試して見るのはどうでしょう? ------ Shinji Sumimoto, Fujitsu Labs From Yamamoto.Takaya @ wrc.melco.co.jp Thu Jan 16 13:22:57 2003 From: Yamamoto.Takaya @ wrc.melco.co.jp (Takaya Yamamoto) Date: Thu, 16 Jan 2003 13:22:57 +0900 Subject: [SCore-users-jp] CPU のアップグレード In-Reply-To: <20030116041351.8886D20040@neal.il.is.s.u-tokyo.ac.jp> References: <"Your message of Thu, 16 Jan 2003 12:55:09 JST."<5.0.2.5.2.20030116124442.00c62658@133.141.16.40> Message-ID: <5.0.2.5.2.20030116132225.00c1eb10@133.141.16.40> 亀山様 どうもありがとうございました。 以上 At 13:13 03/01/16 +0900, kameyama @ pccluster.org wrote: >亀山です. > >In article <5.0.2.5.2.20030116124442.00c62658 @ 133.141.16.40> Takaya >Yamamoto wrotes: > > 現在は、4PC全て同じH/Wを使って、 > >  PC0:サーバー兼計算ホスト > >  PC1,2,3:計算ホスト > > のように構成しています。CPUは、PentiumIV 2GHzです。 > > > > 今回、PC1,2,3のみPentiumIVのもう少し速いものと交換したいのですが、 > > どこか設定ファイルを変更する必要があるでしょうか。 > >基本的にはありません. > /opt/score/etc/scorehosts.db >の各 host の speed を変更しておくと, > scrun のときに新しい値で speed 指定が可能 > scored multi user 起動時の message の speed が変わる >ということはありますが... > > from Kameyama Toyohisa From nakira @ cogni.cs.kumamoto-u.ac.jp Thu Jan 16 13:34:19 2003 From: nakira @ cogni.cs.kumamoto-u.ac.jp (akira nakagawa) Date: Thu, 16 Jan 2003 13:34:19 +0900 Subject: [SCore-users-jp] NICの問題? ,full-duplexで動作しない,scstest で失敗する In-Reply-To: <20030116033547.5BC0C20041@neal.il.is.s.u-tokyo.ac.jp> References: <20030116103120.5a2f3a94.nakira@cogni.cs.kumamoto-u.ac.jp> <20030116033547.5BC0C20041@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <20030116133419.6b7ad938.nakira@cogni.cs.kumamoto-u.ac.jp> 中川@熊本大学です。 早速のご返答ありがとうございました。 > 亀山です. > > > つまり 3 台が gigabit ethernet で 1 台だけ 100 Base-T ということですね. > こういう環境で試したことは無いので, 動かない可能性は十分にありますが... 現段階において自分で作成したアプリケーションは (とりあえず) 問題なく動作しています。 これはnode#0からslave nodeにデータ(400Byte程)をMPI_Bcast()で送信し, slave node で計算したデータ(同じく400Byte程)をマスターに MPI_Isend() , MPI_Irecv() を 使って集めるという動作を延々と続けるプログラムです。 ただ,scstestがfull-duplexでは失敗するので非常に不安です。 > 特に scstest というのはデータを連続的におくって反応を調べるものなので, > かなり危なそうです. > 少なくても maxnsend, backoff などのパラメータを調整する必要がありそうです. 参考になります。確かに,1000Base と 100Base の混在がいけないのかもしれませんね。 これに関しては maxnsend , backoff を何パターンか調整して試してみたいと思います。 > switch の表示より, driver の出力よりも diag tool の出力を信用する根拠が > よく分からないのですが.. ここら辺に関して自分も自信がないのでもう少し調べてみたいと思います。 それでは,ありがとうございました。 -- ========================================================= 熊本大学 大学院 自然科学研究科 数理科学情報システム専攻 1年 情報認知研究室所属 中川 彰 メールアドレス 大学 : nakira @ cogni.cs.kumamoto-u.ac.jp ======================================================== From nakira @ cogni.cs.kumamoto-u.ac.jp Thu Jan 16 13:44:35 2003 From: nakira @ cogni.cs.kumamoto-u.ac.jp (akira nakagawa) Date: Thu, 16 Jan 2003 13:44:35 +0900 Subject: [SCore-users-jp] NICの問題? ,full-duplexで動作しない,scstest で失敗する In-Reply-To: <20030116.132214.115907051.s-sumi@flab.fujitsu.co.jp> References: <20030116103120.5a2f3a94.nakira@cogni.cs.kumamoto-u.ac.jp> <20030116.132214.115907051.s-sumi@flab.fujitsu.co.jp> Message-ID: <20030116134435.63be40d3.nakira@cogni.cs.kumamoto-u.ac.jp> 中川@熊本大学 です。 > 富士通研の住元です。 > Tulip互換のチップは全てtulipドライバで動作を保証されているわけではあり > ません。とくに、Tulipのチップを使ったとしても物理層のチップにバリエー > ションがあるので、auto nego周りのトラブルは耐えません。 > > ベンダの稼働情報、NIC付属のデバイスドライバを調べた上でどのデバイスド > ライバを使うべきかを決めるべきです。 NICのベンダーは tulip を指定していました。 普通に使う分には全く問題は無いんですけどね・・・ > PS: de4x5というドライバもあるので試して見るのはどうでしょう? おぉ〜,凄く貴重な情報をどうもありがとうございます。 早速そのドライバを探して試してみたいと思います。 それでは,後ほど報告させていただきます。 -- ========================================================= 熊本大学 大学院 自然科学研究科 数理科学情報システム専攻 1年 情報認知研究室所属 中川 彰 メールアドレス 大学 : nakira @ cogni.cs.kumamoto-u.ac.jp ======================================================== From kameyama @ pccluster.org Thu Jan 16 13:51:11 2003 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Thu, 16 Jan 2003 13:51:11 +0900 Subject: [SCore-users-jp] NICの問題? ,full-duplexで動作しない,scstest で失敗する In-Reply-To: Your message of "Thu, 16 Jan 2003 13:44:35 JST." <20030116134435.63be40d3.nakira@cogni.cs.kumamoto-u.ac.jp> Message-ID: <20030116045111.BEE072003E@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <20030116134435.63be40d3.nakira @ cogni.cs.kumamoto-u.ac.jp> akira nakagawa wrotes: > > PS: de4x5というドライバもあるので試して見るのはどうでしょう? > > おぉ〜,凄く貴重な情報をどうもありがとうございます。 > 早速そのドライバを探して試してみたいと思います。 ちなみに, de4x5 も tulip と同様 linux の標準 kernel に入っています. SCore kernel にも compile 済みの module があります. modprobe すれば組み込めるはずです. from Kameyama Toyohisa From s-sumi @ flab.fujitsu.co.jp Thu Jan 16 15:18:54 2003 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Thu, 16 Jan 2003 15:18:54 +0900 (JST) Subject: [SCore-users-jp] NICの問題? ,full-duplexで動作しない,scstest で失敗する In-Reply-To: <20030116134435.63be40d3.nakira@cogni.cs.kumamoto-u.ac.jp> References: <20030116103120.5a2f3a94.nakira@cogni.cs.kumamoto-u.ac.jp> <20030116.132214.115907051.s-sumi@flab.fujitsu.co.jp> <20030116134435.63be40d3.nakira@cogni.cs.kumamoto-u.ac.jp> Message-ID: <20030116.151854.1025210974.s-sumi@flab.fujitsu.co.jp> 富士通研の住元です。 From: akira nakagawa Subject: Re: [SCore-users-jp] NICの問題? ,full-duplexで動作しない,scstest で失敗する Date: Thu, 16 Jan 2003 13:44:35 +0900 Message-ID: <20030116134435.63be40d3.nakira @ cogni.cs.kumamoto-u.ac.jp> nakira> 中川@熊本大学 です。 nakira> nakira> > 富士通研の住元です。 nakira> nakira> > Tulip互換のチップは全てtulipドライバで動作を保証されているわけではあり nakira> > ません。とくに、Tulipのチップを使ったとしても物理層のチップにバリエー nakira> > ションがあるので、auto nego周りのトラブルは耐えません。 nakira> > nakira> > ベンダの稼働情報、NIC付属のデバイスドライバを調べた上でどのデバイスド nakira> > ライバを使うべきかを決めるべきです。 nakira> nakira> NICのベンダーは tulip を指定していました。 nakira> 普通に使う分には全く問題は無いんですけどね・・・ Linux 2.4系でですか? NICのベンダーのコードがあるのでしたら、そのデバ イスドライバのバージョンを調べて、SCoreのLinux 2.4.18のコードと比べれ ば、何が違うかは分かります。いづれにしろ、単にmail, webくらいに使う分 には10BaseTでもそんなに困らないのではないかと思います。 tulipドライバは2.2系は安定して使えたのですが、2.4系付属の tulipドライ バ(名前は同じですが、作りは全く違います)は、 2.2系よりもハードウェアの 対応が良くないのが私の印象です。 もし、Donald Beckerのコード(www.scyld.com)で安定して動くようなら、それ に入れ換えたほうが良いかと思います。修正点がいくつかありますので、やる ときは事前に問い合わせてください。 nakira> > PS: de4x5というドライバもあるので試して見るのはどうでしょう? nakira> nakira> おぉ〜,凄く貴重な情報をどうもありがとうございます。 nakira> 早速そのドライバを探して試してみたいと思います。 nakira> nakira> それでは,後ほど報告させていただきます。 nakira> nakira> -- nakira> ========================================================= nakira> 熊本大学 大学院 自然科学研究科 数理科学情報システム専攻 1年 nakira> nakira> 情報認知研究室所属 nakira> nakira> 中川 彰 nakira> nakira> メールアドレス nakira> 大学 : nakira @ cogni.cs.kumamoto-u.ac.jp nakira> ======================================================== nakira> _______________________________________________ nakira> SCore-users-jp mailing list nakira> SCore-users-jp @ pccluster.org nakira> http://www.pccluster.org/mailman/listinfo/score-users-jp nakira> ------ Shinji Sumimoto, Fujitsu Labs From nakira @ cogni.cs.kumamoto-u.ac.jp Thu Jan 16 16:36:20 2003 From: nakira @ cogni.cs.kumamoto-u.ac.jp (akira nakagawa) Date: Thu, 16 Jan 2003 16:36:20 +0900 Subject: [SCore-users-jp] NICの問題? ,full-duplexで動作しない,scstest で失敗する In-Reply-To: <20030116.151854.1025210974.s-sumi@flab.fujitsu.co.jp> References: <20030116103120.5a2f3a94.nakira@cogni.cs.kumamoto-u.ac.jp> <20030116.132214.115907051.s-sumi@flab.fujitsu.co.jp> <20030116134435.63be40d3.nakira@cogni.cs.kumamoto-u.ac.jp> <20030116.151854.1025210974.s-sumi@flab.fujitsu.co.jp> Message-ID: <20030116163620.6dcf2fde.nakira@cogni.cs.kumamoto-u.ac.jp> 中川@熊本大学 です。 色々とご助言,ありがとうございます。 亀山様,確かに linux/drivers/net/de4x5.c がありました。 ありがとうございました。 先ず, de4x5 のドライバですが,残念ながら動きませんでした。 自分のやり方がまずいのかもしれませんが, insmod で io= のパラメータを渡してみたりしたのですが, エラーがでて insmod 出来ませんでした。 残念 ! > 富士通研の住元です。 > > Linux 2.4系でですか? NICのベンダーのコードがあるのでしたら、そのデバ > イスドライバのバージョンを調べて、SCoreのLinux 2.4.18のコードと比べれ > ば、何が違うかは分かります。いづれにしろ、単にmail, webくらいに使う分 > には10BaseTでもそんなに困らないのではないかと思います。 えっと,ドライバはkernel付属のものを使ってます。 ベンダーは提供していません。 今回クラスタを用いて実時間で様々な処理をPCにやらせようと しているので,なるべくネットワークは早いほうがいいのです。 ただし,なるべく安く済ませるために安いNICを使おうとしてます(笑) この前までは RealTekのRTL8139D をテストしていましたが これは 全然 駄目で(以前このMLで話題になってましたね。あれと同じ状況でした) 今は tulip で動作するFNW-9803-Tをテストしてます。 > tulipドライバは2.2系は安定して使えたのですが、2.4系付属の tulipドライ > バ(名前は同じですが、作りは全く違います)は、 2.2系よりもハードウェアの > 対応が良くないのが私の印象です。 > > もし、Donald Beckerのコード(www.scyld.com)で安定して動くようなら、それ > に入れ換えたほうが良いかと思います。修正点がいくつかありますので、やる > ときは事前に問い合わせてください。 www.scyld.com においてある tulip のドライバも試してみました。 カーネルに付属しているドライバ同様,HUBの設定をfull-duplexに すると, scstest がこけますが,それ以外では今のところ問題は 発見していないです。 入れ替えも試してみたいので,修正点をお教え願えますか? それでは,よろしくお願いします。 -- ========================================================= 熊本大学 大学院 自然科学研究科 数理科学情報システム専攻 1年 情報認知研究室所属 中川 彰 メールアドレス 大学 : nakira @ cogni.cs.kumamoto-u.ac.jp ======================================================== From s-sumi @ flab.fujitsu.co.jp Thu Jan 16 20:09:46 2003 From: s-sumi @ flab.fujitsu.co.jp (Shinji Sumimoto) Date: Thu, 16 Jan 2003 20:09:46 +0900 (JST) Subject: [SCore-users-jp] NICの問題? ,full-duplexで動作しない,scstest で失敗する In-Reply-To: <20030116163620.6dcf2fde.nakira@cogni.cs.kumamoto-u.ac.jp> References: <20030116134435.63be40d3.nakira@cogni.cs.kumamoto-u.ac.jp> <20030116.151854.1025210974.s-sumi@flab.fujitsu.co.jp> <20030116163620.6dcf2fde.nakira@cogni.cs.kumamoto-u.ac.jp> Message-ID: <20030116.200946.783377528.s-sumi@flab.fujitsu.co.jp> 富士通研の住元です。 From: akira nakagawa Subject: Re: [SCore-users-jp] NICの問題? ,full-duplexで動作しない,scstest で失敗する Date: Thu, 16 Jan 2003 16:36:20 +0900 Message-ID: <20030116163620.6dcf2fde.nakira @ cogni.cs.kumamoto-u.ac.jp> nakira> > Linux 2.4系でですか? NICのベンダーのコードがあるのでしたら、そのデバ nakira> > イスドライバのバージョンを調べて、SCoreのLinux 2.4.18のコードと比べれ nakira> > ば、何が違うかは分かります。いづれにしろ、単にmail, webくらいに使う分 nakira> > には10BaseTでもそんなに困らないのではないかと思います。 nakira> nakira> えっと,ドライバはkernel付属のものを使ってます。 nakira> ベンダーは提供していません。 nakira> nakira> 今回クラスタを用いて実時間で様々な処理をPCにやらせようと nakira> しているので,なるべくネットワークは早いほうがいいのです。 nakira> ただし,なるべく安く済ませるために安いNICを使おうとしてます(笑) nakira> nakira> この前までは RealTekのRTL8139D をテストしていましたが nakira> これは 全然 駄目で(以前このMLで話題になってましたね。あれと同じ状況でした) nakira> 今は tulip で動作するFNW-9803-Tをテストしてます。 実時間系で100BT 1000BT混在はしないのが無難です。 Gigabit Ethernetの方が遅延的に有利です。 速度が違うものが混在すると、高速→低速の時にSwitchでデータがつまる可能 性が高くなり、データ量によってはパケット廃棄が発生します。 nakira> > tulipドライバは2.2系は安定して使えたのですが、2.4系付属の tulipドライ nakira> > バ(名前は同じですが、作りは全く違います)は、 2.2系よりもハードウェアの nakira> > 対応が良くないのが私の印象です。 nakira> > nakira> > もし、Donald Beckerのコード(www.scyld.com)で安定して動くようなら、それ nakira> > に入れ換えたほうが良いかと思います。修正点がいくつかありますので、やる nakira> > ときは事前に問い合わせてください。 nakira> nakira> www.scyld.com においてある tulip のドライバも試してみました。 nakira> カーネルに付属しているドライバ同様,HUBの設定をfull-duplexに nakira> すると, scstest がこけますが,それ以外では今のところ問題は nakira> 発見していないです。 sctestを実行するとまさに上述したことが起きる可能性が高まり、連続して安 定した通信は難しいですので、試験自体やっても実時間用途は難しいと思います。 100BTをコントローラとして使い、他の2ノードが計算ノードとして動くのであ れば、問題はすくないと思いますが、、3ノードでscstestをやる意味はないと 考えます。 nakira> 入れ替えも試してみたいので,修正点をお教え願えますか? nakira> nakira> それでは,よろしくお願いします。 nakira> nakira> nakira> -- nakira> ========================================================= nakira> 熊本大学 大学院 自然科学研究科 数理科学情報システム専攻 1年 nakira> nakira> 情報認知研究室所属 nakira> nakira> 中川 彰 nakira> nakira> メールアドレス nakira> 大学 : nakira @ cogni.cs.kumamoto-u.ac.jp nakira> ======================================================== nakira> _______________________________________________ nakira> SCore-users-jp mailing list nakira> SCore-users-jp @ pccluster.org nakira> http://www.pccluster.org/mailman/listinfo/score-users-jp nakira> nakira> ------ Shinji Sumimoto, Fujitsu Labs From nakira @ cogni.cs.kumamoto-u.ac.jp Thu Jan 16 21:13:00 2003 From: nakira @ cogni.cs.kumamoto-u.ac.jp (akira nakagawa) Date: Thu, 16 Jan 2003 21:13:00 +0900 Subject: [SCore-users-jp] NICの問題? ,full-duplexで動作しない,scstest で失敗する In-Reply-To: <20030116.200946.783377528.s-sumi@flab.fujitsu.co.jp> References: <20030116134435.63be40d3.nakira@cogni.cs.kumamoto-u.ac.jp> <20030116.151854.1025210974.s-sumi@flab.fujitsu.co.jp> <20030116163620.6dcf2fde.nakira@cogni.cs.kumamoto-u.ac.jp> <20030116.200946.783377528.s-sumi@flab.fujitsu.co.jp> Message-ID: <20030116211300.08be7bed.nakira@cogni.cs.kumamoto-u.ac.jp> 熊本大学の 中川です。 まず最初に訂正ですが, 件のNICはきちんと100Base full-duplex で動作していました。 eepro100で動作するNICがあったのでそのNICと 件のNICの転送速度をコリジョンの発生する様な プログラムを書いて計測してみて分かりました。 > 富士通研の住元です。 > > 実時間系で100BT 1000BT混在はしないのが無難です。 > Gigabit Ethernetの方が遅延的に有利です。 > > 速度が違うものが混在すると、高速→低速の時にSwitchでデータがつまる可能 > 性が高くなり、データ量によってはパケット廃棄が発生します。 運用時に支障が出そうですね・・・ でも,100BaseのNICを導入することは,ほぼ決定事項なので プログラムで対処するなり,1000BTのNICを100BTで動作させるなりして 対処したいと思います。 > nakira> www.scyld.com においてある tulip のドライバも試してみました。 > nakira> カーネルに付属しているドライバ同様,HUBの設定をfull-duplexに > nakira> すると, scstest がこけますが,それ以外では今のところ問題は > nakira> 発見していないです。 > > sctestを実行するとまさに上述したことが起きる可能性が高まり、連続して安 > 定した通信は難しいですので、試験自体やっても実時間用途は難しいと思います。 > > 100BTをコントローラとして使い、他の2ノードが計算ノードとして動くのであ > れば、問題はすくないと思いますが、、3ノードでscstestをやる意味はないと > 考えます。 1000BTと100BTの混在した環境に問題かもしれないので, 全部のマシンを100Baseのスイッチングハブに接続して scstestを実行して見たのですが,結果は同じでした。 NICの問題か,pm-ethernet.conf の maxnsend や backoff の調整が必要なのかこれから気長に試してみてそのうち結果を 報告したいと思います。 亀山様,住元様,質問が下手でご迷惑でしたでしょうが, おつきあいいただきありがとうございました。 そのうち他の方にも有益な情報をポスト出来ればいいなぁ,と思ってます。 それでは。 -- ========================================================= 熊本大学 大学院 自然科学研究科 数理科学情報システム専攻 1年 情報認知研究室所属 中川 彰 メールアドレス 大学 : nakira @ cogni.cs.kumamoto-u.ac.jp ======================================================== From daniel.charpin @ nec.fr Thu Jan 16 23:37:32 2003 From: daniel.charpin @ nec.fr (Daniel Charpin) Date: Thu, 16 Jan 2003 15:37:32 +0100 Subject: [SCore-users-jp] [SCore-users] (no subject) Message-ID: <200301161437.h0GEbWN04467@charpinpc.ess.nec.fr> Dear list members, It is very useful for HPC benchmarks to measure some performance characteristics of programs. There is a nice tool named "lperfex" which is a hardware performance monitor for linux/IA32 systems described at: http://www.osc.edu/~troy/lperfex/ Example of measurements: dcharpin {1021}-> lperfex -y -e 41 -e P6_MUL ./a.out 1 2.5 2 1.25 3 0.78125 ./a.out: 1.12s CPU, 1.11s wallclock (100.90% CPU utilization) on essf (2x Intel Pentium III 501.1 MHz) TSC 558257627 PMC[0] (P6_FLOPS) 17430090 PMC[1] (P6_MUL) 27900665 Statistics (averaged across threads): --------------------------------------- MFLOPS 15.702784 FP multiplications/total FP ops 1.600718 Before to install this tool, it is necessary to install the patch "perfctr-2.4.3" in the kernel. Please, could you investigate the possibility to install it in the next Score release ? Thank you for your support. Best regards, Daniel Charpin NEC / European Supercomputer Systems "Le Saturne" - 3, Parc Ariane - 78284 GUYANCOURT Cedex +33 (0)1 39 30 66 05 | +33 (0)6 03 20 07 21 Courriel: Daniel.Charpin @ nec.fr < http://www.ess.nec.de > _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From nrcb @ streamline-computing.com Fri Jan 17 08:24:20 2003 From: nrcb @ streamline-computing.com (Nick Birkett) Date: Thu, 16 Jan 2003 23:24:20 +0000 Subject: [SCore-users-jp] [SCore-users] SCore 5.2 patches Message-ID: <200301162324.h0GNOKj01815@zeralda.streamline.com> I was just wondering if there will be official patches on the PCCLUSTER site for SCore 5.2. I think the 2 main problems in 5.2.0 were the kernel source code and the mpif90 support Thanks, Nick _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From nakira @ cogni.cs.kumamoto-u.ac.jp Fri Jan 17 10:36:25 2003 From: nakira @ cogni.cs.kumamoto-u.ac.jp (akira nakagawa) Date: Fri, 17 Jan 2003 10:36:25 +0900 Subject: [SCore-users-jp] 上手くいきました。ありがとうございました。 In-Reply-To: <20030116211300.08be7bed.nakira@cogni.cs.kumamoto-u.ac.jp> References: <20030116134435.63be40d3.nakira@cogni.cs.kumamoto-u.ac.jp> <20030116.151854.1025210974.s-sumi@flab.fujitsu.co.jp> <20030116163620.6dcf2fde.nakira@cogni.cs.kumamoto-u.ac.jp> <20030116.200946.783377528.s-sumi@flab.fujitsu.co.jp> <20030116211300.08be7bed.nakira@cogni.cs.kumamoto-u.ac.jp> Message-ID: <20030117103625.720e662c.nakira@cogni.cs.kumamoto-u.ac.jp> 熊本大学の 中川です。 scstest 失敗の件ですが,最終的に maxnsend の値を 3 にする事で 回避可能となりました。 1000 K packets. まで成功することを5回確かめました。 ただ,通信速度が非常に遅くなるので,運用上問題が生じない限り, maxnsend 16 等の値で運用していこうと考えております。 それでは,亀山様,住元様,有益な情報を ありがとうございました。 From ks_marine @ nssnet.co.jp Mon Jan 20 13:28:02 2003 From: ks_marine @ nssnet.co.jp (K.Suzuki) Date: Mon, 20 Jan 2003 13:28:02 +0900 Subject: [SCore-users-jp] 特定のホストが SCore-D になれない Message-ID: <001f01c2c03c$522ae9b0$2101a8c0@pc020> 鈴木と申します。はじめまして。 初めて質問を投稿させていただきます。 問題は以下の内容です。 ・特定のホストが SCore-D になれない。   (SCOUT) # scored -server $(N)  上記の N==1,6,11 の場合に SCore-D が正常に起動できない。  (それぞれ 1:comp2,comp8 6:comp7,comp1 11:comp12,comp6 を   Server/Backup としようとする。   Server/Backup が逆の場合(N==7:comp8,comp2 等)、Server   が落ちると Backup は機能しないのではないか?) 以下のようなシステムログが出力されます。 # scored SYSLOG: /opt/score5.2.0/deploy/scored SYSLOG: SCore-D 5.2.0 $Id: init.cc,v 1.67 2002/07/01 08:30:22 hori Exp $ SYSLOG: Compile option(s): SYSLOG: SCore-D network: gigaethernet/ethernet SYSLOG: Cluster[0]: (0..11)x1.i386-redhat7-linux2_4.i686.500 SYSLOG: Memory: 502[MB], Swap: 1028[MB], Disk: 3035[MB] SYSLOG: Network[0]: gigaethernet/ethernet SYSLOG: Scheduler initiated: Timeslice = 500 [msec] SYSLOG: Queue[0] activated, exclusive scheduling SYSLOG: Queue[1] activated, time-sharing scheduling SYSLOG: Queue[2] activated, time-sharing scheduling SYSLOG: Session ID: 0 SYSLOG: Server Host: comp12.xxxxx.xx.xx SYSLOG: Backup Host: comp6.xxxxx.xx.xx <11> SCore-D:ERROR Unable to continue session-0. クラスタは、サーバホストと12台の計算ホスト(comp1〜comp12)で構成されてい ます。 問題を解決するにはどうしたらよいのでしょうか? どうかご教授よろしくお願いします。 From kameyama @ pccluster.org Mon Jan 20 13:35:11 2003 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Mon, 20 Jan 2003 13:35:11 +0900 Subject: [SCore-users-jp] 特定のホストが SCore-D になれない In-Reply-To: Your message of "Mon, 20 Jan 2003 13:28:02 JST." <001f01c2c03c$522ae9b0$2101a8c0@pc020> Message-ID: <20030120043511.CE8B02004F@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <001f01c2c03c$522ae9b0$2101a8c0 @ pc020> "K.Suzuki" wrotes: > # scored > SYSLOG: /opt/score5.2.0/deploy/scored > SYSLOG: SCore-D 5.2.0 $Id: init.cc,v 1.67 2002/07/01 08:30:22 hori Exp $ > SYSLOG: Compile option(s): > SYSLOG: SCore-D network: gigaethernet/ethernet > SYSLOG: Cluster[0]: (0..11)x1.i386-redhat7-linux2_4.i686.500 > SYSLOG: Memory: 502[MB], Swap: 1028[MB], Disk: 3035[MB] > SYSLOG: Network[0]: gigaethernet/ethernet > SYSLOG: Scheduler initiated: Timeslice = 500 [msec] > SYSLOG: Queue[0] activated, exclusive scheduling > SYSLOG: Queue[1] activated, time-sharing scheduling > SYSLOG: Queue[2] activated, time-sharing scheduling > SYSLOG: Session ID: 0 > SYSLOG: Server Host: comp12.xxxxx.xx.xx > SYSLOG: Backup Host: comp6.xxxxx.xx.xx > <11> SCore-D:ERROR Unable to continue session-0. 多分, 前回 SCore-D を終了するとき, (sc_console -c shutdown 使用して) 正式に shutdown していないため, checkpoint file が残ってしまっているのだと 思います. # scored -reset もしくは, checkpoint から開始するために # scored -restart を使用してみてください. from Kameyama Toyohisa From ks_marine @ nssnet.co.jp Mon Jan 20 14:01:33 2003 From: ks_marine @ nssnet.co.jp (K.Suzuki) Date: Mon, 20 Jan 2003 14:01:33 +0900 Subject: [SCore-users-jp] 特定のホストが SCore-D になれない References: <20030120043511.CE8B02004F@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <002f01c2c041$00cff0b0$2101a8c0@pc020> 亀山様 解決しました。 どうもありがとうございました。 > 多分, 前回 SCore-D を終了するとき, (sc_console -c shutdown 使用して) > 正式に shutdown していないため, checkpoint file が残ってしまっているのだと > 思います. > # scored -reset > もしくは, checkpoint から開始するために > # scored -restart > を使用してみてください. > > from Kameyama Toyohisa From sugawara @ mlab.jks.ynu.ac.jp Tue Jan 21 12:31:36 2003 From: sugawara @ mlab.jks.ynu.ac.jp (Taira Sugawara) Date: Tue, 21 Jan 2003 12:31:36 +0900 Subject: [SCore-users-jp] OpenMP Message-ID: <20030121122117.A496.SUGAWARA@mlab.jks.ynu.ac.jp> 横浜国立大学の菅原です。 SCore自体の問題ではないので、 こちらに送ってもよいものかと悩みましたが、 意見を聞かせてください。 現在OpenMPを用いて、ソースプログラムに指示文を入れ、 並列化しようとしています。 簡単なプログラムについてはすぐ並列化ができたのですが、 複雑なプログラムになると、gccではコンパイルでき実行できても、 omccでコンパイルする際にはソースによって 様々なエラーが出てきてしまいます。 一例ですが、 /usr/include/stdio.h:620 'bufo' undeclared here (not in a function) /usr/include/stdio.h:621 'bufo' undeclared here (not in a function) のようなエラーが出たり、 des_opts.o(.text+0x14703): undefined reference to '__G_stderr' のようなエラーが出たりします。 いずれもgccでコンパイルしたものは問題なく動いています。 何かアドバイスなどありましたらよろしくお願いいたします。 菅原 平 sugawara @ mlab.jks.ynu.ac.jp From kameyama @ pccluster.org Tue Jan 21 13:37:10 2003 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Tue, 21 Jan 2003 13:37:10 +0900 Subject: [SCore-users-jp] OpenMP In-Reply-To: Your message of "Tue, 21 Jan 2003 12:31:36 JST." <20030121122117.A496.SUGAWARA@mlab.jks.ynu.ac.jp> Message-ID: <20030121043710.C0CFA20050@neal.il.is.s.u-tokyo.ac.jp> 亀山です. とりあえず, 状況の整理を... In article <20030121122117.A496.SUGAWARA @ mlab.jks.ynu.ac.jp> Taira Sugawara wrotes: > 現在OpenMPを用いて、ソースプログラムに指示文を入れ、 > 並列化しようとしています。 > 簡単なプログラムについてはすぐ並列化ができたのですが、 > 複雑なプログラムになると、gccではコンパイルでき実行できても、 > omccでコンパイルする際にはソースによって > 様々なエラーが出てきてしまいます。 > > 一例ですが、 > /usr/include/stdio.h:620 'bufo' undeclared here (not in a function) > /usr/include/stdio.h:621 'bufo' undeclared here (not in a function) redhat 7.2/7.3/8.0 いずれも /usr/include/stdio.h に bufo という文字列が見付からなかったのですが, どのような環境でコンパイル しているのでしょうか? また, Omni はどのようなバージョンを使用しているでしょうか? (SCore 5.2.0 付属のものでしょうか?) > のようなエラーが出たり、 > des_opts.o(.text+0x14703): undefined reference to '__G_stderr' > のようなエラーが出たりします。 これは多分 link 時に出たものだと思いますが. des_opts.o というファイルは omcc によって作成したものでしょうか? from Kameyama Toyohisa From a-hasega @ ats.nis.nec.co.jp Tue Jan 21 13:58:21 2003 From: a-hasega @ ats.nis.nec.co.jp (長谷川 篤史) Date: Tue, 21 Jan 2003 13:58:21 +0900 Subject: [SCore-users-jp] OpenMP References: <20030121122117.A496.SUGAWARA@mlab.jks.ynu.ac.jp> Message-ID: <3E2CD36D.9020806@ats.nis.nec.co.jp> 長谷川@NEC情報システムズです。 > 一例ですが、 > /usr/include/stdio.h:620 'bufo' undeclared here (not in a function) > /usr/include/stdio.h:621 'bufo' undeclared here (not in a function) > のようなエラーが出たり、 omcc -v としてコンパイルした時のログと、/usr/include/stdio.h を見せて もらえないでしょうか? > des_opts.o(.text+0x14703): undefined reference to '__G_stderr' > のようなエラーが出たりします。 これは、Omni/SCASHの制限です(クラスタで使用する場合の問題)。 ソースコードに、 #pragma omp threadprivate (stdin,stderr,stdout) と入れてください。 Omni/SCASHは、global 変数を、クラスタ間で共有するために、global 変数の mappingを変更しています。このため、ライブラリ等、omni/SCASH以外でコン パイルされたプログラムのglobal変数を共有できないという制限があります。 -- 長谷川 篤史 E-Mail:a-hasega @ ats.nis.nec.co.jp 株式会社NEC情報システムズ 基盤ソフトウェア事業部 サイエンス基盤部 外線:03-3798-9991(Fax.03-3798-9198) / 内線:8-115-2410(Fax.8-115-2419) From sugawara @ mlab.jks.ynu.ac.jp Tue Jan 21 14:23:34 2003 From: sugawara @ mlab.jks.ynu.ac.jp (Taira Sugawara) Date: Tue, 21 Jan 2003 14:23:34 +0900 Subject: [SCore-users-jp] OpenMP Message-ID: <20030121141856.97A6.SUGAWARA@mlab.jks.ynu.ac.jp> 菅原です。 亀山さんへ。 大した整理もせず、状況も書かずにすいませんでした。 > redhat 7.2/7.3/8.0 いずれも /usr/include/stdio.h に bufo > という文字列が見付からなかったのですが, どのような環境でコンパイル > しているのでしょうか? redhat7.3でSCore5.2.0を使用しています。 OmniはSCore付属のものです。バージョンは1.4aとなっています。 des.cというファイルをコンパイルしようとすると以下のようになります。 $ omcc -omniconfig=scash -o des des.c Compiling 'des.c'... /usr/include/stdio.h:620: 'bufo' undeclared here (not in a function) /usr/include/stdio.h:620: initializer element is not constant /usr/include/stdio.h:621: 'bufo' undeclared here (not in a function) /usr/include/stdio.h:621: initializer element is not constant Error1 そして、なぜかオプション-omnicc=gcc あるいは cc を指定すると、 エラー表示が変わります。デフォルトではccになっているんですよね? $ omcc -omniconfig=scash -o des des.c -omnicc=gcc Compiling 'des.c'... /usr/include/stdio.h:620: 'bufo' undeclared here (not in a function) /usr/include/stdio.h:621: 'bufo' undeclared here (not in a function) Error1 > des_opts.o というファイルは omcc によって作成したものでしょうか? omccで作成しています。 omcc -DRAND -DTERMIO -DDES_PTR -DDES_UNROLL -omniconfig=scash -O3 -fomit-frame-pointer -c -o des_opts.o des_opts.c Compiling 'des_opts.c'... des.h:206: warning: decimal constant is so large that it is unsigned des.h:207: warning: decimal constant is so large that it is unsigned des.h:208: warning: decimal constant is so large that it is unsigned des.h:208: warning: decimal constant is so large that it is unsigned omcc -DRAND -DTERMIO -DDES_PTR -DDES_UNROLL -omniconfig=scash -O3 -fomit-frame-pointer -c -o des_opts.o des_opts.c 菅原 平 sugawara @ mlab.jks.ynu.ac.jp --------------------- Original Message Ends -------------------- 菅原 平 横浜国立大学大学院 環境情報学府 情報メディア環境学専攻 情報メディア学コース 松本研究室 sugawara @ mlab.jks.ynu.ac.jp From sugawara @ mlab.jks.ynu.ac.jp Tue Jan 21 14:23:40 2003 From: sugawara @ mlab.jks.ynu.ac.jp (Taira Sugawara) Date: Tue, 21 Jan 2003 14:23:40 +0900 Subject: [SCore-users-jp] OpenMP In-Reply-To: <3E2CD36D.9020806@ats.nis.nec.co.jp> References: <20030121122117.A496.SUGAWARA@mlab.jks.ynu.ac.jp> <3E2CD36D.9020806@ats.nis.nec.co.jp> Message-ID: <20030121141930.97A9.SUGAWARA@mlab.jks.ynu.ac.jp> 菅原です。 長谷川さん回答ありがとうございます。 > omcc -v としてコンパイルした時のログと、/usr/include/stdio.h を見せて > もらえないでしょうか? 添付いたしました。 > > des_opts.o(.text+0x14703): undefined reference to '__G_stderr' > > のようなエラーが出たりします。 > > これは、Omni/SCASHの制限です(クラスタで使用する場合の問題)。 > ソースコードに、 > #pragma omp threadprivate (stdin,stderr,stdout) > と入れてください。 エラーの出ていたdes_opts.cに入れてコンパイルしてみましたが、 以下のようになってしまいました。 omcc -DRAND -DTERMIO -DDES_PTR -DDES_UNROLL -omniconfig=scash -O3 -fomit-frame-pointer -c -o des_opts.o des_opts.c Compiling 'des_opts.c'... "des_opts.c", line 62: undefined variable, stdin in pragma "des_opts.c", line 62: undefined variable, stderr in pragma "des_opts.c", line 62: undefined variable, stdout in pragma Error 1 omcc -DRAND -DTERMIO -DDES_PTR -DDES_UNROLL -omniconfig=scash -O3 -fomit-frame-pointer -o des_opts des_opts.o libdes.a des_opts.o: In function `_ompc_main': des_opts.o(.text+0x14703): undefined reference to `__G_stderr' des_opts.o(.text+0x147be): undefined reference to `__G_stderr' des_opts.o(.text+0x147e7): undefined reference to `__G_stderr' des_opts.o(.text+0x148ab): undefined reference to `__G_stderr' des_opts.o(.text+0x148d4): undefined reference to `__G_stderr' des_opts.o(.text+0x14992): more undefined references to `__G_stderr' follow collect2: ld returned 1 exit status Error 1 すいませんがよろしくお願いいたします。 菅原 平 横浜国立大学大学院 環境情報学府 情報メディア環境学専攻 情報メディア学コース 松本研究室 sugawara @ mlab.jks.ynu.ac.jp -------------- next part -------------- テキスト形式以外の添付ファイルを保管しました... ファイル名: stdio.h 型: application/octet-stream サイズ: 21452 バイト 説明: 無し URL: -------------- next part -------------- テキスト形式以外の添付ファイルを保管しました... ファイル名: omcc.log 型: application/octet-stream サイズ: 731 バイト 説明: 無し URL: From a-hasega @ ats.nis.nec.co.jp Tue Jan 21 14:53:32 2003 From: a-hasega @ ats.nis.nec.co.jp (長谷川 篤史) Date: Tue, 21 Jan 2003 14:53:32 +0900 Subject: [SCore-users-jp] OpenMP References: <20030121122117.A496.SUGAWARA@mlab.jks.ynu.ac.jp> <3E2CD36D.9020806@ats.nis.nec.co.jp> <20030121141930.97A9.SUGAWARA@mlab.jks.ynu.ac.jp> Message-ID: <3E2CE05C.8050908@ats.nis.nec.co.jp> 長谷川@NEC情報システムズです。 >>omcc -v としてコンパイルした時のログと、/usr/include/stdio.h を見せて >>もらえないでしょうか? コンパイルのログですが、この後に、"Compiling ... "とメッセージが出て、 何らかのコマンド実行のログやエラーメッセージが出力されるはずですが、 本当にここで終わったのでしょうか? ヘッダファイルには、bufo らしき文字列は見当たりませんでしたので、 他のヘッダファイルか、ソースコードに原因があるように思われます。 ソースコードを公開してもかまわないのでしたら、 omcc -t XXXX としてコンパイルして、カレントディレクトリにできる、tmp.??? をまとめて 送っていただけると、原因ぐらいはわかるのではないかと思います。 > エラーの出ていたdes_opts.cに入れてコンパイルしてみましたが、 > 以下のようになってしまいました。 > > omcc -DRAND -DTERMIO -DDES_PTR -DDES_UNROLL -omniconfig=scash -O3 -fomit-frame-pointer -c -o des_opts.o des_opts.c > Compiling 'des_opts.c'... > "des_opts.c", line 62: undefined variable, stdin in pragma > "des_opts.c", line 62: undefined variable, stderr in pragma > "des_opts.c", line 62: undefined variable, stdout in pragma 説明不足で済みません。変数を宣言した後、この場合、#include の後に宣言を追加してください。 -- 長谷川 篤史 E-Mail:a-hasega @ ats.nis.nec.co.jp 株式会社NEC情報システムズ 基盤ソフトウェア事業部 サイエンス基盤部 外線:03-3798-9991(Fax.03-3798-9198) / 内線:8-115-2410(Fax.8-115-2419) From kameyama @ pccluster.org Tue Jan 21 15:07:22 2003 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Tue, 21 Jan 2003 15:07:22 +0900 Subject: [SCore-users-jp] OpenMP In-Reply-To: Your message of "Tue, 21 Jan 2003 14:23:34 JST." <20030121141856.97A6.SUGAWARA@mlab.jks.ynu.ac.jp> Message-ID: <20030121060722.BF41820050@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <20030121141856.97A6.SUGAWARA @ mlab.jks.ynu.ac.jp> Taira Sugawara wrotes: > そして、なぜかオプション-omnicc=gcc あるいは cc を指定すると、 > エラー表示が変わります。デフォルトではccになっているんですよね? redhat 7.3 の gcc は 2.96 なのですが, このバージョンですと 不具合が起こるため, Omni のみ egcs に変更しています. > Compiling 'des.c'... > /usr/include/stdio.h:620: 'bufo' undeclared here (not in a function) > /usr/include/stdio.h:621: 'bufo' undeclared here (not in a function) > Error1 なんか stdio.h を include している前の定義の問題のような気がします. bufo という変数か構造体に心当たりは無いでしょうか? > omccで作成しています。 > > omcc -DRAND -DTERMIO -DDES_PTR -DDES_UNROLL -omniconfig=scash -O3 > -fomit-frame-pointer -c -o des_opts.o des_opts.c > Compiling 'des_opts.c'... > des.h:206: warning: decimal constant is so large that it is unsigned > des.h:207: warning: decimal constant is so large that it is unsigned > des.h:208: warning: decimal constant is so large that it is unsigned > des.h:208: warning: decimal constant is so large that it is unsigned なんか, 整数の定数がオーバーフローしているようですが... 別の mail ですが... > "des_opts.c", line 62: undefined variable, stdout in pragma #pragma omp threadprivate (stdin,stderr,stdout) は stderr などが定義されたあと, つまり, #include の後にいれてみてください. from Kameyama Toyohisa From sugawara @ mlab.jks.ynu.ac.jp Tue Jan 21 16:58:07 2003 From: sugawara @ mlab.jks.ynu.ac.jp (Taira Sugawara) Date: Tue, 21 Jan 2003 16:58:07 +0900 Subject: [SCore-users-jp] OpenMP In-Reply-To: <3E2CE05C.8050908@ats.nis.nec.co.jp> References: <20030121141930.97A9.SUGAWARA@mlab.jks.ynu.ac.jp> <3E2CE05C.8050908@ats.nis.nec.co.jp> Message-ID: <20030121153115.97B4.SUGAWARA@mlab.jks.ynu.ac.jp> 菅原です。 すいません。先ほどのomcc -vは不完全でした。 もう一度添付します。 > ヘッダファイルには、bufo らしき文字列は見当たりませんでしたので、 > 他のヘッダファイルか、ソースコードに原因があるように思われます。 ソースコードにbufoなる変数がありました。 これがらみのエラーということになりますよね。 一応omcc -tでコンパイルした際に出力されたファイルを添付します。 bufoのエラーが出ていたものと、 __G_stderrのエラーが出ていたものは別のプログラムだったんですが、 __G_stderrの方は#pragma omap ...を#include の後に入れたら コンパイルは問題なく行われました。 しかし、mainの初めの方は以下のように記述しているんですが、 printf("How many times DES encryption ? (16) "); scanf("%lx",×); 実行すると SCore-D 5.2.0 connected. <0:0> SCORE: one node ready と画面に表示され止ってしまいます。 ただここで、「ffff」などと入力すると、 そのあとでprintfが実行し、ちゃんと変数も読み込み、 問題なくプログラムが進みます。 なぜこういう風になっているんでしょうか? 問題を増やしてしまって問題ないんですが、 他のプログラムをコンパイルしようとした際に、 添付ファイル[pbl4.log]のような結果になりました。 一応先ほどの#pragma... など入れてやってみましたが、 改善しませんでした。 何が原因なのかわかりますでしょうか? 以上よろしくお願いいたします。 菅原 平 横浜国立大学大学院 環境情報学府 情報メディア環境学専攻 情報メディア学コース 松本研究室 sugawara @ mlab.jks.ynu.ac.jp -------------- next part -------------- テキスト形式以外の添付ファイルを保管しました... ファイル名: tmp.tgz 型: application/octet-stream サイズ: 68471 バイト 説明: 無し URL: -------------- next part -------------- テキスト形式以外の添付ファイルを保管しました... ファイル名: omcc-v.log 型: application/octet-stream サイズ: 1723 バイト 説明: 無し URL: -------------- next part -------------- テキスト形式以外の添付ファイルを保管しました... ファイル名: pbl4.log 型: application/octet-stream サイズ: 2994 バイト 説明: 無し URL: From a-hasega @ ats.nis.nec.co.jp Tue Jan 21 23:14:05 2003 From: a-hasega @ ats.nis.nec.co.jp (長谷川 篤史) Date: Tue, 21 Jan 2003 23:14:05 +0900 Subject: [SCore-users-jp] OpenMP References: <20030121141930.97A9.SUGAWARA@mlab.jks.ynu.ac.jp> <3E2CE05C.8050908@ats.nis.nec.co.jp> <20030121153115.97B4.SUGAWARA@mlab.jks.ynu.ac.jp> Message-ID: <3E2D55AD.3060705@ats.nis.nec.co.jp> 長谷川@NEC情報システムズです。 > ソースコードにbufoなる変数がありました。 > これがらみのエラーということになりますよね。 > 一応omcc -tでコンパイルした際に出力されたファイルを添付します。 omniのバグですね.... とりあえず、回避策として、以下のようにしてみてください。 変換後のソースから推測すると、おそらく、以下のようなコードがあると 思います。 ----------------------------------------- #include .... char *bufolast = buf + 1016, ....; ----------------------------------------- これを、 char *buflast; として、main 関数の頭でbufolastを初期化するように書き換えて、 コンパイルしてください。 > しかし、mainの初めの方は以下のように記述しているんですが、 > printf("How many times DES encryption ? (16) "); > scanf("%lx",×); > 実行すると > SCore-D 5.2.0 connected. > <0:0> SCORE: one node ready > と画面に表示され止ってしまいます。 scanf の前に、"fflush (stdout);" をいれて、ファイルをフラッシュして 下さい。 > 問題を増やしてしまって問題ないんですが、 > 他のプログラムをコンパイルしようとした際に、 > 添付ファイル[pbl4.log]のような結果になりました。 > 一応先ほどの#pragma... など入れてやってみましたが、 > 改善しませんでした。 これに関しては、状況が良くわからなかったのです。何か、コンパイル方法を 変えたらおかしくなったのでしょうか?それとも、別のソースをコンパイルし たら、このようなエラーが出たのでしょうか? 問題のソースコードを公開してもらうとか、-t の結果を送ってもらうとか、 こちらで現象を再現させるための方法を記述して質問していただけるとありが たいです。 -- 長谷川 篤史 E-Mail:a-hasega @ ats.nis.nec.co.jp 株式会社NEC情報システムズ 基盤ソフトウェア事業部 サイエンス基盤部 外線:03-3798-9991(Fax.03-3798-9198) / 内線:8-115-2410(Fax.8-115-2419) From k-egg @ gmx.de Wed Jan 22 01:34:31 2003 From: k-egg @ gmx.de (Andreas Vitz) Date: Tue, 21 Jan 2003 17:34:31 +0100 Subject: [SCore-users-jp] [SCore-users] Score 5.0.1: MPE_SetKeyCallback not implemented?? Message-ID: <200301211627.h0LGR9S24116@pccluster.org> Dear score list, I'm basicly new to score and mpich, and I try out some functions of the mpe-library. as i try the MPE_SetKeyCallback function i only get wellen.o: In function `main': wellen.o(.text+0x703): undefined reference to `MPE_SetKeyCallback searching with ar -t in libmpe.a for xkeys.o (this is where teh function is implemented) results in no result ;-( My installation is a Score 5.0.1 standard installation. now my questiones: why isn't that function in the precompiled version of the score-mpich ?? is ther a easy way to "repair" that leak?? is it easy to compile mpich and "update" score ?? is this function capable in Score 5.2 ?? sinc Andreas Vitz _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From sugawara @ mlab.jks.ynu.ac.jp Wed Jan 22 09:15:52 2003 From: sugawara @ mlab.jks.ynu.ac.jp (Taira Sugawara) Date: Wed, 22 Jan 2003 09:15:52 +0900 Subject: [SCore-users-jp] OpenMP In-Reply-To: <3E2D55AD.3060705@ats.nis.nec.co.jp> References: <20030121153115.97B4.SUGAWARA@mlab.jks.ynu.ac.jp> <3E2D55AD.3060705@ats.nis.nec.co.jp> Message-ID: <20030122091026.97CD.SUGAWARA@mlab.jks.ynu.ac.jp> 菅原@横国大です。 長谷川さんへ。 > scanf の前に、"fflush (stdout);" をいれて、ファイルをフラッシュして > 下さい。 問題解決しました。 > > 問題を増やしてしまって問題ないんですが、 > > 他のプログラムをコンパイルしようとした際に、 > > 添付ファイル[pbl4.log]のような結果になりました。 > > 一応先ほどの#pragma... など入れてやってみましたが、 > > 改善しませんでした。 > > これに関しては、状況が良くわからなかったのです。何か、コンパイル方法を > 変えたらおかしくなったのでしょうか?それとも、別のソースをコンパイルし > たら、このようなエラーが出たのでしょうか? こちらは、コンパイル時のオプションで-gをはずしたら エラーが出なくなりました。 また、実行も問題なくできました。 長谷川さん、亀山さんへ。 いろいろと親切丁寧に教えていただきありがとうございました。 とても助かりました。 それでは。 菅原 平 横浜国立大学大学院 環境情報学府 情報メディア環境学専攻 情報メディア学コース 松本研究室 sugawara @ mlab.jks.ynu.ac.jp From sugawara @ mlab.jks.ynu.ac.jp Wed Jan 22 10:05:16 2003 From: sugawara @ mlab.jks.ynu.ac.jp (Taira Sugawara) Date: Wed, 22 Jan 2003 10:05:16 +0900 Subject: [SCore-users-jp] VM Fault out Message-ID: <20030122094020.97CF.SUGAWARA@mlab.jks.ynu.ac.jp> 横浜国立大学の菅原です。 先ほどのプログラムですが、うまくいったと思ったら、 正しく指示文が入っておらず、並列化されていませんでした。 指示文を入れてから実行してみたところ、 以下のようなエラーが出てしまいました。 <1> VM Fault out of DSM area PC=[08048b90]:ADDR=[08c84d40] メーリングリストの過去ログを見たところ、 メモリがらみの問題ということはわかりました。 使用しているマシンはDualプロセッサで、メモリは1GBです。 これでもメモリは足りないのでしょうか? (プログラムの組み方の問題?) とりあえず、OMPC_DEBUG=1として実行した際のログを添付しました。 アドバイスをお願いいたします。 菅原 平 横浜国立大学大学院 環境情報学府 情報メディア環境学専攻 情報メディア学コース 松本研究室 sugawara @ mlab.jks.ynu.ac.jp -------------- next part -------------- テキスト形式以外の添付ファイルを保管しました... ファイル名: ompc_debug.log 型: application/octet-stream サイズ: 1441 バイト 説明: 無し URL: From kameyama @ pccluster.org Wed Jan 22 10:19:47 2003 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Wed, 22 Jan 2003 10:19:47 +0900 Subject: [SCore-users-jp] Re: [SCore-users] Score 5.0.1: MPE_SetKeyCallback not implemented?? In-Reply-To: Your message of "Tue, 21 Jan 2003 17:34:31 JST." <200301211627.h0LGR9S24116@pccluster.org> Message-ID: <20030122011947.644152004F@neal.il.is.s.u-tokyo.ac.jp> In article <200301211627.h0LGR9S24116 @ pccluster.org> Andreas Vitz wrotes: > I'm basicly new to score and mpich, and I try out some functions of the > mpe-library. > as i try the MPE_SetKeyCallback function i only get > > wellen.o: In function `main': > wellen.o(.text+0x703): undefined reference to `MPE_SetKeyCallback > > searching with ar -t in libmpe.a for xkeys.o (this is where teh function > is implemented) results in no result ;-( > > My installation is a Score 5.0.1 standard installation. > > now my questiones: > > why isn't that function in the precompiled version of the score-mpich ?? There is xkey.c in mpich source file. And MPE_SetKeyCallback defined in it's file. But this file dose not compile because its filename is not Makefile.in and configure. There is same probrem on (original) mpich 1.2.0, 1.2.4 and 1.2.5. (I cannot find MPE_SetKeyCallback name in mpe_graphics.h, MPI documentation files, and http://www-unix.mcs.anl.gov/ search.) So, SCore 5.2 has same probrem. > is ther a easy way to "repair" that leak?? I think Probably, it is easy. But above reason, I don't recommend it. from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From msato @ is.tsukuba.ac.jp Wed Jan 22 11:31:00 2003 From: msato @ is.tsukuba.ac.jp (Mitsuhisa Sato) Date: Wed, 22 Jan 2003 11:31:00 +0900 Subject: [SCore-users-jp] VM Fault out In-Reply-To: <20030122094020.97CF.SUGAWARA@mlab.jks.ynu.ac.jp> References: <20030122094020.97CF.SUGAWARA@mlab.jks.ynu.ac.jp> Message-ID: <20030122113100B.msato@is.tsukuba.ac.jp> さとうと申します。 必要なメモリサイズはどの位でしょうか? 実は、現在のOmni/SCASHではDSMの領域をpin-down(実メモリに割り当て、 swapoutしなくすること)しなくてはならないので、それが大きな問題になって います。 現在のところ回避する方法は、プログラムのなかで各プロセッサでローカルな もの(たとえば、一回初期化したらあとは変更しないようなところ)を threadprivateにして、なるべくDSM領域を減らすという方法しかありません。 ご検討ください。 さとう。 From: Taira Sugawara Subject: [SCore-users-jp] VM Fault out Date: Wed, 22 Jan 2003 10:05:16 +0900 > 横浜国立大学の菅原です。 > > 先ほどのプログラムですが、うまくいったと思ったら、 > 正しく指示文が入っておらず、並列化されていませんでした。 > 指示文を入れてから実行してみたところ、 > 以下のようなエラーが出てしまいました。 > > <1> VM Fault out of DSM area PC=[08048b90]:ADDR=[08c84d40] > > メーリングリストの過去ログを見たところ、 > メモリがらみの問題ということはわかりました。 > 使用しているマシンはDualプロセッサで、メモリは1GBです。 > これでもメモリは足りないのでしょうか? > (プログラムの組み方の問題?) > とりあえず、OMPC_DEBUG=1として実行した際のログを添付しました。 > > アドバイスをお願いいたします。 > > 菅原 平 > 横浜国立大学大学院 環境情報学府 > 情報メディア環境学専攻 情報メディア学コース 松本研究室 > sugawara @ mlab.jks.ynu.ac.jp From sugawara @ mlab.jks.ynu.ac.jp Wed Jan 22 14:11:16 2003 From: sugawara @ mlab.jks.ynu.ac.jp (Taira Sugawara) Date: Wed, 22 Jan 2003 14:11:16 +0900 Subject: [SCore-users-jp] VM Fault out In-Reply-To: <20030122113100B.msato@is.tsukuba.ac.jp> References: <20030122094020.97CF.SUGAWARA@mlab.jks.ynu.ac.jp> <20030122113100B.msato@is.tsukuba.ac.jp> Message-ID: <20030122140043.97D6.SUGAWARA@mlab.jks.ynu.ac.jp> 菅原@横国大です。 さとうさんへ。 回答ありがとうございました。 > 必要なメモリサイズはどの位でしょうか? このプログラムは大きな行列を計算対象としているんですが、 400MBぐらいは必要です。 ある程度小さい行列(必要メモリは数MBぐらい) でもプログラムを走らせようとしたのですが、 同様のエラーが出てしまいました。 小さい行列(数KB)でやっと実行されました。 (プログラミングのミスか、正しい答えは出ませんでしたが、 一応ちゃんと終了しました。) このサイズのものをOpenMPで実行するのは難しいでしょうか? 菅原 平 横浜国立大学大学院 環境情報学府 情報メディア環境学専攻 情報メディア学コース 松本研究室 sugawara @ mlab.jks.ynu.ac.jp From kameyama @ pccluster.org Wed Jan 22 14:29:27 2003 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Wed, 22 Jan 2003 14:29:27 +0900 Subject: [SCore-users-jp] VM Fault out In-Reply-To: Your message of "Wed, 22 Jan 2003 14:11:16 JST." <20030122140043.97D6.SUGAWARA@mlab.jks.ynu.ac.jp> Message-ID: <20030122052927.1673E20050@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <20030122140043.97D6.SUGAWARA @ mlab.jks.ynu.ac.jp> Taira Sugawara wrotes: > > 必要なメモリサイズはどの位でしょうか? > > このプログラムは大きな行列を計算対象としているんですが、 > 400MBぐらいは必要です。 > ある程度小さい行列(必要メモリは数MBぐらい) > でもプログラムを走らせようとしたのですが、 > 同様のエラーが出てしまいました。 > 小さい行列(数KB)でやっと実行されました。 > (プログラミングのミスか、正しい答えは出ませんでしたが、 > 一応ちゃんと終了しました。) 環境変数 OMNI_SCASH_HEAP_SIZE を設定してみてください. 説明は /opt/omni/doc/omni-scash-extension.html の最後のあたりにあります. from Kameyama Toyohisa From msato @ is.tsukuba.ac.jp Wed Jan 22 14:32:40 2003 From: msato @ is.tsukuba.ac.jp (Mitsuhisa Sato) Date: Wed, 22 Jan 2003 14:32:40 +0900 Subject: [SCore-users-jp] VM Fault out In-Reply-To: <20030122140043.97D6.SUGAWARA@mlab.jks.ynu.ac.jp> References: <20030122094020.97CF.SUGAWARA@mlab.jks.ynu.ac.jp> <20030122113100B.msato@is.tsukuba.ac.jp> <20030122140043.97D6.SUGAWARA@mlab.jks.ynu.ac.jp> Message-ID: <20030122143240O.msato@is.tsukuba.ac.jp> 菅原様、 400MBでも大丈夫なようなきがします。並列プログラムは問題サイズはおおき ければ大きいほど効果があります。 ところで、このプログラムは普通のSMP、たとえばdual CPUのPCでは動かして、 並列化がただしいかについては確認済みなのでしょうか。 ご存知かとおもいますが、Omniでは、-omniconfig=scashのオプションがなけ れば、通常のSMPのコードとなります。 さとう。 From: Taira Sugawara Subject: Re: [SCore-users-jp] VM Fault out Date: Wed, 22 Jan 2003 14:11:16 +0900 > 菅原@横国大です。 > > さとうさんへ。 > 回答ありがとうございました。 > > > 必要なメモリサイズはどの位でしょうか? > > このプログラムは大きな行列を計算対象としているんですが、 > 400MBぐらいは必要です。 > ある程度小さい行列(必要メモリは数MBぐらい) > でもプログラムを走らせようとしたのですが、 > 同様のエラーが出てしまいました。 > 小さい行列(数KB)でやっと実行されました。 > (プログラミングのミスか、正しい答えは出ませんでしたが、 > 一応ちゃんと終了しました。) > > このサイズのものをOpenMPで実行するのは難しいでしょうか? > > > 菅原 平 > 横浜国立大学大学院 環境情報学府 > 情報メディア環境学専攻 情報メディア学コース 松本研究室 > sugawara @ mlab.jks.ynu.ac.jp > _______________________________________________ > SCore-users-jp mailing list > SCore-users-jp @ pccluster.org > http://www.pccluster.org/mailman/listinfo/score-users-jp From a-hasega @ ats.nis.nec.co.jp Wed Jan 22 21:56:40 2003 From: a-hasega @ ats.nis.nec.co.jp (長谷川 篤史) Date: Wed, 22 Jan 2003 21:56:40 +0900 Subject: [SCore-users-jp] VM Fault out References: <20030122052927.1673E20050@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <3E2E9508.5070007@ats.nis.nec.co.jp> 長谷川@NEC情報システムズです。 >>小さい行列(数KB)でやっと実行されました。 >>(プログラミングのミスか、正しい答えは出ませんでしたが、 >>一応ちゃんと終了しました。) > > 環境変数 OMNI_SCASH_HEAP_SIZE を設定してみてください. > 説明は > /opt/omni/doc/omni-scash-extension.html > の最後のあたりにあります. OMPC_DEBUG=1 として実行した場合、共有メモリのメモリ不足でエラーになっ た時に、何らかのエラーメッセージを出力します。 今回の件では、それらしいメッセージが無く、 <1> VM Fault out of DSM area PC=[08048b90]:ADDR=[08c84d40]  # ノード1で、 # 08048b90アドレスの命令が、  # 08c84d40 アクセスしてエラー ということですの、プログラム側に問題がある可能性があります。 問題のアドレスが、data segment のそばですので、領域外の配列を参照し た、もしくは、何処かのノードで malloc したアドレスを別のノードでアクセ スした(SCore用のomniを使う場合は、malloc の変わりに ompsm_gallocを呼ん でください。mallocした領域はsharedになりません)ということはないでしょ うか? デバッガで原因を確認してもらえらば話が早いと思います。 -- 長谷川 篤史 E-Mail:a-hasega @ ats.nis.nec.co.jp 株式会社NEC情報システムズ 基盤ソフトウェア事業部 サイエンス基盤部 外線:03-3798-9991(Fax.03-3798-9198) / 内線:8-115-2410(Fax.8-115-2419) From papakondylis @ chem.uoa.gr Thu Jan 23 00:07:57 2003 From: papakondylis @ chem.uoa.gr (Aristotle Papakondylis) Date: Wed, 22 Jan 2003 17:07:57 +0200 Subject: [SCore-users-jp] [SCore-users] Problem with aic79xx driver Message-ID: <3E2EB3CC.3BD8D764@chem.uoa.gr> I tried to install SCORE 5.2.0 kernel by RPM on my i686 computer but I was told that aic79xx module was not found. It is obvious that this scsi driver is not supported by the kernel. Is it possible to insert the driver into SCORE kernel? Thank you Aristotle Papakondylis e-mail: papakondylis @ chem.uoa.gr apap @ cc.uoa.gr _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From sugawara @ mlab.jks.ynu.ac.jp Thu Jan 23 01:51:24 2003 From: sugawara @ mlab.jks.ynu.ac.jp (Taira Sugawara) Date: Thu, 23 Jan 2003 01:51:24 +0900 Subject: [SCore-users-jp] VM Fault out In-Reply-To: <3E2E9508.5070007@ats.nis.nec.co.jp> References: <20030122052927.1673E20050@neal.il.is.s.u-tokyo.ac.jp> <3E2E9508.5070007@ats.nis.nec.co.jp> Message-ID: <20030123012825.E1A8.SUGAWARA@mlab.jks.ynu.ac.jp> 菅原@横国大です。 亀山さん、さとうさん、長谷川さん、 回答ありがとうございました。 kameyama @ pccluster.org さんは書きました。 > 環境変数 OMNI_SCASH_HEAP_SIZE を設定してみてください. > 説明は > /opt/omni/doc/omni-scash-extension.html > の最後のあたりにあります. 確認しました。 デフォルトでは4kに設定されているみたいですね。 長谷川 篤史 さんは書きました。 > 問題のアドレスが、data segment のそばですので、領域外の配列を参照し > た、もしくは、何処かのノードで malloc したアドレスを別のノードでアクセ > スした(SCore用のomniを使う場合は、malloc の変わりに ompsm_gallocを呼ん > でください。mallocした領域はsharedになりません)ということはないでしょ > うか? calloc使っていました。 mallocと同様にsharedにならないと言うことですよね。 メーリングリストの過去ログ('02/12/2)を見ると freeがないと書いてあったんですが、 すごいメモリを食いそうなのは気のせいでしょうか? 現在dual CPUのマシンで動いているので、 上記2点をふまえてうまくSCore環境に移植できたらと考えています。 いろいろとありがとうございました。 菅原 平 横浜国立大学大学院 環境情報学府 情報メディア環境学専攻 情報メディア学コース 松本研究室 sugawara @ mlab.jks.ynu.ac.jp From ryo @ nal.go.jp Thu Jan 23 09:55:00 2003 From: ryo @ nal.go.jp (Ryoji Takaki) Date: Thu, 23 Jan 2003 09:55:00 +0900 (JST) Subject: [SCore-users-jp] Fortran コンパイラの取扱 Message-ID: <20030123.095500.582746787.ryo@nal.go.jp> はじめまして。高木と申します Score での Fortranコンパイラの扱いについて教えて下さい。 手元にScoreを利用している二つのクラスタシステムA、Bがあります。 Aでは富士通FortranコンパイラonLinux(以下富士通コンパラ)がインストールされており、 このコンパイラが使えるようにScoreが構築されています。 一方、Bには富士通コンパイラはインストールされておらず、Scoreでも富士通コンパイラが使えるようにはなっていません。 この状況で AでScore用にコンパイル、リンクされたロードモジュールをBに持って行った場合BのScore環境で実行できるのでしょうか? (ライセンスの話は別としてとりあえず技術的に可能かどうかを教えて頂きたいのですが) よろしくお願いします。 ■□ 高木 亮治 □■ □■ 航空宇宙技術研究所 ■□ ■□ CFD技術開発センター □■ ■□ http://www.nal.go.jp/cfd/jpn/upacs/ □■ From kameyama @ pccluster.org Thu Jan 23 10:17:08 2003 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Thu, 23 Jan 2003 10:17:08 +0900 Subject: [SCore-users-jp] Fortran コンパイラの取扱 In-Reply-To: Your message of "Thu, 23 Jan 2003 09:55:00 JST." <20030123.095500.582746787.ryo@nal.go.jp> Message-ID: <20030123011708.A751D20040@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <20030123.095500.582746787.ryo @ nal.go.jp> Ryoji Takaki wrotes: > 手元にScoreを利用している二つのクラスタシステムA、Bがあります。 > Aでは富士通FortranコンパイラonLinux(以下富士通コンパラ)がインストールされてお > り、 > このコンパイラが使えるようにScoreが構築されています。 > 一方、Bには富士通コンパイラはインストールされておらず、Scoreでも富士通コンパ > イラが使えるようにはなっていません。 > この状況で > AでScore用にコンパイル、リンクされたロードモジュールをBに持って行った場合BのS > core環境で実行できるのでしょうか? (両方の SCore の version が同一であれば) 実行できます. 通常, SCore のプログラムは (checkpoint のためもあって) static link しますので, 実行に問題はありません. ちなみに, 環境にもよりますが, その 2 つのクラスタの scoreboard の内容を マージして, 一つのホストで動かしておき, (別々の host で環境変数 SCBDSERV で分けるという手もありますが...) compute host の /etc/hosts.equiv か $HOME/.rhosts をいじって その host から rsh を可能にしておけば, 同じホストで クラスタを使い分けることもできます. たとえば, % mpif77 -compiler fujitsu foo.f -o foo % scrun -group=clusterA ./foo % scrun -group=clusterB ./foo というように, clusterA と clusterB で foo を実行できます. from Kameyama Toyohisa From ryo @ nal.go.jp Thu Jan 23 11:46:02 2003 From: ryo @ nal.go.jp (Ryoji Takaki) Date: Thu, 23 Jan 2003 11:46:02 +0900 (JST) Subject: [SCore-users-jp] Fortran コンパイラの取扱 In-Reply-To: <20030123011708.A751D20040@neal.il.is.s.u-tokyo.ac.jp> References: <20030123.095500.582746787.ryo@nal.go.jp> <20030123011708.A751D20040@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <20030123.114602.840814978.ryo@nal.go.jp> From: kameyama @ pccluster.org Subject: Re: [SCore-users-jp] Fortran コンパイラの取扱 Date: Thu, 23 Jan 2003 10:17:08 +0900 Message-ID: <20030123011708.A751D20040 @ neal.il.is.s.u-tokyo.ac.jp> 亀山様; kameyama> (両方の SCore の version が同一であれば) 実行できます. kameyama> 通常, SCore のプログラムは (checkpoint のためもあって) static link しますので, kameyama> 実行に問題はありません. 御回答ありがとうございました。 少し一般的にすると、 Scoreのversionが同じであれば、Scoreのシステム構築、アプリケーションのコンパイル時 等のFortranコンパイラ、Cコンパイラが違っていても アプリケーションプログラムのロードモジュールは共有可能と言うことでしょうか? ■□ 高木 亮治 □■ □■ 航空宇宙技術研究所 ■□ ■□ CFD技術開発センター □■ ■□ http://www.nal.go.jp/cfd/jpn/upacs/ □■ From kameyama @ pccluster.org Thu Jan 23 11:53:26 2003 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Thu, 23 Jan 2003 11:53:26 +0900 Subject: [SCore-users-jp] Fortran コンパイラの取扱 In-Reply-To: Your message of "Thu, 23 Jan 2003 11:46:02 JST." <20030123.114602.840814978.ryo@nal.go.jp> Message-ID: <20030123025326.3E23720050@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <20030123.114602.840814978.ryo @ nal.go.jp> Ryoji Takaki wrotes: > 少し一般的にすると、 > Scoreのversionが同じであれば、Scoreのシステム構築、アプリケーションのコンパイ > ル時 > 等のFortranコンパイラ、Cコンパイラが違っていても > アプリケーションプログラムのロードモジュールは共有可能と言うことでしょうか? はい, そうです. (当然同一 platform である必要はあります. x86 と IA64 の混在とかの場合ですと両方の binary が必要になります.) from Kameyama Toyohisa From kameyama @ pccluster.org Thu Jan 23 12:12:48 2003 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Thu, 23 Jan 2003 12:12:48 +0900 Subject: [SCore-users-jp] Re: [SCore-users] Problem with aic79xx driver In-Reply-To: Your message of "Wed, 22 Jan 2003 17:07:57 JST." <3E2EB3CC.3BD8D764@chem.uoa.gr> Message-ID: <20030123031248.B7D6B20050@neal.il.is.s.u-tokyo.ac.jp> In article <3E2EB3CC.3BD8D764 @ chem.uoa.gr> Aristotle Papakondylis wrotes: > I tried to install SCORE 5.2.0 kernel by RPM on my i686 computer > but I was told that aic79xx module was not found. It is > obvious that this scsi driver is not supported by the kernel. > Is it possible to insert the driver into SCORE kernel? aic9xxx driver is not found in SCore kernel. Also Its driver is not fond in official 2.4.x kernel. But its driver include in 2.5.x kernel from 2.5.54. You can get aic79xx kernel driver source from Adaptec web page: http://www.adaptec.com/worldwide/support/driverdetail.html?sess=no&language=English+US&cat=%2fOperating+System%2fLinux&filekey=aic79xx-1.1.0-source.tar.gz The kernel source RPM for SCore is: 1. If you have CDROM image and it mounted /mnt/cdrom, you can find /mnt/cdrom/score.rpm/kernel-source-score-2.4.18-3SCORE.i386.rpm 2. If you don't have CDROM image, please download from: http://www.pccluster.org/score/dist/pub/score-5.2.0/rpm.redhat7.2.i386/kernel-source-score-2.4.18-3SCORE.i386.rpm The kernel source installed to /usr/src/linux-2.4.18score by the RPM. And please apply following patch: http://www.pccluster.org/score/dist/pub/score-5.2.0/rpm.redhat7.3.i386/kernel-source-score.efi.patch from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From hori @ swimmy-soft.com Fri Jan 24 17:24:07 2003 From: hori @ swimmy-soft.com (Atsushi HORI) Date: Fri, 24 Jan 2003 17:24:07 +0900 Subject: [SCore-users-jp] Fortran コンパイラの取扱 In-Reply-To: <20030123.095500.582746787.ryo@nal.go.jp> References: <20030123.095500.582746787.ryo@nal.go.jp> Message-ID: <3126273847.hori0004@swimmy-soft.com> 堀@スイミー・ソフトウェアです. >Score での Fortranコンパイラの扱いについて教えて下さい。 >手元にScoreを利用している二つのクラスタシステムA、Bがあります。 >Aでは富士通FortranコンパイラonLinux(以下富士通コンパラ)がインストール >されており、 >このコンパイラが使えるようにScoreが構築されています。 >一方、Bには富士通コンパイラはインストールされておらず、Scoreでも富士 >通コンパイラが使えるようにはなっていません。 >この状況で >AでScore用にコンパイル、リンクされたロードモジュールをBに持って行った >場合BのScore環境で実行できるのでしょうか? >(ライセンスの話は別としてとりあえず技術的に可能かどうかを教えて頂きた >いのですが) 富士通コンパイラに限らず,SCore では static(静的)リンクがデフォルト になっているため動く可能性はあります. しかしながらロードモジュール以外に SCore のバージョンや OS カーネルの バージョンの違いにより動かない場合もありますのでご注意ください. ---- 堀 敦史(ほり あつし) スイミー・ソフトウェア株式会社 From k-egg @ gmx.de Fri Jan 24 17:42:07 2003 From: k-egg @ gmx.de (Andreas Vitz) Date: Fri, 24 Jan 2003 09:42:07 +0100 Subject: [SCore-users-jp] Re: [SCore-users] Score 5.0.1: MPE_SetKeyCallback not implemented?? In-Reply-To: <20030122011947.644152004F@neal.il.is.s.u-tokyo.ac.jp> References: <20030122011947.644152004F@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <200301240834.h0O8YnS09192@pccluster.org> Dear Mr Toyohisa; I wrote a mail to mpi-bugs @ mcs.anl.gov, and got following reply: Subject: Re: [MPI #7578] MPICH 1.2.0 and MPE_SetKeyCallback Date: Thu, 23 Jan 2003 12:17:27 -0600 (CST) From: Anthony Chan To: Andreas Vitz Cc: mpi-bugs @ mcs.anl.gov, mpi-maint @ mcs.anl.gov This looks like a bug. You could add xkey.c to the definition of MPEGRAPHICS_SOURCE in mpich-1.2.x/mpe/src/Makefile, and do make again in mpich-1.2.x/mpe/src. This would rebuild all MPE libraries in your MPICH build directory. Let me know if this solve your problem. A.Chan now my question again, how can i "repair" my score 5.01 ?? Thanks Andreas Vitz On Wednesday 22 January 2003 02:19, kameyama @ pccluster.org wrote: > In article <200301211627.h0LGR9S24116 @ pccluster.org> Andreas Vitz wrotes: > > I'm basicly new to score and mpich, and I try out some functions of the > > mpe-library. > > as i try the MPE_SetKeyCallback function i only get > > > > wellen.o: In function `main': > > wellen.o(.text+0x703): undefined reference to `MPE_SetKeyCallback > > > > searching with ar -t in libmpe.a for xkeys.o (this is where teh > > function is implemented) results in no result ;-( > > > > My installation is a Score 5.0.1 standard installation. > > > > now my questiones: > > > > why isn't that function in the precompiled version of the score-mpich ?? > > There is xkey.c in mpich source file. > And MPE_SetKeyCallback defined in it's file. > > But this file dose not compile because its filename is not Makefile.in and > configure. > There is same probrem on (original) mpich 1.2.0, 1.2.4 and 1.2.5. > (I cannot find MPE_SetKeyCallback name in mpe_graphics.h, > MPI documentation files, and > http://www-unix.mcs.anl.gov/ > search.) > > So, SCore 5.2 has same probrem. > > > is ther a easy way to "repair" that leak?? > > I think Probably, it is easy. > But above reason, I don't recommend it. > > from Kameyama Toyohisa > _______________________________________________ > SCore-users mailing list > SCore-users @ pccluster.org > http://www.pccluster.org/mailman/listinfo/score-users _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From kameyama @ pccluster.org Fri Jan 24 18:35:54 2003 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Fri, 24 Jan 2003 18:35:54 +0900 Subject: [SCore-users-jp] Re: [SCore-users] Score 5.0.1: MPE_SetKeyCallback not implemented?? In-Reply-To: Your message of "Fri, 24 Jan 2003 09:42:07 JST." <200301240834.h0O8YiS09190@pccluster.org> Message-ID: <20030124093554.9A41E20050@neal.il.is.s.u-tokyo.ac.jp> In article <200301240834.h0O8YiS09190 @ pccluster.org> Andreas Vitz wrotes: > now my question again, how can i "repair" my score 5.01 ?? Yopu can "repair" it. Please exec following: 1. Please get MPICH/SCore soyrce code. You can get msource code of SCore 5.0.1 when http://www.pccluster.org/score/dist/pub/score-5.0.1/source/score-5.0.0.mpi.tar.gz http://www.pccluster.org/score/dist/pub/score-5.0.1/source/mpi.patch Please download both files. (If you download CDROM image and you mounted this image to /mnt/cdrom, you can find under /mnt/cdrom/score.source 2. Please extract tar file, and apply patch. # cd /opt/score # tar vxzf score-5.0.0.mpi.tar.gz # patch -p0 < mpi.patch 3. Please edit configure to enable MPE_SetKeyCallback You must edit follwing file: score-src/runtime/mpi/mpich-1.2.0/src/mpe/configure Pleasee change following line in configure: MPEGRAPHICS_SOURCE="mpe_graphics.c xcolor.c xframe.c xinit.c xwmap.c xmouse.c" to MPEGRAPHICS_SOURCE="mpe_graphics.c xcolor.c xframe.c xinit.c xwmap.c xmouse.c xkey.c" 4. Please recompile and install mpi library Please execute following commands: # cd /opt/score/score-src/runtime/mpi/mpich-1.2.0 # smake # smake install from Kameyama Toyohisa _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From sugawara @ mlab.jks.ynu.ac.jp Fri Jan 24 21:38:55 2003 From: sugawara @ mlab.jks.ynu.ac.jp (Taira Sugawara) Date: Fri, 24 Jan 2003 21:38:55 +0900 Subject: [SCore-users-jp] SCBD Message-ID: <20030124211801.F1E3.SUGAWARA@mlab.jks.ynu.ac.jp> 横浜国立大学の菅原です。 RedHat7.3 SCore5.2にて、新規にクラスタを構築していたのですが、 scorehosts -l -g all を実行すると、 SCBD: Retrying to connect scoreboard server (server1.pccluster.org:9950) ... とエラーが出てしまいます。 Linux起動時はmsgbservを実行するのに時間がかかっています。 (OKは出ていますが。) 環境変数の設定も確認しましたし、 /etc/hostsおよび/opt/score/etc/pm-ethernet.conf は何度も確認をしたので間違いがないと思います。 どこの設定に問題があるのでしょうか? よろしくお願いいたします。 菅原 平 sugawara @ mlab.jks.ynu.ac.jp From hori @ swimmy-soft.com Fri Jan 24 23:18:13 2003 From: hori @ swimmy-soft.com (Atsushi HORI) Date: Fri, 24 Jan 2003 23:18:13 +0900 Subject: [SCore-users-jp] SCBD In-Reply-To: <20030124211801.F1E3.SUGAWARA@mlab.jks.ynu.ac.jp> References: <20030124211801.F1E3.SUGAWARA@mlab.jks.ynu.ac.jp> Message-ID: <3126295093.hori0001@swimmy-soft.com> 堀@スイミー・ソフトウェアです. >横浜国立大学の菅原です。 > >RedHat7.3 SCore5.2にて、新規にクラスタを構築していたのですが、 >scorehosts -l -g all >を実行すると、 >SCBD: Retrying to connect scoreboard server (server1.pccluster.org:9950) ... >とエラーが出てしまいます。 >Linux起動時はmsgbservを実行するのに時間がかかっています。 >(OKは出ていますが。) >環境変数の設定も確認しましたし、 scoreboard.exe というプロセスが server1.pccluster.org というホスト(こ のホスト名も気になりますが)で動いているでしょうか?この起動に失敗して いる可能性が高いです. /etc/rc.d/init.d/scoreboard および /etc/score.conf の内容を確認してく ださい. ---- 堀 敦史(ほり あつし) スイミー・ソフトウェア株式会社 From h995011b @ mbox.media.nagoya-u.ac.jp Sat Jan 25 01:50:59 2003 From: h995011b @ mbox.media.nagoya-u.ac.jp (Naoshi Ueda) Date: Sat, 25 Jan 2003 01:50:59 +0900 Subject: [SCore-users-jp] Intel Compiler 使用についての質問 Message-ID: <200301250150.DIC52981.22IC9069@mbox.media.nagoya-u.ac.jp> 名古屋大学の上田です. お世話になっております. Intel製Compiler使用に関しての質問があります. SCoreインストール後にFORTRAN Compiler(non-commercial,おそらく ifc7)をインストールし,コンパイラオプションの変更(/opt/score/etc/ compiler/siteの作成)を行い,プログラムをコンパイルしたところ, mpif77 : mpich-1.2.4 is not installed といったエラーが表示され,コンパイルすることができませんでした. (g77ではコンパイル可能でした).SCoreドキュメントの中では,mpich- 1.2.4がデフォルトであると書いてありました./opt/score/mpiの中に mpich-1.2.4はあったのですが,Intelコンパイラを利用するときは,他 に何か記述が必要なのでしょうか? または,メーリングリスト中(Tue, 24 Dec 2002 の亀山様の記述)に, >SCore では gcc と intel compiler は別々の mpi library を作成し >ているので,これは問題にはなりません. とあるので,intel用に別にmpich-1.2.4をインストールさせる必要があ るということでしょうか? また,「MPICH-SCore version 1.0 (ch_score) MPIアプリケーションの コンパイル 」に,mpif90を使用するには,FORTRAN90 コンパイラをイ ン ストールしたうえで、 SCore を再インストールする必要があると書い てあったのですが,やはり再インストールの必要があるのでしょうか? 基本的なことでどこかに記述してあることかもしれないのですが,ご回 答よろしくお願いいたします. ============================ 名古屋大学工学部 コンクリート構造研究室 上田 尚史  Naoshi Ueda E-mail:h995011b @ mbox.media.nagoya-u.ac.jp ============================ From nakata @ bestsystems.co.jp Sat Jan 25 13:50:15 2003 From: nakata @ bestsystems.co.jp (Hisaho Nakata) Date: Sat, 25 Jan 2003 13:50:15 +0900 Subject: [SCore-users-jp] Intel Compiler 使用についての質問 In-Reply-To: <200301250150.DIC52981.22IC9069@mbox.media.nagoya-u.ac.jp> References: <200301250150.DIC52981.22IC9069@mbox.media.nagoya-u.ac.jp> Message-ID: <20030125135015.17760f11.nakata@bestsystems.co.jp> 中田@ベストシステムズです。 > Intel製Compiler使用に関しての質問があります. : > mpif77 : mpich-1.2.4 is not installed > > といったエラーが表示され,コンパイルすることができませんでした. > (g77ではコンパイル可能でした).SCoreドキュメントの中では,mpich- > 1.2.4がデフォルトであると書いてありました./opt/score/mpiの中に > mpich-1.2.4はあったのですが,Intelコンパイラを利用するときは,他 > に何か記述が必要なのでしょうか? score5.2.0-mpich-chscore-intel-5.2.0-3.i386.rpm をインストールしてください。 ======================================================================== 株式会社 ベストシステムズ システムソリューション事業部テクニカルサポート 中田 寿穗 (nakata @ bestsystems.co.jp) 〒110-0016 東京都台東区台東2-18-8 台東K-1ビル 2,3F Tel: 03-5812-1350 Fax: 03-5812-1351 ======================================================================== From sugawara @ mlab.jks.ynu.ac.jp Sun Jan 26 14:07:40 2003 From: sugawara @ mlab.jks.ynu.ac.jp (Taira Sugawara) Date: Sun, 26 Jan 2003 14:07:40 +0900 Subject: [SCore-users-jp] SCBD In-Reply-To: <3126295093.hori0001@swimmy-soft.com> References: <20030124211801.F1E3.SUGAWARA@mlab.jks.ynu.ac.jp> <3126295093.hori0001@swimmy-soft.com> Message-ID: <20030126135529.15F5.SUGAWARA@mlab.jks.ynu.ac.jp> 菅原@横国大です。 確認してみたところscoreboard.exeが起動していませんでした。 手動で起動させてみたところ、以下のようなエラーが出ました。 [root @ server1 init.d]# /opt/score5.2.0/etc/scorehosts.db:34:36: /opt/score//etc/ndconf/0: そのようなファイルやディレクトリはありません SCOREBOARD: Syntax error at line 36 server1.pccluster.org HOST_0 network=gigaethernet,shmem0,shmem1 group=_scoreall_,server,alls smp=2 msgbserv=(server1.pccluster.org:8764) SCOREBOARD: Attribute 'HOST_0' has no value. [root @ server1 init.d]# また、/etc/score.confの内容ですが以下のようになっています。 SCBDSERV=server1.pccluster.org SCOUTGROUP=_scoreall_ 原因わかりますでしょうか? 菅原 平 横浜国立大学大学院 環境情報学府 情報メディア環境学専攻 情報メディア学コース 松本研究室 sugawara @ mlab.jks.ynu.ac.jp From kameyama @ pccluster.org Mon Jan 27 10:35:33 2003 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Mon, 27 Jan 2003 10:35:33 +0900 Subject: [SCore-users-jp] SCBD In-Reply-To: Your message of "Sun, 26 Jan 2003 14:07:40 JST." <20030126135529.15F5.SUGAWARA@mlab.jks.ynu.ac.jp> Message-ID: <20030127013533.38A3220050@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <20030126135529.15F5.SUGAWARA @ mlab.jks.ynu.ac.jp> Taira Sugawara wrotes: > [root @ server1 init.d]# /opt/score5.2.0/etc/scorehosts.db:34:36: /opt/score//e > tc/ndconf/0: そのようなファイルやディレクトリはありません > SCOREBOARD: Syntax error at line 36 > server1.pccluster.org HOST_0 network=gigaethernet,shmem0,shmem1 group=_scorea > ll_,server,alls smp=2 msgbserv=(server1.pccluster.org:8764) > SCOREBOARD: Attribute 'HOST_0' has no value. > [root @ server1 init.d]# compute host の設定がおわってから server の setup を行わなかったのだと 思いますが... http://www.pccluster.org/score/dist/score/html/ja/installation/eit.html#additional にしたがって compute host の追加作業を行い, 実際の host の install を行わないで Cluster Setup から next を押して server setup を実行してください. from Kameyama Toyohisa From sugawara @ mlab.jks.ynu.ac.jp Mon Jan 27 11:07:23 2003 From: sugawara @ mlab.jks.ynu.ac.jp (Taira Sugawara) Date: Mon, 27 Jan 2003 11:07:23 +0900 Subject: [SCore-users-jp] SCBD In-Reply-To: <20030127013533.38A3220050@neal.il.is.s.u-tokyo.ac.jp> References: <20030126135529.15F5.SUGAWARA@mlab.jks.ynu.ac.jp> <20030127013533.38A3220050@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <20030127105356.160F.SUGAWARA@mlab.jks.ynu.ac.jp> 菅原@横国大です。 > compute host の設定がおわってから server の setup を行わなかったのだと > 思いますが... > http://www.pccluster.org/score/dist/score/html/ja/installation/eit.html#additional > にしたがって compute host の追加作業を行い, 実際の host の install を行わないで > Cluster Setup から next を押して server setup を実行してください. さすがにそれはないと思うのですが…。 念のためもう一度Serverのインストール作業をしてみましたが、 やはりうまく動きません。 また、pm-ethernet.confの内容も1行目の「unit 0」のみになってしまい、 前回書き込んだものが消えてしまいました。 以前、インストールした際にはこのファイルの内容は 自動で生成されていたような気がしたのですが、 これは勘違いでしょうか? 菅原 平 横浜国立大学大学院 環境情報学府 情報メディア環境学専攻 情報メディア学コース 松本研究室 sugawara @ mlab.jks.ynu.ac.jp From kameyama @ pccluster.org Mon Jan 27 11:36:13 2003 From: kameyama @ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Mon, 27 Jan 2003 11:36:13 +0900 Subject: [SCore-users-jp] SCBD In-Reply-To: Your message of "Mon, 27 Jan 2003 11:07:23 JST." <20030127105356.160F.SUGAWARA@mlab.jks.ynu.ac.jp> Message-ID: <20030127023613.E98832004F@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <20030127105356.160F.SUGAWARA @ mlab.jks.ynu.ac.jp> Taira Sugawara wrotes: > > compute host の設定がおわってから server の setup を行わなかったのだと > > 思いますが... > > http://www.pccluster.org/score/dist/score/html/ja/installation/eit.html > #additional > > にしたがって compute host の追加作業を行い, 実際の host の install を行わな > いで > > Cluster Setup から next を押して server setup を実行してください. > > さすがにそれはないと思うのですが…。 > 念のためもう一度Serverのインストール作業をしてみましたが、 > やはりうまく動きません。 > また、pm-ethernet.confの内容も1行目の「unit 0」のみになってしまい、 > 前回書き込んだものが消えてしまいました。 余計ひどくなってしまったようですね... > 以前、インストールした際にはこのファイルの内容は > 自動で生成されていたような気がしたのですが、 > これは勘違いでしょうか? 自動生成するはずなんですが... 何かエラーは出ていなかったでしょうか? (もしくは load をおさなかったとか, The following computer lists have been installed: で No をおさなかったとか... from Kameyama Toyohisa From kgrunau @ ifm.uni-kiel.de Wed Jan 29 23:44:41 2003 From: kgrunau @ ifm.uni-kiel.de (Kai Grunau) Date: Wed, 29 Jan 2003 15:44:41 +0100 (MET) Subject: [SCore-users-jp] [SCore-users] NIS -> Ldap Message-ID: hi, we have a pc-cluster with one frond-end computer and eight compute nodes. The company, where we bought the system, installed NIS as user-administration tool. Now we want to use LDAP. There is no problem to activate the LDAP mechanism on the front-end node. But on the eight nodes are missing some packages : ---------------------------- nss_ldap-185-1.i386.rpm nscd-2.2.5-34 ....... ---------------------------- Is there a problem to install the required additional packages? Is there someone who knows which packes are required ? Greetings Kai Grunau _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From k-egg @ gmx.de Fri Jan 31 22:22:24 2003 From: k-egg @ gmx.de (Andreas Vitz) Date: Fri, 31 Jan 2003 14:22:24 +0100 Subject: [SCore-users-jp] [SCore-users] score, myrinet & leak of bandwith ?? Message-ID: <200301311314.h0VDEnS01587@pccluster.org> Hello Score Group! Is there a known problem with score5.0.1 and maximum transferrate's on myrinet-cards?? Our cluster uses PCI64B 133MHz Myrinet Cards. (FC version) I expect a rate for large messages at about 236 MByte/s. ( http://www.myricom.com/myrinet/performance/index.html) Benchmarking our cluster with a PinPong-test from PMB (http://www.pallas.com/e/products/pmb/index.htm) results in following table #--------------------------------------------------- # Benchmarking PingPing # ( #processes = 2 ) # ( 2 additional processes waiting in MPI_Barrier) #--------------------------------------------------- #bytes #repetitions t[usec] Mbytes/sec 0 1000 3.73 0.00 1 1000 3.79 0.25 2 1000 3.89 0.49 4 1000 3.89 0.98 8 1000 4.00 1.91 16 1000 4.03 3.78 32 1000 4.12 7.41 64 1000 4.47 13.66 128 1000 4.82 25.34 256 1000 5.69 42.90 512 1000 6.85 71.30 1024 1000 8.98 108.79 2048 1000 13.30 146.83 4096 1000 20.91 186.81 8192 1000 34.21 228.40 16384 1000 64.97 240.51 32768 1000 121.45 257.31 65536 640 291.85 214.15 131072 320 770.79 162.17 262144 160 1529.62 163.44 524288 80 3166.46 157.90 1048576 40 6329.02 158.00 2097152 20 12631.95 158.33 4194304 10 25504.80 156.83 the expexted 236 mb/s for large messages aren't reached. Anybody an Idea?? Further information: we use: - Intel(R) Xeon(TM) CPU 1700MHz - with Supermicro Mainboards P4DC6 - and 1GB ram Andreas Vitz _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users From hori @ swimmy-soft.com Fri Jan 31 23:08:22 2003 From: hori @ swimmy-soft.com (Atsushi HORI) Date: Fri, 31 Jan 2003 23:08:22 +0900 Subject: [SCore-users-jp] Re: [SCore-users] score, myrinet & leak of bandwith ?? In-Reply-To: <200301311314.h0VDEnS01587@pccluster.org> References: <200301311314.h0VDEnS01587@pccluster.org> Message-ID: <3126899302.hori0001@swimmy-soft.com> Hi. >Is there a known problem with score5.0.1 and maximum transferrate's on >myrinet-cards?? Have you tried with mpi_zerocopy=on option ? This option enables zero-copy message transferof PM and you will get much better transfer rate. % mpirun -np -score mpi_zerocopy=on a.out ---- Atsushi HORI Swimmy Software, Inc. _______________________________________________ SCore-users mailing list SCore-users @ pccluster.org http://www.pccluster.org/mailman/listinfo/score-users