[SCore-users-jp] Re: [SCore-users-jp] Re: [SCore-users-jp] Myrinet テストの失敗

Shinji Sumimoto s-sumi @ flab.fujitsu.co.jp
2002年 4月 11日 (木) 15:21:50 JST


榎本様

住元です。

情報ありがとうございます。頂いた情報から、Myrinet自体は正常に初期化され
ていることがわかりました。

ただ、現状のPM/MyrinetはPCI64Bまでの稼働を想定したため、Myrinet上のCPUの
動作周波数がPCI 33MHzの場合は133MHzまでに制限されています。これについて
は、別途対応します。

From: "Hiroshi Enomoto" <Enomoto.Hiroshi @ wrc.melco.co.jp>
Subject: [SCore-users-jp] Re: [SCore-users-jp] Re: [SCore-users-jp] Myrinet テストの失敗
Date: Thu, 11 Apr 2002 14:14:48 +0900
.Hiroshi> 下記コマンドの実行結果を送ります。何かここから得られる情報があれば、
.Hiroshi> お願いします。
.Hiroshi> ----------------------------------------------------------------
.Hiroshi> page_size=4096, page_mask=fff, page_shift=12
.Hiroshi> LANai(0): fd=512, size=2097152, sts=0xf
.Hiroshi> LANai(0): clockval=032072a0, cpu_version=0902
.Hiroshi> LANai(0): board_id=00:60:dd:7f:3e:97
.Hiroshi> LANai(0): sram_size=00200000
.Hiroshi> LANai(0): fpga_version="Thu Dec  9 16:13:40 1999"
.Hiroshi> LANai(0): more_version=""
.Hiroshi> LANai(0): delay_line_value=0000, board_type=0003, bus_type=0002
.Hiroshi> LANai(0): product_code=0073, serial_number=00019005
.Hiroshi> LANai(0): board_label="M3F-PCI64C-2-102405"
.Hiroshi> LANai(0): max_lanai_speed=202
.Hiroshi> LANai(0): future_use=ffff ffff ffff ffff ffff ffff ffff 
.Hiroshi> LANai(0): size of myriUnitCommon=2000[200+1024+(6968)]
.Hiroshi> [1] routing:
.Hiroshi> [1]    0: 00000000000081, 7
.Hiroshi> [1]    1: 00000000000080, 7
.Hiroshi> [1]    2: 000000000000bf, 7
.Hiroshi> [1]    3: 000000000000be, 7
.Hiroshi> 
.Hiroshi> LANai(0): set to clockmpx=4 (calculated=6)
.Hiroshi> [1] 23 contexts
.Hiroshi> [1] Ctx(0x83d1cc8): sys=0x40192000, usr=0x401a6000, shared=0x401ac000
.Hiroshi> [1] Ctx(0x83d1cc8): comm=0x40157000, reg=0x40159000
.Hiroshi> [0] size of SharedContext=20000[2176+6016+57344+65536]
.Hiroshi> [0] Ctx(0x83d1cc8): phys_addr=ff60000, send=0x401ae000, recv=0x401bc000
.Hiroshi> [0] size of LANaiContext=14000[308+50816+(6220)+28+16384+(8164)]
.Hiroshi> [0] CPU Clock=2209.61MHz, LANai Clock=133.779MHz
.Hiroshi> 
.Hiroshi> ---------------------------------------------------------------

さて、以下の現象ですが、マザーボード(+chipset)とMyrinetのハード的な相
性の問題と考えられます。通常は、榎本さんが指摘されているような問題は発生
しません。しかしながら、時おりチップセットとマザーボードの組合せにより、
ご指摘の問題が発生する場合があります。

.Hiroshi> ところで、
.Hiroshi> Myrinet 及びEthernetNICの位置を変えたところ、計算ホストがブート
.Hiroshi> できず途中で止まってしまう現象が見つかりました。(サーバーは大丈夫です)
.Hiroshi> 
.Hiroshi> ・全PCで、NICの位置は合わせなければいけない?
.Hiroshi> ・インストール時の位置から変えてはいけない?
.Hiroshi> 
.Hiroshi> などの疑問が浮かびます。これがMyrinetのテストと関係しているのかは
.Hiroshi> わからないですが、とりあえず色々位置を変えて、ブートできなくなるパターン
.Hiroshi> を調べようと思います。

これは、サーバではノードと同じスロット搭載位置でもブートするということで
しょうか? 止まる位置はどの場所でしょうか?よろしければ、止まる直前のコ
ンソールの出力をお教え願いたいのですが、、

もし、同じ構成でサーバのみ稼働する場合は、ノードとサーバで何かハードウェ
ア構成(nicの種類など)が違うと言うことはありますでしょうか?

以上、宜しくお願いします。
------
Shinji Sumimoto, Fujitsu Labs



SCore-users-jp メーリングリストの案内