[SCore-users-jp] 【ネットワークトランキング】テスト評価&チップセット

Shinji Sumimoto s-sumi @ flab.fujitsu.co.jp
2003年 1月 5日 (日) 17:17:57 JST


富士通研の住元です。

From: "金城 尚志" <e973220 @ eve.u-ryukyu.ac.jp>
Subject: [SCore-users-jp] 【ネットワークトランキング】テスト評価&チップセット
Date: Thu, 2 Jan 2003 15:53:43 +0900
Message-ID: <JOELIPBDDCMFGIHFCNCNAEBLCDAA.e973220 @ eve.u-ryukyu.ac.jp>

e973220> あけましておめでとうございます。
e973220> 琉球大の金城です。
e973220> 
e973220> 
e973220> 早速ですが、また質問をさせてもらってもよろしいでしょうか。
e973220> どうかよろしくおねがいします。
e973220> 
e973220> 
e973220> ━━━━━━━━━━━━━━━━━━━━━━━━
e973220> 【質問1:Test Procedure of Multiple Networkの評価】
e973220> ━━━━━━━━━━━━━━━━━━━━━━━━
e973220> 
e973220> Network Trunking機構(PM/Ethernet)のシステム管理者ガイド
e973220> http://www.pccluster.org/score/dist/score/html/ja/reference/pm/ether-trunkin
e973220> g.html#rcstest
e973220> を参考にrcstestを実行しました。
e973220> そうしたら次のようなメッセージがでてきました。
e973220> このメッセージをどのように評価したらよいのでしょうか?
e973220> NIC4枚でのネットワークトランキングの設定はできているのでしょうか?
e973220> アスタリスクとドットの間隔が、ガイドに掲載されているメッセージとは
e973220> 異なっている点が気になります。

この出力は、"*"が送信、"."が受信を表しています。1文字当たり10000パケッ
トです。単に送受信のパケット数を示しているだけなので、途中で途切れなけ
れば気にする必要はありません。

e973220> -------メッセージ(はじまり)--------------------
e973220> 
e973220> starting master 0 : pe=8
e973220> starting slave:  4 5 1 2 3 6 7.
e973220> testing*.*.**.*.*.*.*.**..**.*..*.**.*..*.**.*.**.*.**.*.*.**.*.*.*.*.*.*.*.
e973220> *.*.**.*.**.*.*.**..**.**.*.*.**.*.*.*.*.*.**.*.*.**.*.*.**.*.*.*.**.*.*.*.*
e973220> *.*.*.**.*.*.**.**.*.*.**.*.*.**.*.*.*.*.*.**.*.*.*.*.*.comp7( 7) Signal:
e973220> Interrupted system call(4)
e973220> comp5( 5) Signal: Interrupted system call(4)
e973220> comp6( 6) Signal: Interrupted system call(4)
e973220> comp4( 4) Signal: Interrupted system call(4)
e973220> comp3( 3) Signal: Interrupted system call(4)
e973220> comp2( 2) Signal: Interrupted system call(4)
e973220> comp0( 0) Signal: Interrupted system call(4)
e973220> comp1( 1) Signal: Interrupted system call(4)
e973220> 
e973220> -------メッセージ(おわり)--------------------
e973220> 
e973220> 
e973220> 
e973220> 【補足】
e973220> Network Trunking機構(PM/Ethernet)のシステム管理者ガイド
e973220> http://www.pccluster.org/score/dist/score/html/ja/reference/pm/ether-trunkin
e973220> g.html
e973220> を参考にNIC4枚でのクラスタを構築しました。
e973220> 設定は上のガイドの通りに行いましたが、ただpm-ethernet-[0-4].confの作成につい
e973220> ては
e973220> 次のコマンドオプションで行いました。
e973220> # mkpmethernetconf -unit 0 -speed 100 -device eth0 -g sougen
e973220> pm-ethernet-0.conf
e973220> ( sougen はグループ名)
e973220> 
e973220> (参考:ガイドのコマンドオプション)
e973220> # mkpmethernetconf -unit 0 -speed 100 -device eth0 pm-udp.conf
e973220> pm-ethernet-0.conf
e973220> 
e973220> 
e973220> 
e973220> 
e973220> ━━━━━━━━━━━━━━━━━━━━━━━━
e973220> 【質問2:VIAのチップセット】
e973220> ━━━━━━━━━━━━━━━━━━━━━━━━
e973220> 
e973220> Network Trunking機構(PM/Ethernet)のシステム管理者ガイドに
e973220> 次のような記述があります。
e973220> >Comments: VIAのチップセットを用いたNICは2枚以上ではハードウェアエラーのため
e973220> 動作しませんでした。
e973220> 
e973220> これはNICのチップセットのことなのでしょうか?それともマザーボードの
e973220> チップセットのことなのでしょうか?

これは、VIAの”VI AVT86C100 Rhien".NICのことです。

e973220> すみません、ハードウェアについても無知なためよくわかりません。
e973220> が、アスキーデジタル用語辞典に書いてあるとおり、
e973220> http://yougo.ascii24.com/gh/00/000070.html
e973220> チップセットとは、マザーボードのチップセットをさすのでしょうか?

e973220> ━━━━━━━━━━━━━━━━━━━━━━━━
e973220> 【まとめ:なぜ上記の質問をしたのか】
e973220> ━━━━━━━━━━━━━━━━━━━━━━━━
e973220> 
e973220> 実は、計算ホストへNICを1枚ずつの時、
e973220> 計算ホストへNICを2枚ずつの時、
e973220> 計算ホストへNICを3枚ずつの時、
e973220> 計算ホストへNICを4枚ずつの時と
e973220> して、NPB(Nas Parallel Benchmarks)を実行させて
e973220> 見ました。
e973220> 
e973220> そうすると、計算ホストが8台の時、
e973220> NIC2枚、NIC3枚、NIC4枚の時の結果が
e973220> ほぼ同じだったのです。
e973220> 
e973220> 
e973220> なので、僕のネットワークトランキング機構の設定が
e973220> 間違っているのか、それともハードウェアが悪いのかを
e973220> はっきりさせたいのです。

まず、rpmtestでバンド幅性能が向上しているかを確認してください。性能向
上していない場合は、pm-ethernet.confの設定でmaxnsend, backoffの値を変
えて性能が変わるか見てください。

LU Class A だとそんなに差はでないと思います。Class BのIS, FT, CGくらい
を試すのが良いと思います。

e973220> 【参考】
e973220> NPBのLUのログを書きに示します。
e973220> 計算ホストの数、NICの数を変えていってログを取りました。
e973220> 1、2、4、8は計算ホストの数です。NIC-1, NIC-2 ,,, はNICの数です。
e973220> 
e973220> NPB2.4	LU	Class=A
e973220> 
e973220> 	1		2		4		8
e973220> NIC-1	271.228		496.384		697.825		1224.17
e973220> NIC-2	271.904		516.218		907.962		1423.96
e973220> NIC-3	272.097		518.271		892.178		1414.24
e973220> NIC-4	272.394		524.728		901.533		1429.2
e973220> 
e973220> (それぞれのログの数値は10回計測してその平均をとりました)
e973220> 
e973220> 
e973220> 
e973220>   ━┛━┛━┛━┛━┛━┛━┛━┛━┛
e973220>   琉球大学理学部 物質地球科学科
e973220>   金城 尚志 (キンジョウヒサシ)
e973220>   ━┛━┛━┛━┛━┛━┛━┛━┛━┛
e973220> 
e973220> _______________________________________________
e973220> SCore-users-jp mailing list
e973220> SCore-users-jp @ pccluster.org
e973220> http://www.pccluster.org/mailman/listinfo/score-users-jp
e973220> 
------
Shinji Sumimoto, Fujitsu Labs



SCore-users-jp メーリングリストの案内