[SCore-users-jp] SCore7 beta4におけるpmxtestについて教えてください

Hiroaki Shibata shibata.hiroaki @ jp.fujitsu.com
2010年 8月 11日 (水) 14:57:16 JST


富士通九州システムズ)柴田です。

SCore7 beta4 の環境を構築し、pmxtestを実施しているのですが
正常に終了せず、困っております。ネットワーク関連の設定がら
みではないかと思うのですが、ご助言をお願いできますでしょうか。

環境はSCore7 beta4 を DVDから bininstall -server 及び
bininstall -clientでインストールしております。また、
NICドライバがigbで、インストール後にOSが起動しなかったので
/lib/modules/2.6.18-164.el5/extra/score+pm/igb_pmx.ko
削除しています。

Compute Host は pcc1〜pcc4の4台なのですが、
そのうちの2台(pcc1,pcc2)をmachinefile1_2に記述し
scout -g machinefile1_2 -e pmxtest -iter 1 -network ethernet
を実行すると、
#### TEST SUCCEEDED ####
が出力され、正常に終了します。
また同様に、残りの2台(pcc3,pcc4)をmachinefile3_4に記述し
scout -g machinefile3_4  -e pmxtest -iter 1 -network ethernet
を実行しても正常に終了します。
その他、pcc1,2,3,4から2台を組み合わせるパターンでは、全て正常
に終了しました。

しかし、machinefile1_4に4台のマシン(pcc1,2,3,4)を記述して
scout -g machinefile1_4 -e pmxtest -iter 1 -network ethernet
を実行すると、最初は問題ないのですが、

-----------------------------------------------------------
	・
	・
	・
[2->3->2] 1.4KB .. 5.08 KP/s (2600 pkt)  196.94 us/p  7.41 MB/s
[3->0->3] 1.4KB .. 5.05 KP/s (2600 pkt)  198.06 us/p  7.37 MB/s
[3->1->3] 1.4KB .. 5.00 KP/s (2600 pkt)  199.85 us/p  7.31 MB/s

Send&Recv, Peer-to-Peer, Burst Communication
[3->2->3] 1.4KB .. 5.08 KP/s (2600 pkt)  196.93 us/p  7.41 MB/s
-----------------------------------------------------------

と出力されたところで毎回止まってしまいます。

Compute Host は8CPUのマシンでNICがeth0,eth1の2枚ささっています。
2台指定では問題なく動くため、原因が推測できておりません。上記の
ような現象はどのような場合に発生するのかをお教え願えますでしょうか。

なお、Compute Hostのdmesgに、
** PM/Ethernet WARNING: Header Checksum error: from 3 (head 11e8cd != calc 
ff0219cf) ignored
が大量に出力されていますが、過去ログを拝見したところでは、再送して
問題ないという意味と考えております。


以上、よろしくお願いいたします。
---
柴田 裕昭(shibata.hiroaki @ jp.fujitsu.com)




SCore-users-jp メーリングリストの案内