[SCore-users-jp] Point-to-Point テストが失敗

i05166 @ sr.kagawa-nct.ac.jp i05166 @ sr.kagawa-nct.ac.jp
2010年 1月 28日 (木) 13:59:30 JST


香川高専詫間キャンパスの柳本と申します。
亀山様、以前の質問のご回答ありがとうございました。

「PC Cluster Consortium」の「RPMファイルによるインストール」を参考にRPMによ
るインストールを行いました。
SCOUTテストはエラーもなく実行できたのですが、Point-to-Pointテストで失敗して
しまいます。

以下はそのときのログです。

○一つ目のウィンドウ
[root @ server ~]# rpmtest comp1 ethernet -dest 1 -ping
Ethernet PM context #0 information (unit 0)
 channel 0 descripter information
  rx_p=00000000, rx_c=00000000, rx_bp=00000000, rx_bc=00000000
  tx_p=00000001, tx_c=00000000, tx_bp=00000080, tx_bc=00000000

 channel 0 statistics information
  st_txmit=00000000, st_rexmit=ff0101ff, st_xmit_ctl=00000000
  st_xmit_ack=ffffffff st_xmit_lost=cda4444c, st_xmit_stop=cda4444c
  st_xmit_err=0c000000, st_xmit_received=0508ec34, st_rcv_valid=dea7e2a2
  st_rcv_ackonly=00000000, st_rcv_igonore=00000001, st_rcv_lose=ff0101ff
  st_rcv_ov=00000000,st_rcv_ov=ffffffff
  st_rcv_stop=00000000, st_rcv_go=00000001
*** glibc detected *** double free or corruption (out): 0x08110ac8 ***

○2つ目のウィンドウ
[root @ server ~]# rpmtest comp2 ethernet -reply
Ethernet PM context #0 information (unit 0)
 channel 0 descripter information
  rx_p=00000000, rx_c=00000000, rx_bp=00000000, rx_bc=00000000
  tx_p=00000000, tx_c=00000000, tx_bp=00000000, tx_bc=00000000

 channel 0 statistics information
  st_txmit=00000000, st_rexmit=ff0101ff, st_xmit_ctl=00000000
  st_xmit_ack=ffffffff st_xmit_lost=c8a8444c, st_xmit_stop=c8a8444c
  st_xmit_err=0c000000, st_xmit_received=0508b71f, st_rcv_valid=dea7e2a3
  st_rcv_ackonly=00000000, st_rcv_igonore=00000001, st_rcv_lose=ff0101ff
  st_rcv_ov=00000000,st_rcv_ov=ffffffff
  st_rcv_stop=00000000, st_rcv_go=00000001
*** glibc detected *** double free or corruption (out): 0x08110ac8 ***

アーカイブの「SCOUTのテストについて」と似たような状況と思うのでそれを参考に
調べました。

1. rpm の install は
       ./bininstall -compute
   で行ったでしょうか?
=>はい

2. rpm -qa | grep score
   で score6.0.0-comp はでてきますでしょうか?
=>score6.0.2-comp-6.0.2-2ならあります。

3. /opt/score/6.0.0/modules
   はありますでしょうか?
=>/opt/score/6.0.2/modulesはあります。

4. /lib/module/`uname -r`/extra/score+pm
   はありますでしょうか?
   その中に tg3_scorepm1.ko はありますでしょうか?

[root @ comp1 linux2.6]# /opt/score/install/linux2.6/netdev -a
eth0 sis900
[hoge @ host1 ~]$ ls /lib/modules/2.6.9-42.ELsmp/extra/score+pm/
allocator_ex_dev.ko  infini_sm_dev.ko        pm_ethernet_loader.ko
tg3_scorepm1.ko
e1000_scorepm1.ko    pm_ethernet2.ko         pm_memory.ko
e100_scorepm1.ko     pm_ethernet2_mem.ko     pm_myrinet.ko
infini_dev.ko        pm_ethernet_dev_nkp.ko  pm_shmem.ko

システムの構成と仕様は以下のようになっています。

[構成]
サーバホスト1台、計算ホスト3台
server        150.15.99.140
comp1        150.15.99.141
comp2        150.15.99.142
comp3        150.15.99.143

[仕様]
OS        Centos 4.4
CPU        Celeron 2.5GHz
Memory        512MB
Mother        ASUS P4S533-MX
LAN        onboard(SIS900 FastEthernet)

このエラーの解決策をご存じの方がいらっしゃいましたらご教授いただけないでしょ
うか。
お忙しいところ恐縮ですが、よろしくお願いします。






SCore-users-jp メーリングリストの案内