[SCore-users-jp] Point-to-Point テストが失敗
i05166 @ sr.kagawa-nct.ac.jp
i05166 @ sr.kagawa-nct.ac.jp
2010年 1月 28日 (木) 13:59:30 JST
香川高専詫間キャンパスの柳本と申します。
亀山様、以前の質問のご回答ありがとうございました。
「PC Cluster Consortium」の「RPMファイルによるインストール」を参考にRPMによ
るインストールを行いました。
SCOUTテストはエラーもなく実行できたのですが、Point-to-Pointテストで失敗して
しまいます。
以下はそのときのログです。
○一つ目のウィンドウ
[root @ server ~]# rpmtest comp1 ethernet -dest 1 -ping
Ethernet PM context #0 information (unit 0)
channel 0 descripter information
rx_p=00000000, rx_c=00000000, rx_bp=00000000, rx_bc=00000000
tx_p=00000001, tx_c=00000000, tx_bp=00000080, tx_bc=00000000
channel 0 statistics information
st_txmit=00000000, st_rexmit=ff0101ff, st_xmit_ctl=00000000
st_xmit_ack=ffffffff st_xmit_lost=cda4444c, st_xmit_stop=cda4444c
st_xmit_err=0c000000, st_xmit_received=0508ec34, st_rcv_valid=dea7e2a2
st_rcv_ackonly=00000000, st_rcv_igonore=00000001, st_rcv_lose=ff0101ff
st_rcv_ov=00000000,st_rcv_ov=ffffffff
st_rcv_stop=00000000, st_rcv_go=00000001
*** glibc detected *** double free or corruption (out): 0x08110ac8 ***
○2つ目のウィンドウ
[root @ server ~]# rpmtest comp2 ethernet -reply
Ethernet PM context #0 information (unit 0)
channel 0 descripter information
rx_p=00000000, rx_c=00000000, rx_bp=00000000, rx_bc=00000000
tx_p=00000000, tx_c=00000000, tx_bp=00000000, tx_bc=00000000
channel 0 statistics information
st_txmit=00000000, st_rexmit=ff0101ff, st_xmit_ctl=00000000
st_xmit_ack=ffffffff st_xmit_lost=c8a8444c, st_xmit_stop=c8a8444c
st_xmit_err=0c000000, st_xmit_received=0508b71f, st_rcv_valid=dea7e2a3
st_rcv_ackonly=00000000, st_rcv_igonore=00000001, st_rcv_lose=ff0101ff
st_rcv_ov=00000000,st_rcv_ov=ffffffff
st_rcv_stop=00000000, st_rcv_go=00000001
*** glibc detected *** double free or corruption (out): 0x08110ac8 ***
アーカイブの「SCOUTのテストについて」と似たような状況と思うのでそれを参考に
調べました。
1. rpm の install は
./bininstall -compute
で行ったでしょうか?
=>はい
2. rpm -qa | grep score
で score6.0.0-comp はでてきますでしょうか?
=>score6.0.2-comp-6.0.2-2ならあります。
3. /opt/score/6.0.0/modules
はありますでしょうか?
=>/opt/score/6.0.2/modulesはあります。
4. /lib/module/`uname -r`/extra/score+pm
はありますでしょうか?
その中に tg3_scorepm1.ko はありますでしょうか?
[root @ comp1 linux2.6]# /opt/score/install/linux2.6/netdev -a
eth0 sis900
[hoge @ host1 ~]$ ls /lib/modules/2.6.9-42.ELsmp/extra/score+pm/
allocator_ex_dev.ko infini_sm_dev.ko pm_ethernet_loader.ko
tg3_scorepm1.ko
e1000_scorepm1.ko pm_ethernet2.ko pm_memory.ko
e100_scorepm1.ko pm_ethernet2_mem.ko pm_myrinet.ko
infini_dev.ko pm_ethernet_dev_nkp.ko pm_shmem.ko
システムの構成と仕様は以下のようになっています。
[構成]
サーバホスト1台、計算ホスト3台
server 150.15.99.140
comp1 150.15.99.141
comp2 150.15.99.142
comp3 150.15.99.143
[仕様]
OS Centos 4.4
CPU Celeron 2.5GHz
Memory 512MB
Mother ASUS P4S533-MX
LAN onboard(SIS900 FastEthernet)
このエラーの解決策をご存じの方がいらっしゃいましたらご教授いただけないでしょ
うか。
お忙しいところ恐縮ですが、よろしくお願いします。
SCore-users-jp メーリングリストの案内