[SCore-users-jp] デモでのXIO error

Kameyama Toyohisa kameyama @ pccluster.org
2009年 10月 16日 (金) 18:36:11 JST


亀山です.

KAMEI YUUSUKE Wrote:
> 現在のクラスタの環境は以下のとおりです。
> サーバマシン:server.machine.ac.jp
> ホストマシン:host00.machine.ac.jp
> 	      host01.machine.ac.jp
> CentOS4.4にScore6.0.2をRPMからインストールしました。
> 
> 動作確認のため以下のようにpmandelのデモプログラムを実行しました。
> #export DISPLAY=server.machine.ac.jp:0.0

結論からいうと, 手動で DISPLAY 環境変数を設定するのをやめてみてください.

> #scout –g pcc
> #scrun –nodes=2x4 /opt/score/demo/bin/pmandel
> すると以下のように表示され、強制終了しないと止まらなくなります。
> 
> /usr/X11R6/bin/xauth: (argv):1: bad display name “bronto.hpc.cs.ritsumei.ac.jp/unix:” in “list” command
> Score-D 6.0.2 connected.
> <0:0> SCORE: 8 nodes (2x4) ready.
> XIO:  fatal IO error 104 (Connection reset by peer) on X server “server.machine.ac.jp:10.0”
>      After 0 requests ( 0 known processed) with 0 events remaining.
> 
> また、このときディスプレイ番号がなぜか10となっています。
> #printenv DISPLAY を行った結果は
> server:0.0
> となります。
> pmandel実行時にディスプレイ番号が0でなく10と表示されるのは
> 問題ないのでしょうか。

それは問題ありません.

これは SCore 6.0.1 のリリースノート
     http://www.pccluster.org/faq/ja/release/new6-0-1.html
に記述されている,
    2. X11 relay 復活
       SCore プログラムが X11 を使用するとき、ssh 経由や TCP が使用できない
       X server でも使用できるようにしました。
と関連しています.

Cluster 上で動く program が手元の X の画面に表示するとき,
昔でしたら, 環境変数 DISPLAY を
    server:0
などと指定してやれば表示できました.
これは, cluster 上で X を表示する host が手元の X server に対して
TCP で接続を行って実現しています.

しかし, 最近では, 実は手元の host が遠いところにあって, ssh で入っているので,
直接は TCP で接続できないとか Centos で login で X が立ち上がるように
しておくと, TCP の接続を見にいかないようになっているとかで,
cluster 上の program が直接手元の X server と TCP 接続できないことが
多いです.

そこで, SCore 6.0.1 では scout が X server の代わりに TCP の接続先となり,
本物の X server からは scout を行ったホストで X のプログラムが
動いているように見せかけるようにした, というのがこのリリースノートの意味です.

xauth は X の client を動かすときに認証を行う key を操作するための
コマンドです.
scout は X11 relay を行うために, xauth を使用して, 本物の X server の認証 key を
取得し, cluster から見える program の display 名にコピーしています.
このエラーは. 本物の認証 key を取得できなかったという error です.
ということで, 環境変数 DISPLAY は自分で設定しないで実行してください.

Kameyama Toyohisa



SCore-users-jp メーリングリストの案内