[SCore-users-jp] PBSでのジョブ投入について

kameyama @ pccluster.org kameyama @ pccluster.org
2004年 3月 30日 (火) 09:09:52 JST


亀山です.

In article <200403291308.i2TD8nAH066709 @ SMTP.MyNET.JP> kodama.t @ olive.livedoor.com wrotes:
> >以前の mail のとおり score をつけないと compute host で実行されますので,
> >scout コマンドがみつからず, bt の実行はできず,
> >hostname と date だけの実行になります.
> >  
> >
> はい。これは、scoreオプションをつけないと、ジョブの実行ができないと
> いうことで理解しましたが、これで間違いないでしょうか。

正確には, score オプションをつけないと起動 host が compute host
になってしまうため, scout, scrun などのコマンドが使用できない,
そのため, score program が実行できない, ということになります.

> >問題は hostname, date の実行もされないことですが,
> >
> >>(client側)
> >>03/26/2004 21:19:08;0080; pbs_mom;Fil;sys_copy;command:
> >>/opt/score5.6.0/pbs/i386-redhat7-linux2_4/sbin/pbs_rcp -r
> >>/var/scored/pbs/spool/1006.istbs0.ER
> >>npb-score @ cluster000.test.jp:/home/npb-score/work/test.sh.e1006
> >>status=1, try=3
> >>
> >
> >pbs_rcp の実行に失敗しているようです.
> >client 側に pbs_rcp は存在しているでしょうか?

(中略)

> drwxr-xr-x    2 root     root         4096  3月 17 21:16 .
> drwxr-xr-x    7 root     root         4096  3月  5 15:19 ..
> -rwxr-xr-x    1 root     root        17213  3月 17 21:16 pbs_demux
> -rwsr-xr-x    1 root     root        41279  3月 17 21:16 pbs_iff
> -rwx------    1 root     root       271965  3月 17 21:16 pbs_mom
> -rwsr-xr-x    1 root     root        30107  3月 17 21:16 pbs_rcp
> -rwx------    1 root     root       155216  3月 17 21:16 pbs_sched
> -rwx------    1 root     root       312549  3月 17 21:16 pbs_server

パーミッションは良さそうですね.
pbs_rcp は基本的には rcp と同じなので, compute host から pbs を実行した
host に rcp できる設定が必要なようです.
cluster000 のほうの /etc/hosts.equiv に compute host が書かれているか確認して
ください.

> ところで、一つご質問なのですが、nodes=1のジョブをsc_qsubコマンドで100回
> 実行させた時、100ノード分のマシンがあれば、ノード1からノード100
> まで、分散してジョブが振り分けられるというイメージで宜しいのでしょうか。

はい, 起動 host で 100 個の scout/scrun が動くことになりますので,
起動 host がそれに耐えられるのであれば並列して実行されると思います.

                       from Kameyama Toyohisa



SCore-users-jp メーリングリストの案内