[SCore-users-jp] PBSでのジョブ投入について

kodama.t @ olive.livedoor.com kodama.t @ olive.livedoor.com
2004年 3月 29日 (月) 22:08:49 JST


亀山様

デジタルテクノロジーの児玉です。
お世話になっております。

kameyama @ pccluster.org 様が書きました。

>亀山です.
>
>In article <40648141.2070800 @ dtc.co.jp> Toshiyuki Kodama <kodama @ dtc.co.jp>
wrotes:
>  
>
>>下記スクリプトに変更すると、ジョブが正常に投入されず、
>>「1:cluster000.test.jp」のような表示がなされるだけです。
>>#!/bin/bash
>>#PBS -l nodes=1
>>#PBS -l ncpus=1
>>  export LANG=C
>>  hostname
>>  date
>>  scout -wait -F ${PBS_NODEFILE} -e scrun -nodes=1
>>/opt/score.image/NPB/bt.A.1
>>    
>>
>
>以前の mail のとおり score をつけないと compute host で実行されますので,
>scout コマンドがみつからず, bt の実行はできず,
>hostname と date だけの実行になります.
>  
>
はい。これは、scoreオプションをつけないと、ジョブの実行ができないと
いうことで理解しましたが、これで間違いないでしょうか。

>問題は hostname, date の実行もされないことですが,
>
>>(client側)
>>03/26/2004 21:19:08;0080; pbs_mom;Fil;sys_copy;command:
>>/opt/score5.6.0/pbs/i386-redhat7-linux2_4/sbin/pbs_rcp -r
>>/var/scored/pbs/spool/1006.istbs0.ER
>>npb-score @ cluster000.test.jp:/home/npb-score/work/test.sh.e1006
>>status=1, try=3
>>
>
>pbs_rcp の実行に失敗しているようです.
>client 側に pbs_rcp は存在しているでしょうか?

はい。クライアント側には、pbs_rcpは存在しています。

>また, pbs_rcp は owner root で setuid bit が立っている必要があるのですが,
>パーミッションは適切でしょうか?
>  
>
実行結果をお送りします。

/opt/score/pbs/*/sbin ディレクトリの下
[root @ istbs000 sbin]# ls -al
合計 844
drwxr-xr-x    2 root     root         4096  3月 17 21:16 .
drwxr-xr-x    7 root     root         4096  3月  5 15:19 ..
-rwxr-xr-x    1 root     root        17213  3月 17 21:16 pbs_demux
-rwsr-xr-x    1 root     root        41279  3月 17 21:16 pbs_iff
-rwx------    1 root     root       271965  3月 17 21:16 pbs_mom
-rwsr-xr-x    1 root     root        30107  3月 17 21:16 pbs_rcp
-rwx------    1 root     root       155216  3月 17 21:16 pbs_sched
-rwx------    1 root     root       312549  3月 17 21:16 pbs_server

/opt/score/deploy ディレクトリの下
[root @ istbs000 deploy]# ls -la
合計 52
drwxr-xr-x    3 root     root         4096  3月 17 21:16 .
drwxr-xr-x   23 root     root         4096  3月 17 17:27 ..
-rwxr-xr-x    1 root     root          589 10月 17 16:41 .wrapper
drwxr-xr-x    2 root     root         4096  2月 27 23:08 bin.i386-redhat7-linux
2
_4
-rwxr-xr-x    1 root     root          300  3月 17 21:16 chk_tree
-rwxr-xr-x    1 root     root         1415 10月 17 16:41 chkxinetd
-rwxr-xr-x    1 root     root         7853 11月 14 16:03 config.guess
-rwxr-xr-x    1 root     root         3794 11月 14 16:03 config.nickname
lrwxrwxrwx    1 root     root            8  2月 27 23:04 hostname-check -> .wra
p
per
-rwxr-xr-x    1 root     root         3774 11月 14 16:03 linux_distribution
lrwxrwxrwx    1 root     root            8  2月 27 23:04 mkpmethernetconf -> .w
r
apper
lrwxrwxrwx    1 root     root            8  2月 27 23:08 mkpmmyrinetconf -> .wr
a
pper
lrwxrwxrwx    1 root     root            8  2月 27 23:04 officialname -> .wrapp
e
r
-rwxr-xr-x    1 root     root          301  3月 17 21:16 pbs_mom
-rwxr-xr-x    1 root     root          301  3月 17 21:16 pbs_rcp
lrwxrwxrwx    1 root     root            8  2月 27 23:04 pmroute -> .wrapper
lrwxrwxrwx    1 root     root            8  2月 27 23:04 scare -> .wrapper
lrwxrwxrwx    1 root     root            8  2月 27 23:04 scbfile -> .wrapper
lrwxrwxrwx    1 root     root            8  2月 27 23:04 scbinfo -> .wrapper
-rwxr-xr-x    1 root     root         2135 10月 17 16:41 score_system_check
lrwxrwxrwx    1 root     root            8  2月 27 23:04 scored -> .wrapper
lrwxrwxrwx    1 root     root            8  2月 27 23:04 scored_dev -> .wrapper
lrwxrwxrwx    1 root     root            8  2月 27 23:04 scstest -> .wrapper
lrwxrwxrwx    1 root     root            8  2月 27 23:04 skill -> .wrapper

ところで、一つご質問なのですが、nodes=1のジョブをsc_qsubコマンドで100回
実行させた時、100ノード分のマシンがあれば、ノード1からノード100
まで、分散してジョブが振り分けられるというイメージで宜しいのでしょうか。

 

以上、よろしくお願い申し上げます。


フレッツ始めるなら今 !キャンペーン実施中!
               http://isp.livedoor.com/campaign/





SCore-users-jp メーリングリストの案内