ScoopServer
SCOOP クラスたリソースサーバ、ScoopServer
(8) は、一つないし複数のクラスタからホストのリソース情報を定期的に収集します。以下はコマンドラインから指定可能なオプションの例です:
# export PATH=$PATH:/opt/score/sbin
# export SCBDSERV=server
# ScoopServer -g pcc
この例では ScoopServer
を起動し、pcc
グループに含まれるホストから情報を集めます。pcc
グループにどのホストが含まれているかは、ホスト server
上で動作している scoreboard
で調べます。
# ScoopServer -g pcc,htc
この例では ScoopServer
を起動し、二つのグループ pcc
および htc
内のホストから情報を集めます。Scoop
は全クラスタに含まれる全てのコンピュートホストを一つのブロックマトリックスで表示します。
# ScoopServer -g pcc -M -L
-M
オプションは、コンピュートホストロックサーバ(msgbserv
(8)) が ScoopServer
によってロックされないよう指定します。このオプションが指定されなかった場合、ScoopServer
は定期的にデータを収集する間、および ping
コマンドが実行されたときにコンピュートホストロックサーバをロックします。-L
は、一分間の負荷平均データをコンピュートホストエージェントから収集するよう指定します。
ホストの状態の更新間隔はデフォルトでは 60 秒になっています。これは次のオプションで変えることができます:
# ScoopServer -g pcc -ui 120
この例ではホスト状態の更新間隔を 120 秒に指定しています。
ScoopServer
には、サーバにログインしてプロンプトからコマンドを実行することができるインタラクティブモードも存在します。デフォルトのポート番号は 4010 です。以下に例を示します:
# telnet localhost 4010
Trying 127.0.0.1...
Connected to localhost.localdomain.
Escape character is '^]'.
>help
Commands are:");
version print version number
list print hostname of registered hosts
status print system status of registered hosts
info print resource information of all hosts
info <host> print resource information of specific host
info <option> print resource information by specific data
info -help print help for info subcommand
quit exit this session
>status
pdspcc300.pccluster.org UP#0.00
pdspcc301.pccluster.org UP#0.00
pdspcc302.pccluster.org UP#0.00
pdspcc303.pccluster.org UP#0.00
...output skipped for brevity...
pdsac60e.pccluster.org UP#0.55
pdsac60f.pccluster.org UP#0.00
>info -help
Info Syntax is:
info <hostnames> <options>
multiple hostnames & options can be separated with spaces.
Info Options are:
-all print resource information on all hosts
-down print hostname which seems to be down?!
-arch print machine specific information
-os print operating system information
-nusers print number of users
-nprocs print number of processes
-boot print boot-up date & time
-uptime print host running time
-loadavg print load averages on 1min, 5min & 15min
-cpu print CPU time usages for user, system & idle
-mem print memory statistics for total, used & free
-swp print swap statistics for total, used & free
-fs <name> print filesystem statistics for total, used & free
multiple filesystem names can be separated with spaces.
>info pdsac60f -arch -os -mem
pdsac60f.pccluster.org HOST S pdsac60f.pccluster.org
pdsac60f.pccluster.org ARCH S alpha
pdsac60f.pccluster.org NCPUS I 1
pdsac60f.pccluster.org OS S Linux
pdsac60f.pccluster.org VERSION S 2.2.12pre12
pdsac60f.pccluster.org MEMTOTL I 502352
pdsac60f.pccluster.org MEMUSED I 45736
pdsac60f.pccluster.org MEMFREE I 456616
>info -nprocs
pdspcc300.pccluster.org NPROCS I 18
pdspcc301.pccluster.org NPROCS I 18
pdspcc302.pccluster.org NPROCS I 18
...output skipped for brevity...
pdsac60e.pccluster.org NPROCS I 15
pdsac60f.pccluster.org NPROCS I 15
>quit
Bye.......
Connection closed by foreign host.
#
$Id: ScoopServer.html,v 1.3 2002/03/07 12:03:46 kameyama Exp $