コンテンツ
お知らせ
ジョブスケジューリング機能の強化について
2009年7月9日(木曜日)掲載
7月7日の保守で,つぎのようなNQSジョブスケジューリング機能を強化しました.
センターでは,グループ(キュー)単位に,CPUコアを保証,制限を行っています
が,これまでNQSで指定されたCPUコア数(-lp)だけで管理していたために,少な
いCPUコア数で,大きなメモリ量(-lm)が指定されたジョブが多くのノードを占有
し,他の利用者のジョブの実行を阻害する事がありました.
これらの問題を解決するために,新たに指定されたメモリ量(-lm)を論理的に使
用CPUコア数に換算し,適正な資源管理されるように機能強化しました.
資源管理は,CPUコア数(-lp),指定メモリ量(-lm)で扱い,各クラスタでは,次
のような値としています.
・ Thin クラスタ: 1CPUコア,1800MB
・ Fat クラスタ: 1CPUコア,7300MB
例えば,Thinクラスタで,1CPUコア(-lp 1),メモリを28GB(-lm 28gb)と指定した
ジョブは,論理的に16CPUコアを占有するジョブとして管理され,スケジューリ
ングされます.
なお以下コマンドにて,グループ(キュー)の利用状況を確認できます.
【qgroup】
https://portal.kudpc.kyoto-u.ac.jp/hpc/nqs#qgroup
--------------------------------------------------------------------------------
※ 資源管理におけるメモリの単位を誤っていたので修正しました.[7月15日]
誤: Thin クラスタ: 1CPUコア,1.8GB
正: Thin クラスタ: 1CPUコア,1800MB
誤: Fat クラスタ: 1CPUコア,7.3GB
正: Fat クラスタ: 1CPUコア,7300MB
-lm を指定しなければ自動で標準値(Thin 1800mb, Fat 7300mb)が設定されます.それ以上メモリを必要とするときに -lm でメモリ量を指定ください.
お問い合わせ |
京都大学 情報環境部 情報基盤課 コンピューティンググループ
電話番号:075-753-7431 E-mail:computingmedia.kyoto-u.ac.jp お問い合わせフォーム |