Erinevus lehekülje "Slurm resursihaldur" redaktsioonide vahel

Allikas: Kuutõrvaja
(Tööde käivitamine=)
3. rida: 3. rida:
 
[[Pilt:SlurmArchitecture.gif]]
 
[[Pilt:SlurmArchitecture.gif]]
  
===Tööde käivitamine====
+
===Tööde käivitamine===
  
 
Saadame slurmi töö mis käivitatakse neli korda ja mis väljastab masina kerneli versiooni
 
Saadame slurmi töö mis käivitatakse neli korda ja mis väljastab masina kerneli versiooni

Redaktsioon: 29. veebruar 2016, kell 16:49

Slurm (Simple Linux Utility for Resource Management) on arvutiklastri jaoks mõeldud rakendus mille ülesandeks on jagada etteantud töid mööda arvutiresursse laiali, monitoorida töötavaid protsesse ja pidada tööde üle järjekorda.

SlurmArchitecture.gif

Tööde käivitamine

Saadame slurmi töö mis käivitatakse neli korda ja mis väljastab masina kerneli versiooni

# srun --ntasks=4 uname -a
srun: job 561700 queued and waiting for resources
srun: job 561700 has been allocated resources
idu08
idu08
idu08
idu08

Või soovides käivitada lihtsalt kokku 24 tööd kõigil nodedel ja ja lasta slurmil ise nad jagada laiali

# srun --ntasks=24 --partition=gpu hostname

Põhimõtteliselt sama esimene näide skriptiga tehtuna, tekitame parallel_uname.sh

#!/bin/bash
#SBATCH –J test (1)
#SBATCH –N=4 (2)
#SBATCH --ntasks-per-node=4 (3)
#SBATCH --output=kontroll.out (4)
uname -a (5)
  1. Seadistab töö nime mida näeb squeue käsuga
  2. Määrab mitut füüsilist serverit kasutatakse
  3. Määrab, mitu ülesannet ühel serveril käivitatakse
  4. Väljundfaili nimi – programm ei edastada väljundit kohe ekraanile vaid faili.
  5. käsk, mida käivitatakse. Antud juhul uname -a

Paneme käima

# sbatch parallel_uname.sh 
Submitted batch job 65918

Ja väljund

# cat slurm-65918.out 
Linux stage59 2.6.32-431.17.1.el6.x86_64 #1 SMP Wed May 7 14:14:17 CDT 2014 x86_64 x86_64 x86_64 GNU/Linux

Tööde haldus

idu seisu vaatamiseks juurest või suvalisest idust anda käsk

# scontrol show node idu38
NodeName=idu38 Arch=x86_64 CoresPerSocket=6
   CPUAlloc=8 CPUErr=0 CPUTot=12 CPULoad=5.82 Features=K20
   Gres=gpu:2
   NodeAddr=idu38 NodeHostName=idu38
   OS=Linux RealMemory=48000 AllocMem=18432 Sockets=2 Boards=1
   State=MIXED ThreadsPerCore=1 TmpDisk=200000 Weight=100
   BootTime=2015-01-21T00:23:33 SlurmdStartTime=2015-01-21T00:24:09
   CurrentWatts=0 LowestJoules=0 ConsumedJoules=0
   ExtSensorsJoules=n/s ExtSensorsWatts=0 ExtSensorsTemp=n/ s