Aggiunte info di base su Slurm

master
Fabio Durastante 3 years ago
parent 4eefebd92c
commit 28eba07e76

@ -120,4 +120,29 @@ Infine:
```bash
sudo systemctl restart dnsmasq
sudo reboot
```
## Slurm Workload Manager
Slurm Workload Manager, precedentemente noto come Simple Linux Utility for Resource Management (SLURM), o semplicemente **Slurm**, è un job scheduler gratuito e open source per kernel Linux e Unix-like, utilizzato da molti dei supercomputer e cluster di computer del mondo.
Fornisce tre funzioni fondamentali:
- assegnazione di accesso esclusivo e/o non esclusivo ai *nodi* di calcolo agli utenti per un certo periodo di tempo in modo che possano eseguire i loro *job*,
- fornire un framework per l'**avvio**, l'**esecuzione** e il **monitoraggio** dei *job* che contengono (in genere) istruzioni parallele di tipo MPI sull'insieme di nodi allocati,
- arbitrare la "contesa" per le risorse gestendo una coda di lavori in sospeso.
Per prima cosa dobbiamo installare *Slurm* su tutti i nodi del cluster
```bash
sudo apt-get update -y
sudo apt-get install slurmd slurmctld -y
```
Generare un file di configurazione mediante il [configuratore online](https://slurm.schedmd.com/configurator.html) e inserirne il contenuto in
```bash
/etc/slurm/slurm.conf
```
Al termine della configurazione avviare il servizio:
```bash
sudo systemctl start slurmctld
sudo systemctl start slurmd
```
Loading…
Cancel
Save