Sperimentazione di calcolo parallelo ad alte prestazione con hardware IBM

10/02/2021

Introduzione

Nell’ambito dell’accordo INAF-IBM definito in collaborazione con l’Ufficio ICT dell’INAF si è deciso di avviare una sperimentazione su HW IBM volta a verificare come si possano implementare problemi molti spinti di high performance computing (calcolo parallelo) e per il machine learning.

A questo scopo abbiamo ricevuto in comodato d’uso da IBM un server Power System AC922 di ultimissima generazione, che il Servizio Informatici per il Digitale (SID) di OAS  ha provveduto ad installare nel proprio Centro di Calcolo CdC a Bologna.

Il server è raggiungibile tramite ssh all’indirizzo ibmtest.oas.inaf.it.

Descrizione del server

Si riportano di seguito le caratteristiche principali della macchina:

La sperimentazione sarà attiva da febbraio 2021.

Utilizzo delle risorsa di calcolo

Il server non è adatto a far girare software scientifico che gli utenti INAF solitamente usano perché l’architettura di base non è Intel ma è basato su processori Power. Il server è pensato per problemi di high performance computing (calcolo parallelo) e per il machine learning. Il target principali sono:

  • sviluppatori software, per verificare i benefici dell’architettura Power nel contesto del calcolo parallelo;
  • data scientist, per sviluppo di applicazioni di machine learning nel contesto dell’astrofisica.

Chiunque dell’INAF potrà far richiesta  di un account al SID.OAS sid.oas@inaf.it all’attenzione di Adriano de Rosa che è il responsabile dell’installazione HW e SW del Server.

In questo modo gli sarà possibile accedere  alla risorsa di calcolo descritta e potrà svolgere i propri test.

Il server è installato con la RedHat Enterprise 7 for Power CPU ed è fornito attualmente dei seguenti tools di base: gcc, slurm, tensorflow e keras. Altri tool più specifici si potranno aggiungere in futuro in base alla disponibilità di IBM.

Ognuno potrà installare nello user space tutti i programmi di cui necessita.

La macchina non è pensata come servizio per fare calcolo, ma per sviluppo e test. È quindi richiesta la cortesia di non tenere occupata la macchina per molto tempo. Nel caso di conflitto di disponibilità di risorse ci si accorderà tra colleghi sull’utilizzo delle stesse.

Alla fine della sperimentazione è necessario presentare un piccolo report sull’attività svolta che ci servirà per fare un report periodico delle attività ad IBM e nel contesto dell’OpenPOWER Foundation

Report delle attività