Digital Twin for HPC monitoring with Data Science Techniques
Titolo corso
Docenti
Obiettivi e profilo occupazionale
Questo workshop intende fornire un’introduzione ai Digital Twin (DT) e alla loro evoluzione digitale. Verranno mostrate simulazioni avanzate mediante l’uso di computer ad alte prestazioni e calcolo massivamente parallelo (HPC, High Performance Computing). In collaborazione con l’industria, inoltre, verrà mostrato un caso d’uso relativo a un DT di un Data Center. Verranno fornite, inoltre, competenze di base per creare e gestire Digital Twin in ambiente
HPC, comprendendo aspetti infrastrutturali, informatici e matematici per la raccolta, l’analisi e la modellazione dei dati.
Moduli formativi
Modulo 1 – Introduzione al Digital Twin e alle infrastrutture di supercalcolo Cos’è un Digital Twin
- Definizione e concetto base
- Origine e differenza con modello digitale
- Applicazioni pratiche in industria, energia, sanità (esempi)
Architettura e componenti di un DT
- Modello fisico-digitale (Componenti chiave: modello, dati, sensori, simulazione, feedback)
- Raccolta dati in tempo reale e gestione di big data
- Simulazione e feedback loop
- Integrazione con IoT e AI
Infrastrutture di Supercalcolo
- Cos’è l’HPC (High Performance Computing)
- Architettura hardware e software (GRID, Cluster, nodi, scheduler, storage)
- Esempi di infrastrutture HPC nazionali e internazionali (caso di uso ENEA CRESCO)
- Perché servono grandi risorse e come ottimizzare i consumi energetici
Modulo 2 – Strumenti utili: procedure di parallelizzazione, tecniche di data science per analisi predittive
Procedure di parallelizzazione su infrastrutture HPC
- Concetto di parallelizzazione (task vs data parallelism)
- Modelli di calcolo distribuito
- Librerie e strumenti principali (es. MPI, OpenMP, job scheduling) • Buone pratiche per la scalabilità (caso d’uso SLURM)
Tecniche di data science per analisi predittive
- Panoramica rapida di regressione, classificazione e forecasting
- Importanza dei dati per alimentare i DT
- Strumenti diffusi per l’analisi predittiva (es. Python, Scikit-learn, TensorFlow)
- Esempio di workflow predittivo
Modulo 3 – Digital Twin per il monitoring di infrastrutture di calcolo ad alte prestazioni
Monitoring di infrastrutture HPC: panoramica
- Principi del monitoring HPC: metriche chiave, telemetria
- Raccolta dati in tempo reale (caso d’uso MongoDb) e modelli predittivi
- Strumenti per il monitoraggio e la visualizzazione (es.,caso d’uso dashboard Grafana, telemetry nativa cluster)
Digital Twin per il monitoring HPC
- Architettura di un gemello digitale per infrastrutture di calcolo
- Previsione della domanda di risorse
- Esempio applicativo (caso d’uso relativo a un DT blockchain di un DC: analisi flussi, consumi, efficienza)
Strategie di ottimizzazione e gestione predittiva
- Alert intelligenti su guasti, anomalie e carichi di lavoro
- Pianificazione proattiva della manutenzione e gestione
- Riduzione dei tempi di inattività e miglioramento dell’efficienza energetica globale