Scuola IaD

Digital Twin for HPC monitoring with Data Science Techniques

ENEA

Titolo corso

Digital Twin for HPC monitoring with Data Science Techniques

Docenti

Marta Chinnici, Davide De Chiara, Francesco Genovese

Obiettivi e profilo occupazionale

Questo workshop intende fornire un’introduzione ai Digital Twin (DT) e alla loro evoluzione digitale. Verranno mostrate simulazioni avanzate mediante l’uso di computer ad alte prestazioni e calcolo massivamente parallelo (HPC, High Performance Computing). In collaborazione con l’industria, inoltre, verrà mostrato un caso d’uso relativo a un DT di un Data Center. Verranno fornite, inoltre, competenze di base per creare e gestire Digital Twin in ambiente
HPC, comprendendo aspetti infrastrutturali, informatici e matematici per la raccolta, l’analisi e la modellazione dei dati.

Moduli formativi

Modulo 1 – Introduzione al Digital Twin e alle infrastrutture di supercalcolo Cos’è un Digital Twin

  • Definizione e concetto base
  • Origine e differenza con modello digitale
  •  Applicazioni pratiche in industria, energia, sanità (esempi)

Architettura e componenti di un DT

  • Modello fisico-digitale (Componenti chiave: modello, dati, sensori, simulazione, feedback)
  • Raccolta dati in tempo reale e gestione di big data
  • Simulazione e feedback loop
  • Integrazione con IoT e AI

Infrastrutture di Supercalcolo

  • Cos’è l’HPC (High Performance Computing)
  •  Architettura hardware e software (GRID, Cluster, nodi, scheduler, storage)
  • Esempi di infrastrutture HPC nazionali e internazionali (caso di uso ENEA CRESCO)
  • Perché servono grandi risorse e come ottimizzare i consumi energetici

 

Modulo 2 – Strumenti utili: procedure di parallelizzazione, tecniche di data science per analisi predittive

Procedure di parallelizzazione su infrastrutture HPC

  • Concetto di parallelizzazione (task vs data parallelism)
  • Modelli di calcolo distribuito
  • Librerie e strumenti principali (es. MPI, OpenMP, job scheduling) • Buone pratiche per la scalabilità (caso d’uso SLURM)

Tecniche di data science per analisi predittive

  • Panoramica rapida di regressione, classificazione e forecasting
  •  Importanza dei dati per alimentare i DT
  • Strumenti diffusi per l’analisi predittiva (es. Python, Scikit-learn, TensorFlow)
  •  Esempio di workflow predittivo


Modulo 3 – Digital Twin per il monitoring di infrastrutture di calcolo ad alte prestazioni

Monitoring di infrastrutture HPC: panoramica

  • Principi del monitoring HPC: metriche chiave, telemetria
  • Raccolta dati in tempo reale (caso d’uso MongoDb) e modelli predittivi
  • Strumenti per il monitoraggio e la visualizzazione (es.,caso d’uso dashboard Grafana, telemetry nativa cluster)

 Digital Twin per il monitoring HPC

  • Architettura di un gemello digitale per infrastrutture di calcolo
  • Previsione della domanda di risorse
  • Esempio applicativo (caso d’uso relativo a un DT blockchain di un DC: analisi flussi, consumi, efficienza)

 Strategie di ottimizzazione e gestione predittiva

  • Alert intelligenti su guasti, anomalie e carichi di lavoro
  • Pianificazione proattiva della manutenzione e gestione
  • Riduzione dei tempi di inattività e miglioramento dell’efficienza energetica globale

 

Livello

Intermedio

Durata

05/11/2025 dalle 09.30 alle 12.30, tramite piattaforma Zoom Ore: 3, Giornate: 1