L’ORNL publie un aperçu du système HPC ‘Crusher’ alimenté par AMD : 192 processeurs EPYC ‘Trento’ 64 cœurs, 1536 GPU Instinct MI250X, 40 chevaux PFLOP

0
8

Le laboratoire national d’Oak Ridge a publié la vue d’ensemble de son système Crusher qui est alimenté par les processeurs EPYC optimisés de 3e génération d’AMD et les GPU Instinct MI250X.

Publication de la présentation du système de concassage entièrement alimenté par AMD d’ORNL : Caractéristiques optimisées des processeurs EPYC de 3e génération et des GPU Instinct MI250X

Le système Crusher est une plate-forme de test pour le prochain supercalculateur Frontier de l’ORNL, qui comprendra les derniers processeurs AMD EPYC « Trento » et les GPU Instinct MI250X « Aldebaran ». En tant que tel, il a un plus petit nombre de nœuds, mais même ainsi, il a beaucoup de punch compte tenu de la quantité considérable de cœurs CPU/GPU qui y sont présentés.

ASUS déploie le firmware AMD AGESA 1.2.0.6 BETA BIOS pour ses cartes mères ROG Crosshair VIII

Crusher est un système à sécurité modérée du National Center for Computational Sciences (NCCS) qui contient du matériel identique et des logiciels similaires au futur système Frontier. Il est utilisé comme banc d’essai à accès anticipé pour les équipes du Center for Accelerated Application Readiness (CAAR) et du projet Exascale Computing (ECP), ainsi que pour le personnel du NCCS et nos partenaires fournisseurs.

par l’ORNL

L’aperçu publié par l’ORNL indique que le système de test Crushes se composera de 2 armoires, l’une avec 128 nœuds de calcul et l’autre avec 64 nœuds de calcul, totalisant 192 nœuds de calcul dans la configuration complète. Chaque nœud dispose d’un seul processeur AMD EPYC 7A53 à 64 cœurs basé sur l’architecture de processeur EPYC optimisée de 3e génération. Nous savons que Frontier sera alimenté par les processeurs Trento d’AMD, une version optimisée de la puce Milan. Il présente les mêmes 64 cœurs et 128 threads, mais des optimisations des horloges et de l’efficacité énergétique. Chaque CPU aura accès à 512 Go de mémoire DDR4.

Pour le côté GPU, chaque nœud comportera quatre GPU AMD Instinct MI250X, contenant 2 GCD et chaque nœud traite le GCD comme un GPU distinct, de sorte que Crusher aura accès à 8 GPU au total. Chaque GPU MI250X offre jusqu’à 52 TFLOP de puissance de calcul FP64 maximale, 220 unités de calcul (110 par GCD) et 128 Go de mémoire HBM2e (64 Go par GPU) pour une bande passante allant jusqu’à 3,2 To/s par accélérateur MI250X. Chaque GCD est connecté via un lien Infinity Fabric qui offre une bande passante bidirectionnelle de 200 Go/s.

En parlant d’interconnexions, les processeurs AMD EPYC sont connectés au GPU avec Infinity Fabric avec une bande passante maximale de 36 + 36 Go/s. Les nœuds Crusher sont connectés via quatre cartes réseau HPE Slingshot 200 Gbit par seconde (25 Go/s) fournissant une bande passante d’injection de nœud de 800 Gbit/s (100 Go/s).

Il y a [4x] Domaines NUMA par nœud et [2x] Régions de cache L3 par NUMA pour un total de [8x] Régions de cache L3. Les 8 GPU sont chacun associés à l’une des régions L3 comme suit :

NUMA 0 :

  • fils de quincaillerie 000-007, 064-071 | GPU 4
  • filetages de quincaillerie 008-015, 072-079 | GPU 5

NOM 1 :

  • filetages de quincaillerie 016-023, 080-087 | GPU 2
  • filetages de quincaillerie 024-031, 088-095 | GPU 3

NUMA 2 :

  • filetages de quincaillerie 032-039, 096-103 | GPU 6
  • filetages de quincaillerie 040-047, 104-111 | GPU 7

NUMA 3 :

  • filetages de quincaillerie 048-055, 112-119 | GPU 0
  • filetages de quincaillerie 056-063, 120-127 | GPU 1

Le schéma fonctionnel suivant d’un nœud Crusher singulier montre les bandes passantes d’interconnexion entre les processeurs AMD EPYC et les accélérateurs GPU Instinct MI250X :

AMD RAMP est XMP pour les processeurs Ryzen 7000 d’AMD, accélère la mémoire DDR5 sur la plate-forme AM5

En plus de cela, le système Crusher chauffe également 250 Po de stockage avec une vitesse d’écriture maximale de 2,5 To/s, avec accès au système de fichiers NFS central. Attendez-vous à voir plus des plates-formes CPU EPYC et GPU Instinct d’AMD lorsqu’elles seront opérationnelles dans le supercalculateur Frontier cette année.

Source de nouvelles: coelacanthe-rêve