À cette fin, AMD a lancé le MI325X avec une capacité de mémoire et une bande passante supérieures à celles de l'Instinct MI300X, lancé en décembre dernier. Le MI325X est basé sur la même architecture GPU CDNA 3, contre 192 Go de mémoire à large bande passante HBM3 et 5,3 To/s de bande passante mémoire dans le MI300X.
AMD a déclaré que les performances d'inférence de l'IA dans le MI325X offrent un débit 40 % plus rapide avec un modèle Mixtral à 8 groupes et 7 milliards de paramètres par rapport au Hopper H200 haut de gamme de Nvidia, une latence 30 % inférieure avec un modèle Mixtral à 7 milliards de paramètres. modèle et une latence 20 % inférieure avec un modèle Llama 3.1 de 70 milliards de paramètres.
AMD prévoit une plate-forme à huit nœuds pour l'année prochaine, similaire aux pods DGX de Nvidia. Avec huit GPU MI325X connectés sur Infinity Fabric d'AMD, la plate-forme offrira 2 To de mémoire HBM3e, 48 To/s de bande passante mémoire totale, 20,8 pétaflops de performances FP8 et 10,4 pétaflops de performances FP16, a déclaré AMD.
Le MI325X sera disponible sur les systèmes de Dell Technologies, Lenovo, Supermicro, Hewlett Packard Enterprise, Gigabyte et plusieurs autres fournisseurs de serveurs à partir du premier trimestre de l'année prochaine, a indiqué la société.
Lire plus d'actualités sur les processeurs
- Enfabrica cherche à accélérer la communication GPU : le silicium Accelerated Compute Fabric SuperNIC (ACF-S) d'Enfabrica est conçu pour offrir une bande passante plus élevée, une plus grande résilience, une latence plus faible et un meilleur contrôle programmatique aux opérateurs de centres de données exécutant une IA et un HPC gourmands en données.
- Nvidia revendique des gains d'efficacité allant jusqu'à 100 000 fois : Cependant, l'affirmation spectaculaire du fabricant de puces concernant les gains de performances de ses GPU s'étend sur une période de 10 ans et ne s'applique qu'à un seul type de calcul.
- Intel lance les processeurs Xeon 6 et les accélérateurs Gaudi 3 AI : Intel a officiellement lancé ses prochains processeurs serveur Xeon 6 ainsi que les accélérateurs Gaudi 3 AI, faisant ainsi de grandes vantardises.
- Inflection AI passe à Intel Gaudi 3, défiant ainsi le leadership en matière de puces IA de Nvidia : cette annonce fait suite au récent partenariat d'IBM avec Intel, signalant un intérêt croissant pour le matériel IA d'Intel.
- La spin-out Altera d'Intel lance des produits et des logiciels FPGA : la PDG d'Altera, Sandra Rivera, partage « un objectif grand, audacieux et ambitieux » : dominer le marché des FPGA.



GIPHY App Key not set. Please check settings