Blog en direct sur les centres de données AMD et la technologie AI : Instinct MI300, 144-Core EPYC Bergame

Publié le 13 juin 2023 par Mycamer

Rafraîchir

2023-06-13T18:31:22.469Z

Lisa Su a conclu la présentation. Voici quelques diapositives de synthèse supplémentaires. Restez à l’écoute pour notre couverture continue au cours des prochaines heures.

(Crédit image : AMD)

(Crédit image : AMD) 2023-06-13T18:29:42.696Z

MI300A, le modèle CPU + GPU, échantillonne maintenant. La plate-forme MI300X et 8-GPU Instinct sera échantillonnée au troisième trimestre et lancée au quatrième trimestre.

(Crédit image : AMD)

(Crédit image : AMD) 2023-06-13T18:27:53.972Z

SU a également annoncé la plate-forme AMD Instinct, qui dispose de 8 MI300X dans une conception OCP standard, offrant un total de 1,5 To de mémoire HBM3.

(Crédit image : AMD) 2023-06-13T18:26:54.554Z

(Crédit image : AMD) 2023-06-13T18:26:29.254Z

Cela permet d’utiliser moins de GPU pour les grands modèles de langage, ce qui permet de réaliser des économies.

(Crédit image : AMD) 2023-06-13T18:25:49.747Z

Lisa Su a réalisé une démonstration du MI300X exécutant un modèle Hugging Face AI. Le LLM a écrit un poème sur San Francisco, où se déroule l’événement. C’est la première fois qu’un modèle de cette taille est exécuté sur un seul GPU. Un seul MI300X peut exécuter un modèle jusqu’à 80 milliards de paramètres.

(Crédit image : AMD) 2023-06-13T18:24:13.774Z

MI300X offre une densité HBM 2,4X supérieure à celle du Nvidia H100 et une bande passante HBM 1,6X supérieure à celle du H100, ce qui signifie qu’AMD peut exécuter des modèles plus grands que les puces Nvidia.

(Crédit image : AMD)

(Crédit image : AMD) 2023-06-13T18:23:04.301Z

Et voici une nouvelle puce. 153 milliards de transistors dans un seul boîtier avec 12 puces de 5 nm.

(Crédit image : AMD) 2023-06-13T18:22:23.805Z

Il y aura un MI300 uniquement GPU, le MI300X. Cette puce est optimisée pour les LLM. cela offre 192 Go de HBM3, 5,2 To/s de bande passante et 896 Go/s de bande passante Infinity Fabric.

(Crédit image : AMD) 2023-06-13T18:21:16.911Z

SU parle de la feuille de route Instinct et de la façon dont la société a prévisualisé le MI300 avec l’architecture GPU CDNA 3 associée à 24 cœurs de processeur Zen 4, liés à 128 Go de HBM3. Cela donne 8 fois plus de performances et 5 fois plus d’efficacité que le MI250.

146 milliards de transistors répartis sur 13 puces.

(Crédit image : AMD) 2023-06-13T18:19:41.772Z

Lisa Su est revenue sur scène, et maintenant nous nous attendons à en savoir plus sur la plus grande annonce du spectacle : Le Instinct MI300. C’est pour former des modèles plus grands, comme les LLM derrière la révolution actuelle de l’IA.

(Crédit image : AMD) 2023-06-13T18:15:16.758Z

AMD passe à parler de modèles d’IA, avec Hugging Face rejoignant Peng sur scène. AMD et Hugging Face ont annoncé un nouveau partenariat, optimisant leurs modèles pour les processeurs AMD, les GPU et d’autres matériels d’IA.

(Crédit image : AMD)

(Crédit image : AMD) 2023-06-13T18:13:22.868Z

Voici les détails de PyTorch 2.0.

(Crédit image : AMD) 2023-06-13T18:07:36.937Z

PyTorch est l’un des frameworks d’IA les plus populaires de l’industrie, et ils ont rejoint Peng sur scène pour parler de leur collaboration avec ROCm. Le nouveau PyTorch 2.0 est presque deux fois plus rapide que la version précédente. AMD est l’un des membres fondateurs de la Fondation PyTorch.

(Crédit image : AMD) 2023-06-13T18:05:28.555Z

AMD optimise en permanence la suite ROCm.

(Crédit image : AMD) 2023-06-13T18:04:48.655Z

Le ROCm d’AMD est un ensemble complet de bibliothèques et d’outils pour sa pile logicielle d’IA optimisée. Contrairement au CUDA propriétaire, il s’agit d’une plate-forme ouverte.

(Crédit image : AMD) 2023-06-13T18:03:41.629Z

Peng a montré certains des derniers efforts matériels d’AMD.

(Crédit image : AMD) 2023-06-13T18:02:44.922Z

Le président d’AMD, Victor Peng, est venu sur scène pour parler des efforts de l’entreprise en matière de développement de l’écosystème logiciel. C’est une facette importante, car le logiciel CUDA de Nvidia s’est avéré être un fossé. AMD prévoit d’utiliser une philosophie “Open, Proven, and Ready” pour le développement de son écosystème de logiciels d’IA, dont Peng est responsable.

(Crédit image : AMD) 2023-06-13T17:58:55.195Z

Les GPU AMD Instinct alimentent déjà de nombreux les supercalculateurs les plus rapides du monde.

(Crédit image : AMD) 2023-06-13T17:57:50.422Z

Lisa Su a souligné l’énorme opportunité de marché pour le marché de l’IA tirée par les grands modèles de langage (LLM), faisant passer le TAM à environ 150 milliards de dollars.

(Crédit image : AMD)

(Crédit image : AMD) 2023-06-13T17:55:37.615Z

Lisa Su est revenue sur scène pour parler du large portefeuille de silicium AI d’AMD, y compris l’Instinct MI300

(Crédit image : AMD)

(Crédit image : AMD) 2023-06-13T17:52:30.314Z

L’étape suivante? Intégration du déchargement P4 DPU dans le commutateur réseau lui-même, fournissant ainsi des services au niveau du rack. Cela vient comme le Smart Switch qu’ils ont développé avec Aruba Networks.

(Crédit image : AMD) 2023-06-13T17:50:53.121Z

Les Pensando SmartNIC d’AMD font partie intégrante des nouvelles architectures de centres de données.

(Crédit image : AMD) 2023-06-13T17:49:54.595Z

Le DPU P4 d’AMD décharge les frais généraux du réseau et améliore la gérabilité du serveur.

(Crédit image : AMD)

(Crédit image : AMD) 2023-06-13T17:48:56.284Z

(Crédit image : AMD)

(Crédit image : AMD)

(Crédit image : AMD) 2023-06-13T17:48:14.675Z

AMD a acheté Pensando pour acquérir la technologie DPU. Norrod a expliqué comment AMD utilise ces appareils pour réduire les frais généraux de mise en réseau dans le centre de données.

(Crédit image : AMD) 2023-06-13T17:46:15.544Z

Citadel utilise également les FPGA Xilinx d’AMD pour son travail sur les marchés financiers avec sa plateforme de trading haute fréquence. Il utilise également le réseau solarflare à faible latence d’AMD.

2023-06-13T17:43:42.312Z

Citadel Securities a rejoint Norrod sur scène pour parler de son transfert de charges de travail vers les processeurs AMD, permettant une augmentation de 35 % des performances. Ils utilisent plus d’un million de cœurs AMD simultanés.

(Crédit image : AMD) 2023-06-13T17:42:06.089Z

Forrest Norrod d’AMD, vice-président exécutif de MD et directeur général du Data Center Solutions Business Group, est venu sur scène pour partager des informations sur l’évolution du centre de données.

(Crédit image : AMD) 2023-06-13T17:40:42.953Z

Sienna d’AMD est optimisé pour les charges de travail Telco et Edge, mais arrive sur le marché au second semestre.

2023-06-13T17:34:44.300Z

Azure a annoncé la disponibilité générale de ses nouvelles instances des séries HBv4 et HX avec Genoa-X, et de nouvelles instances HBv3. Azure a également fourni des repères pour montrer les gains de performances, qui culminent à 5,7 fois les gains

(Crédit image : AMD) 2023-06-13T17:32:22.400Z

Un représentant de Microsoft a rejoint McNamara sur scène pour montrer les tests de performance Azure HPC. En seulement quatre ans, Azure a vu ses performances quadrupler avec les processeurs EPYC.

(Crédit image : AMD)

Ici, nous pouvons voir une comparaison de Genoa-X contre un Intel Xeon avec le même nombre de cœurs.

(Crédit image : AMD) 2023-06-13T17:29:57.632Z

McNamara a montré des références de performances de Genoa-X par rapport au Xeon à 80 cœurs d’Intel.

(Crédit image : AMD) 2023-06-13T17:28:59.844Z

(Crédit image : AMD) 2023-06-13T17:28:47.606Z

Gen0a-X est disponible dès maintenant. Quatre SKU, 16 à 96 cœurs. Compatibilité du socket SP5, il fonctionnera donc avec les plates-formes EPYC existantes.

(Crédit image : AMD) 2023-06-13T17:27:43.434Z

Dan McNamara, SVP d’AMD et GM de l’unité commerciale des serveurs, est venu sur scène pour présenter deux nouveaux produits. Genoa-X ajoutera plus de 1 Go de cache L3 avec 96 cœurs.

(Crédit image : AMD) 2023-06-13T17:25:13.227Z

Meta dit qu’il a appris qu’il peut compter sur AMD à la fois pour l’approvisionnement en puces et sur une feuille de route solide qu’il livre dans les délais. Meta prévoit d’utiliser Bergamo, qui offre 2,5 fois plus de performances que les puces Milan de la génération précédente, pour son infrastructure. Meta utilisera également Bergame pour ses plateformes de stockage.

(Crédit image : AMD) 2023-06-13T17:22:28.206Z

Un représentant de Meta a rejoint Lisa Su sur scène pour parler de l’utilisation par la société des processeurs EPYC d’AMD pour son infrastructure. Meta est également en open source pour ses conceptions de serveurs alimentés par AMD.

(Crédit image : AMD) 2023-06-13T17:20:56.856Z

Bergamo est désormais disponible pour les clients cloud d’AMD. AMD a également partagé les références de performances suivantes.

(Crédit image : AMD)

(Crédit image : AMD) 2023-06-13T17:20:09.643Z

Voici un schéma du paquet de puces.

(Crédit image : AMD) 2023-06-13T17:19:47.535Z

Le noyau est 35 % plus petit que les noyaux Zen 4 standard.

(Crédit image : AMD) 2023-06-13T17:19:23.691Z

Voici la répartition des matrices.

(Crédit image : AMD) 2023-06-13T17:18:38.032Z

Le cœur Zen 4c offre une densité plus élevée que les cœurs Zen 4 standard, tout en maintenant une compatibilité logicielle à 100 %. AMD a optimisé la hiérarchie du cache, entre autres ajustements, pour une économie de 35 % sur la zone de la matrice. Le chiplet de base CCD est le seul changement.

(Crédit image : AMD) 2023-06-13T17:17:23.674Z

Lisa Su est maintenant passée à parler de processeurs natifs du cloud, expliquant qu’ils sont orientés vers le débit et nécessitent la densité et l’efficacité finales les plus élevées. Bergame est l’entrée pour ce marché et utilise jusqu’à 128 cœurs par socket avec un support ISA x86 cohérent. La puce compte 83 milliards de transistors et offre la densité de vCPU la plus élevée disponible.

(Crédit image : AMD) 2023-06-13T17:15:25.119Z

AMD a également annoncé qu’Oracle disposera d’instances Genoa E5 en juillet.

2023-06-13T17:14:01.467Z

AMD utilisera également les instances EC2 M7a pour ses propres charges de travail internes, y compris pour les logiciels EDA de conception de puces.

(Crédit image : AMD) 2023-06-13T17:13:10.395Z

Amazon a annoncé qu’il construisait de nouvelles instances avec AWS Nitro et la quatrième génération EPYC Gênes processeurs. Les instances EC2 M7a sont disponibles en avant-première dès aujourd’hui, offrant 50 % de performances en plus que les instances M6a. AWS affirme offrir les meilleures performances des offres AWS x86.

(Crédit image : AMD) 2023-06-13T17:10:35.825Z

Dave Brown, le vice-président de l’EC2 d’AWS, est venu sur scène pour parler des économies de coûts et des avantages en termes de performances de l’utilisation des instances d’AMD dans son cloud. Il a fourni plusieurs exemples de clients qui ont bénéficié des instances AMD, avec des charges de travail allant du HPC aux charges de travail standard à usage général.

(Crédit image : AMD) 2023-06-13T17:08:20.812Z

Ici, nous pouvons voir les références d’IA d’AMD par rapport au Sapphire Rapids Xeon d’Intel.

(Crédit image : AMD) 2023-06-13T17:07:44.692Z

La grande majorité de l’IA fonctionne sur des processeurs, et AMD affirme avoir une avance considérable en termes de performances sur le Xeon 8490H concurrent, offrant 1,9 fois plus de performances. Su a également vanté un avantage d’efficacité de 1,9X.

(Crédit image : AMD)

(Crédit image : AMD)

(Crédit image : AMD) 2023-06-13T17:05:32.969Z

Lisa Su vante les mérites du fait qu’AMD EPYC Genoa offre 1,8 fois les performances des processeurs concurrents d’Intel dans les charges de travail cloud et 1,9 fois plus rapide dans les charges de travail d’entreprise.

(Crédit image : AMD) 2023-06-13T17:03:52.188Z

Lisa Su décrit les progrès d’AMD avec ses processeurs EPYC, en particulier dans le cloud avec des instances disponibles dans le monde entier.

(Crédit image : AMD) 2023-06-13T17:02:38.303Z

(Crédit image : AMD)

La PDG d’AMD, Lisa Su, est montée sur scène pour présenter les nouveaux produits de la société, notant qu’elle présentera une gamme de nouveaux produits, notamment des CPU et des GPU.

2023-06-13T16:52:35.260Z

(Crédit image : matériel de Tom)

Nous sommes maintenant assis et prêts pour que le spectacle commence dans moins de dix minutes.

to www.tomshardware.com


Abonnez-vous à notre page Facebook: https://www.facebook.com/mycamer.net
Pour recevoir l’actualité sur vos téléphones à partir de l’application Telegram cliquez ici: https://t.me/+KMdLTc0qS6ZkMGI0
Nous ecrire par Whatsapp : Whatsapp +44 7476844931