Magazine High tech

Windows Server 2025 bénéficie d'un partitionnement GPU basé sur VM pour les charges de travail d'IA

Publié le 12 juin 2024 par Zaebos @MetatroneFR

Le résultat de l'association de Microsoft avec Nvidia

Prospectif : La prochaine actualisation majeure du système d'exploitation serveur de Microsoft inclura une fonctionnalité importante pour augmenter les charges de travail de l'IA. Lorsque Windows Server 2025 arrivera, il lancera une nouvelle fonctionnalité appelée Partitionnement GPU qui permet à plusieurs machines virtuelles de partager et d'utiliser la puissance d'un seul GPU.

La nouvelle technologie de partitionnement GPU (GPU-P) de Microsoft vise à changer la façon dont les machines virtuelles exploitent les ressources GPU. Cette fonctionnalité permet à Windows de diviser un seul GPU physique en partitions distinctes, chacune obtenant une part des capacités globales de la carte graphique. Les utilisateurs peuvent ensuite attribuer ces partitions à des machines virtuelles individuelles sur le même serveur. Ainsi, au lieu de devoir consacrer un GPU entier à une seule VM, plusieurs VM peuvent partager efficacement la puissance d’une seule, comme si chaque partition était un GPU distinct.

La technologie utilise également un processus appelé clustering de basculement. Si une machine virtuelle sur un nœud de serveur rencontre une panne matérielle ou doit être migrée, elle peut redémarrer un autre nœud du cluster et utiliser une partition GPU sur cet autre serveur.

Microsoft crée également des outils de gestion centralisés pour permettre aux administrateurs de configurer et de superviser plus facilement cette nouvelle configuration de virtualisation GPU. L'interface utilisateur de Windows Admin Center fournira une console unifiée pour afficher les détails des partitions GPU dans l'ensemble d'un environnement de cluster et attribuer ces partitions aux machines virtuelles si nécessaire.

Compte tenu du coût élevé des GPU, en particulier des modèles haut de gamme adaptés aux tâches d'IA, les entreprises peuvent tirer parti du GPU-P pour maximiser leurs investissements.

Microsoft affirme que ses ingénieurs ont développé le GPU-P en étroite collaboration avec Nvidia. Le vice-président de l'entreprise Green Team, Bob Pette, a fait l'éloge de cette fonctionnalité, soulignant la sécurité, l'efficacité et les performances brutes. L'activation de cette fonctionnalité permet aux clients « d'exécuter leurs principales charges de travail d'IA pour atteindre un niveau d'efficacité supérieur ».

Ces derniers temps, les plateformes cloud ont volé une grande partie de la vedette à l’IA. Cependant, pour les entreprises qui doivent conserver des flux de travail d'IA spécifiques sur site pour des raisons réglementaires, de sécurité ou autres, disposer de fonctionnalités de partage granulaire de GPU intégrées directement à Windows Server pourrait s'avérer convaincante.

Au-delà de cette fonctionnalité, Microsoft a dévoilé plusieurs autres améliorations de Windows Server 2025 en avril. Plus particulièrement, les utilisateurs peuvent recevoir des mises à jour de sécurité sans redémarrer, grâce à une astucieuse modification du code en mémoire. Il existe également des améliorations significatives des performances pour les SSD avec NVME, avec une augmentation de 70 % des IOPS. De plus, le système d'exploitation sera disponible via un abonnement ou une licence unique.


Retour à La Une de Logo Paperblog

A propos de l’auteur


Zaebos 7622 partages Voir son profil
Voir son blog