Si vous pensiez que les H100 de 700 W de Nvidia étaient des machines chaudes et gourmandes en énergie, attendez simplement que le B100 du slinger GPU arrive plus tard cette année.
Selon Jeff Clarke, COO de Dell Technologies, le dernier accélérateur d’IA de Nvidia consommera 1 000 watts, soit 42 % de plus que son prédécesseur. Mais ne vous inquiétez pas, il est presque sûr qu’un refroidissement liquide ne sera pas nécessaire pour apprivoiser la bête.
“Nous sommes enthousiasmés par ce qui se passe avec le H200 et par l’amélioration de ses performances”, a déclaré Clarke aux investisseurs lors du salon Dell. appel aux résultats [PDF] la semaine dernière, avant d’ajouter qu’il ressent la même émotion à propos du prochain accélérateur B100 de Nvidia et d’un autre qu’il a appelé B200.
Il a estimé que le refroidissement liquide direct ne serait pas nécessaire pour gérer les GPU consommant 1 000 watts chacun – un niveau qui, selon lui, “arrivera l’année prochaine avec le B200”.
On ne sait pas exactement à quelle carte Clarke fait référence avec le “B200”, puisqu’aucune puce portant ce surnom n’apparaît sur la feuille de route que Nvidia a partagée avec les investisseurs l’automne dernier. Cependant, nous soupçonnons que Clarke fait en réalité référence au Superchip GB200 qui, comme le GH200, devrait combiner le processeur Grace de Nvidia avec son GPU B100.
Selon une présentation aux investisseurs publiée ce mois-ci, Nvidia prévoit de passer à une cadence de sortie d’un an – Cliquez pour agrandir
D’après ce que nous savons du processeur Grace du GH200, et en supposant qu’il n’y ait pas de changements majeurs dans la consommation électrique, cela placerait la puissance thermique nominale (TDP) du GB200 aux alentours de 1 300 watts, soit 30 % de plus que son prédécesseur.
Il est également possible que Nvidia ait une autre carte dans sa manche dont nous ne connaissons pas encore l’existence. Les détails de l’architecture Blackwell de nouvelle génération du géant des GPU restent rares.
Mis à part la nomenclature, Clarke a suggéré que la prochaine puce offrirait l’occasion de mettre en valeur l’expertise de Dell dans d’autres formes de refroidissement liquide à grande échelle. Il a évoqué « des éléments liés à la chimie des fluides et aux performances, notre travail d’interconnexion, la télémétrie que nous effectuons, le travail de gestion de l’énergie que nous effectuons » comme des étapes vers des alternatives au refroidissement liquide direct, même pour les puces très denses.
Nvidia a refusé de commenter – comme on pouvait s’y attendre, étant donné que sa conférence annuelle GTC n’aura lieu que dans quelques semaines. Le registre sera sur place lors de l’événement pour vous apporter tous les détails dès leur arrivée.
Le B100 ne devrait pas être lancé avant fin 2024 après celui de Nvidia. bande passante saturée Les GPU H200 font leurs débuts au premier semestre.
Annoncé fin 2023, le H200 est une actualisation du H100 avec jusqu’à 141 Go de mémoire HBM3e, ce qui correspond à un énorme 4,8 To/s de bande passante. Nvidia affirme que l’appareil peut doubler les performances des modèles à grand langage, notamment Llama 70B, grâce aux piles de mémoire HBM3e de la puce.
Même si deux nouveaux accélérateurs devraient arriver sur le marché cette année, les analystes préviennent que l’offre de GPU de Nvidia restera limitée. C’est malgré rapports prédire que Nvidia pourrait expédier plus du triple des expéditions de GPU en 2024.
Au-delà de ses nouveaux accélérateurs, la feuille de route de Nvidia prévoit également des cartes réseau et des commutateurs InfiniBand et Ethernet plus rapides et plus performants, capables de 800 Go/s de bande passante par port avant la fin de l’année. ®
2024-03-05 10:27:00
1709627111
#dirigeant #Dell #révèle #Nvidia #GPU #watts #préparation #Register