Home » Sciences et technologies » AMD simplifie le calcul avec le double emplacement Radeon Pro W7900 pour l’inférence IA

AMD simplifie le calcul avec le double emplacement Radeon Pro W7900 pour l’inférence IA

by Nouvelles
AMD simplifie le calcul avec le double emplacement Radeon Pro W7900 pour l’inférence IA

Alors que l’essentiel de la présentation Computex d’AMD portait sur les processeurs et leur gamme Instinct d’accélérateurs d’IA dédiés, la société propose également une petite actualisation de produit pour les professionnels des graphiques et de l’IA des postes de travail. AMD lance une version à double emplacement de sa carte Radeon Pro W7900 haut de gamme – bien nommée W7900 Dual Slot – dans le but d’améliorer la densité de calcul dans les postes de travail en permettant d’installer 4 des cartes dans un seul châssis.

La sortie d’une version à double emplacement de la carte intervient après que la Radeon Pro W7900 d’origine ait été la première fois qu’AMD a opté pour un facteur de forme plus grand à trois emplacements pour sa carte de poste de travail phare. La génération W7000 apportant une augmentation globale de la consommation électrique, poussant le W7900 à 295 watts, AMD a initialement choisi de lancer une carte plus grande pour une acoustique améliorée. Cependant, cela se faisait au détriment de la densité de calcul, car la plupart des systèmes ne pouvaient accueillir que deux des cartes les plus épaisses. En conséquence, AMD choisit également de publier une version à double emplacement du matériel, afin d’offrir un produit plus compétitif pour les systèmes de postes de travail à haute densité, en particulier ceux effectuant une inférence d’IA locale.

Comparaison des spécifications AMD Radeon Pro AMD Radeon Pro W7900DS AMD Radeon Pro W7900 AMD Radeon Pro W7800 AMD Radeon Pro W6800

bien
12288
(96 UC) 8960
(70 UC) 3840
(60 UC)

ROP
192 128 96

Augmenter l’horloge
2,495 GHz 2,495 GHz 2,32 Hz

Débit de pointe (FP32)
61,3 TFLOPS 45,2 TFLOPS 17,8 TFLOPS

Horloge mémoire
18 Gbit/s GDDR6 18 Gbit/s GDDR6 16 Gbit/s GDDR6

Largeur du bus mémoire
384 bits 256 bits 256 bits

Bande passante mémoire
864 Go/s 576 Go/s 512 Go/s

VRAM
48 Go 32 Go 32 Go

CEC
Oui
(DRAM) Oui
(DRAM) Oui
(DRACHME)

Cache infini
96 Mo 64 Mo 128 Mo

Puissance totale de la carte
295W 260W 250W

Processus de fabrication
GCD : TSMC 5 nm
MCD : TSMC 6 nm GCD : TSMC 5 nm
MCD : TSMC 6 nm, TSMC 7 nm

Architecture
RDNA3 RDNA3 RDNA2

GPU
Navires 31 Navires 31 Navires 21

Facteur de forme
Souffleur à double fente Souffleur à triple fente Souffleur à double fente Souffleur à double fente

Date de lancement
06/2024 T2’2023 T2’2023 06/2021

Prix ​​de lancement (PDSF)
3 499 $ 3 999 $ 2 499 $ 2 249 $

Outre le refroidisseur plus étroit, la Radeon Pro W7900DS est à toutes fins utiles identique au W7900 d’origine, avec le même GPU Navi 31 piloté aux mêmes vitesses d’horloge et la carte globale fonctionnant à la même puissance totale de la carte de 295 (TBP). ) limite. Ceci est associé au même GDDR6 à 18 Gbit/s qu’auparavant, donnant à la carte 48 Go de VRAM.

Officiellement, AMD n’a pas de spécification de bruit pour ces cartes. Mais vous pouvez vous attendre à ce que le W7900DS soit plus bruyant que son aîné à triple emplacement. De toute évidence, AMD utilise simplement le refroidisseur du W7800, qui était dès le départ une carte à double emplacement, de sorte que ce refroidisseur est chargé de gérer 35 W supplémentaires de dissipation thermique.

Comme la W7800 était également jusqu’à présent la carte à double slot la plus rapide d’AMD, elle constitue un point de comparaison approprié pour la densité de calcul. Avec son GPU Navi 31 complet, le W7900DS offrira environ 36 % de débit de calcul/pixel en plus que son frère/prédécesseur. Il s’agit donc d’une amélioration non négligeable pour le créneau très spécifique qu’AMD envisage pour la carte.

Et comme tant d’autres choses annoncées au Computex cette année, ce créneau est l’IA. Alors qu’AMD propose des versions PCIe de ses accélérateurs Instinct MI210, ces cartes sont destinées aux serveurs, avec des refroidisseurs entièrement passifs correspondant. Ainsi, le calcul au niveau du poste de travail est largement repris par les cartes de poste de travail Radeon Pro d’AMD, qui sont destinées à être intégrées dans un châssis de PC traditionnel et à utiliser un refroidissement actif (ventilateurs). Dans ce cas, AMD s’attaque spécifiquement aux charges de travail d’inférence locales, car c’est pour cela que le matériel Radeon et son important pool de VRAM sont les mieux adaptés.

La Radeon Pro W7900 Dual Slot sortira le 19 juin. Notamment, AMD présente la carte à un prix légèrement inférieur à celui du lancement du W7900 original l’année dernière, le W7900DS arrivant dans les rayons des magasins à 3 499 $, en baisse par rapport au prix initial de 3 999 $ du W7900.

ROCm 6.1 pour les Radeon arrive également

Parallèlement à la sortie du W7900DS, AMD fait également la promotion de la prochaine version Radeon de ROCm 6.1, leur pile logicielle pour le calcul GPU. Bien que la version de base ROCm 6.1 ait été introduite en avril, la version Windows de la pile logicielle d’AMD est toujours une version récente (et limitée en fonctionnalités). Cela devrait donc finalement passer à une version ROCm 6.1 le 19 juin, le jour même du lancement du W7900DS.

ROCm 6.1 pour Radeons devrait apporter quelques changements/améliorations majeurs à la pile, notamment en ce qui concerne l’extension de la portée des fonctionnalités disponibles. Notamment, AMD fournira enfin le support du sous-système Windows pour Linux 2 (WSL2), bien qu’à un niveau bêta, permettant aux utilisateurs de Windows d’accéder à l’ensemble de fonctionnalités et à l’écosystème logiciel beaucoup plus riches de ROCm sous Linux. Cette version intégrera également une prise en charge améliorée des configurations multi-GPU, un timing parfait pour le lancement de la Radeon Pro W7900DS.

Enfin, ROCm 6.1 considère TensorFlow intégré à la pile logicielle ROCm en tant que citoyen de premier ordre. Bien que cette question implique plus de complexités qu’on ne peut le résumer dans un simple article d’actualité, la prise en charge native de TensorFlow sous Windows était auparavant bloquée par l’absence de version Windows de la bibliothèque d’apprentissage automatique MIOpen d’AMD. En combinaison avec la prise en charge de WSL2, les développeurs disposeront désormais de deux manières d’accéder à TensorFlow sur les systèmes Windows.

2024-06-03 06:07:07
1717384428


#AMD #simplifie #calcul #avec #double #emplacement #Radeon #Pro #W7900 #pour #linférence

You may also like

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.