Les considérations de performances de RDNA 3 pourraient-elles être erronées ?

Les considérations de performances de RDNA 3 pourraient-elles être erronées ?

Le consensus médiatique actuel concernant les performances et les paramètres des architectures graphiques à venir semble être que RDNA 2 sous la forme de Navi 31 visait des performances légèrement supérieures à celles Lovelace sous la forme AD102. Nvidia a donc décidé d’augmenter les performances en fixant des fréquences d’horloge plus élevées (et en augmentant légèrement le nombre d’unités de calcul actives au sein de la GeForce RTX 4090), ce qui a également entraîné une augmentation des besoins en énergie. Par conséquent, les performances des deux solutions ne devraient pas être radicalement différentes.

Le problème est que ces projections de performances ne correspondent pas aux paramètres connus. Récemment, des informations sur les horloges ±nales de la GeForce RTX 4090 ont commencé à apparaître, ce qui complète les données sur les deux produits phares de la nouvelle génération. Mais il y a quelque chose qui cloche dans leur comparaison.

Commençons par les paramètres du matériel existant (nous prendrons en compte les fréquences d’horloge habituelles, c’est-à-dire Game Clock pour AMD et Boost pour Nvidia). La Radeon RX 6900 XT est équipée de 5120 processeurs de flux à 2015 MHz. Ce qui correspond à une performance arithmétique de 20,6 TFLOPS. La GeForce RTX 3090 est équipée de 10496 processeurs de flux à 1695 MHz, ce qui correspond à 35,6 TFLOPS. Les performances globales du jeu sont à peu près comparables avec ces paramètres (les petites différences sont insignifiantes du point de vue de la comparaison suivante).

Radeon RX 7900 XT (ou en tant que modèle haut de gamme construit sur GPU Navi 31 nommera) transportera 12288 processeurs de flux et devrait fonctionner à 3050 MHz. La GeForce RTX 4090 est censée offrir 16384 processeurs de flux et une fréquence d’horloge de 2520 MHz. Cela nous amène à 75,0 TFLOPS pour Radeon et 82,6 TFLOPS pour GeForce. En eux-mêmes, ces chiffres ne nous disent rien. Mais remarquez la comparaison intergénérationnelle. Alors qu’avec Radeon à 20,6 TFLOPS → 75,0 TFLOPS on atteint 3,6 fois les performances arithmétiques entre générations, avec GeForce à 35,6 TFLOPS → 82,6 TFLOPS on atteint 2,3 fois les performances arithmétiques entre générations.

Simplement et brièvement : si nous avons maintenant deux produits aux performances comparables sur le marché et que nous augmentons les performances de l’un de 3,6x et de l’autre de 2,3x, le résultat ne peut plus être deux produits aux performances comparables. Donc, quelque chose ne va pas ici, et beaucoup.

Si nous ne supposons pas que la Radeon RX 7900 XT sera miraculeusement> 50% plus rapide que la GeForce RTX 4090 (et en même temps aura une consommation nettement inférieure), alors nous devons chercher des raisons ailleurs, à savoir dans les changements d’architecture intergénérationnels . On s’attend à ce que Nvidia augmente l’utilisation des unités arithmétiques, de sorte que le FPS de jeu par FLOP sera légèrement supérieur à celui de la génération actuelle. Cependant, il ne s’agira guère d’un changement nettement supérieur à ~ 10% pour tenir compte de la différence de performances d’environ 50%.

Il faut donc chercher du côté des Radeon ou du RDNA 3. Il semble que la plupart des leakers aient accès aux bons paramètres de la puce, mais il est possible qu’ils interprètent mal ces paramètres. Le nombre de processeurs de flux a augmenté entre les générations de 5120 à 12288. La plupart des leakers (ou leurs sources) en déduisent automatiquement que cela se traduira par une augmentation (12288/5120) 2,4 fois des performances (+ augmentation des horloges). Cependant, ce calcul est basé sur l’hypothèse que le nombre d’autres unités qui contribuent aux performances du jeu, c’est-à-dire les unités de texturing et les ROP, augmentera au même rythme que le nombre de processeurs de flux.

Mais d’une part, cela n’a pas encore été confirmé, et d’autre part, avec cette hypothèse, le glissement intergénérationnel vient du domaine des contes de fées (3,6x, voir paragraphe gras ci-dessus). Il n’est donc pas possible qu’AMD ait franchi une étape similaire avec RDNA 3 comme Nvidia l’a fait avec la génération Ampère et doublé le rapport des unités arithmétiques aux unités de texture ?

Rappelons que Turing avait 16 unités arithmétiques (stream-processors) par unité de texturing (la GeForce RTX 2080 Ti avait 4352 unités arithmétiques et 272 unités de texturing), tandis qu’Ampere augmentait le ratio à 32 unités arithmétiques par unité de texturing (pour la GeForce RTX 3090 c’est 10496 et 328). Si AMD voyait une raison à une telle modification, cela voudrait dire que sur les 5120 unités arithmétiques et 320 unités de texturing de l’actuel Navi 21 (RDNA 2) neposuneme u Navi 31 à 12288 unités arithmétiques et 768 unités de texture, mais à 12288 unités arithmétiques et 384 unités de texture.

GeForce
RTX 2080Ti
GeForce
RTX 3090
GeForce
RTX 4090
Radéon
RX 6900 XT
Radéon
RX 7900 XT
architecteTuringAmpèreLovelaceRDNA 2 RDNA 3
PS43521049616384512012288
TMU272328512320768 384 ?
Rapport SP:TMU16:132:132:116:116:1 32:1 ?

Cela voudrait dire qu’entre Navi 21 (Radeon RX 6900 XT) a Navi 31 (Radeon RX 7900 XT) les performances arithmétiques augmenteront de 3,6x entre les générations (y compris les fréquences d’horloge), mais les performances de texturation n’augmenteront que de 1,8x. Nous ne savons pas encore comment le taux de remplissage va évoluer, car le nombre de ROP n’est pas connu.

La configuration décrite serait beaucoup plus conforme aux rapports de performances similaires des deux produits concurrents et à leur consommation attendue. C’est-à-dire à propos d’un changement intergénérationnel qui est beaucoup plus proche du double que du triple.

Facebook
Twitter
LinkedIn
Pinterest

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.