2024-12-04 14:05:00
MADRID, 4 déc. (Portail/EP) –
Amazon Web Services (AWS) a annoncé le lancement des instances de calcul Amazon Elastic Compute Cloud (Amazon EC2) Trn2, équipées de puces Trainium2 et conçues spécifiquement pour les applications d’intelligence artificielle (IA) génératives.
La société a présenté Trainium2 lors de l’édition précédente d’AWS re:Invent, où elle a annoncé qu’elle continuait à travailler pour offrir aux clients davantage de possibilités d’exécuter n’importe quelle application ou charge de travail avec cette puce et Graviton4.
Le PDG d’AWS, Matt Garman, a annoncé lors de la conférence annuelle 2024, qui a débuté ce lundi, la disponibilité générale d’instances de son service Web ayant la capacité de informatique évolutive à la demande Amazon EC2 optimisé par AWS Trainium2.
En ce sens, s’est souvenu Les nouvelles instances Amazon EC2 Trn2 sont spécialement conçues pour la formation d’apprentissage en profondeur hautes performances des modèles d’IA, y compris les modèles de langage étendu (LLM) et les modèles de diffusion latente.
Il a également souligné que Trn2 est l’exemple de Amazon EC2 des performances plus élevées pour l’apprentissage profond et l’IA générative, offrant un rapport prix/performances 30 à 40 % supérieur à celui de la génération actuelle d’instances basées sur des unités de traitement graphique (GPU).
En effet, une seule instance de Trn2 combine 16 nouvelles puces Trainium2 interconnectées avec une bande passante ultra-rapide NeuronLink, ainsi qu’une interconnexion puce à puce à faible latence, avec 20,8 pétaflops de traitement de pointe.
AWS a également noté que pour les modèles plus grands nécessitant plus de calcul, il a travaillé sur le Trn2 UltraServeurs, des serveurs virtuels qui permettent aux développeurs de logiciels de disposer d’une capacité de traitement redimensionnable pour n’importe quelle charge de travail.
Grâce à ces nouveaux systèmes, les clients peuvent faire évoluer leurs charges de travail pour améliorer les performances d’inférence en temps réel pour les modèles comportant des milliards de paramètres en production. En ce sens, l’entreprise a indiqué qu’elle construisait un UltraCluster EC2 Les Ultraservers Trn2 jumelés à Anthropic.
Ce projet s’appelle Projet Rainierqui étendra la formation de modèles distribués via des puces Trainium2 interconnectées aux réseaux EFA, c’est-à-dire des interfaces réseau pour les instances Amazon EC2 qui permettent aux clients d’exécuter des applications nécessitant des niveaux élevés de communication entre les nœuds à l’échelle AWS.
Las Instances de calcul Trn2 désormais disponibles dans la région AWS d’une partie des États-Unis, plus précisément dans l’Ohio, et sera bientôt étendu à d’autres régions. Les Trn2 UltraServers, quant à eux, sont dans une version préliminaire pour les tests.
TRAINIUM3
La société a également annoncé lors de cette réunion Trainium3, sa puce IA de nouvelle génération, qui permettra aux clients de créer plus rapidement différents modèles plus grands, ainsi que d’offrir des performances en temps réel supérieures dans leur mise en œuvre.
Ce seront les premiers jetons d’AWS fabriqué avec un nœud de processus de 3 nanomètres (3 nm), qui établira une nouvelle norme en matière de performance, d’efficacité énergétique et de densité.
Ainsi, les serveurs cloud utilisés pour former les programmes d’IA (UltraServers) avec la technologie Trainium3 devraient avoir quatre fois les performances des UltraServers Trn2. Grâce à cela, les clients Ils pourront itérer encore plus vite en créant des modèles et en offrant des performances en temps réel supérieures dans votre déploiement.
Amazon Web Services a enfin annoncé que les premières puces Trainium3 devraient être disponibles à la fin de l’année prochaine.
#Les #instances #Amazon #EC2 #alimentées #par #les #puces #Trainium2 #sont #désormais #disponibles
1733313544