Amazon Web Services (AWS) cherche à aider les entreprises à simplifier la complexité du déploiement cloud. C’est une approche que Werner Vogels, CTO d’AWS, qualifie de « simplexité ».
Lors de la conférence AWS re:Invent 2024 cette semaine à Las Vegas, le géant du cloud a présenté une série de mises à jour conçues pour aider les organisations à faire face à une complexité croissante. Les innovations couvrent tous les aspects du portefeuille AWS, y compris l’infrastructure cloud, la sécurité, les outils de développement, le stockage et, bien sûr, l’intelligence artificielle (IA).
Ces annonces représentent la stratégie globale d’AWS visant à maintenir son leadership en matière de cloud computing tout en se développant de manière agressive dans l’infrastructure et les applications d’IA générative.
Les principales annonces d’AWS re:Invent 2024 incluent :
Calcul : serveurs Trainium2 et Trainium2 Ultra – nouveaux processeurs d’IA personnalisés et clusters de calcul hautes performances
IA : Amazon Nova — nouvelle famille de modèles de base, notamment Nova Canvas (image) et Nova Reel (vidéo)
Développeur : agents autonomes Q Developer pour les tests, la documentation et la révision du code
Stockage : seaux de table S3 optimisés pour Apache Iceberg
« Il n’y a jamais eu de meilleur moment pour innover », a déclaré Matt Garman, PDG d’AWS, lors de son discours d’ouverture à AWS re:Invent 2024. “Et vous n’avez jamais eu accès à un ensemble aussi riche d’outils performants pour vous aider à le faire.”
re:Invent détaille l’infrastructure cloud de nouvelle génération pour l’IA
La grande mise à jour du portefeuille de calcul AWS est l’introduction des nouvelles instances Trn2 alimentées par Trainium2 sur le service EC2.
Ces instances offrent des performances 4 fois plus rapides, une bande passante mémoire 4 fois supérieure et une capacité mémoire 3 fois supérieure à celles de leurs prédécesseurs. Les instances Trn2 disposent de 192 processeurs virtuels, de 2 tébioctets (TiB) de mémoire et de 3,2 térabits par seconde (Tbit/s) de bande passante réseau, ce qui les rend idéales pour la formation et le déploiement de grands modèles de langage et de modèles de base. Garman a déclaré que les nouveaux processeurs personnalisés offrent un rapport prix/performances de 30 à 40 % supérieur à celui des instances actuelles alimentées par GPU.
Productivité améliorée des développeurs
AWS a développé ses outils de développement ces dernières années et a annoncé lors de re:Invent 2024 une série de mises à jour.
Amazon Q Developer a reçu des mises à jour importantes axées sur l’automatisation des tâches de développement courantes. Les nouvelles fonctionnalités de l’agent incluent la génération automatisée de documentation, les révisions de code et les tests unitaires. Ces fonctionnalités sont conçues pour rationaliser le processus de développement logiciel et améliorer la qualité du code tout en réduisant les efforts manuels.
Les nouveaux agents autonomes Q Developer représentent une avancée significative dans le développement de logiciels automatisés.
“Q peut désormais créer automatiquement une documentation précise pour vous”, a déclaré Garman. “Ce qui est intéressant, c’est qu’il ne s’agit pas seulement d’un nouveau code : l’agent Q peut également s’appliquer au code existant.”
AWS pose une nouvelle fondation pour l’IA avec Nova
Lors d’AWS re:Invent 2024, le PDG d’Amazon, Andy Jassy, a annoncé Amazon Nova, une nouvelle famille de modèles de base qu’il a décrit comme 75 % moins cher que les autres modèles leaders. La famille Nova comprend des modèles de texte et multimodaux spécialisés, tels que Nova Canvas pour la génération d’images et Nova Reel pour la création vidéo.
“Ces modèles ne sont pas seulement intégrés dans Bedrock, mais ils sont profondément intégrés à toutes les fonctionnalités de Bedrock que tout fournisseur de modèles peut utiliser”, a souligné Jassy.
Les modèles Nova seront intégrés au service Amazon Bedrock, qui devrait également bénéficier d’une série d’optimisations des coûts et d’améliorations des performances :
Routage intelligent des invites : cette fonctionnalité achemine automatiquement les requêtes entre différents modèles au sein de la même famille en fonction de la complexité des requêtes, réduisant potentiellement les coûts jusqu’à 30 % sans compromettre la précision.
Mise en cache des invites : une nouvelle fonctionnalité d’aperçu qui permet la mise en cache du contexte fréquemment utilisé sur plusieurs appels de modèles, promettant des réductions de coûts allant jusqu’à 90 % et des améliorations de la latence jusqu’à 85 % pour les modèles pris en charge.
Werner Vogels, CTO d’Amazon, a déclaré au public de re:Invent 2024 que la mission d’AWS est de rendre l’expérience client aussi simple que possible.
Pourquoi la « simplexité » est la clé de la gestion du chaos dans le cloud
Le discours final de la conférence re:Invent 2024 était celui du CTO d’Amazon, Werner Vogels. Lors de son discours d’ouverture, Vogels a partagé les principales leçons tirées de ses 20 ans de carrière chez Amazon pour gérer la complexité. Vogels a souligné que la mission d’AWS a toujours été de prendre en charge le fardeau de la complexité pour les clients et de rendre l’expérience client aussi simple que possible.
C’est une approche en six étapes qu’il appelle la simplexité.
1. Faire de l’évolutivité une exigence : les systèmes doivent être conçus pour évoluer au fil du temps.
“Nous savions que nous n’utiliserions pas la même architecture dans un an”, a déclaré Vogels.
2. Divisez la complexité en morceaux : Décomposez les grands services en composants plus petits et faiblement couplés.
3. Alignez l’organisation sur l’architecture : concentrez-vous sur l’appropriation et évitez la complaisance.
“Soumettez un problème à vos équipes et donnez-leur la liberté d’agir et l’espace nécessaire pour le résoudre”, a-t-il déclaré.
4. Organisez-vous en cellules : utilisez une architecture basée sur les cellules pour isoler les problèmes. Les cellules doivent être suffisamment grandes pour gérer la charge de travail la plus importante, mais suffisamment petites pour permettre des tests à grande échelle.
5. Concevoir des systèmes prévisibles : réduire l’impact de l’incertitude grâce à une conception prévisible.
6. Automatisez la complexité : automatisez tout ce qui ne nécessite pas un jugement élevé.
« Plutôt que de demander : « Que devrions-nous automatiser ? » la bonne question est : « Qu’est-ce que nous n’automatisons pas ? » », a déclaré Vogels.
#AWS #cherche #conquérir #complexité #cloud #avec #Simplexity