Microsoft Research dévoilé AIOpsLabun framework open source conçu pour faire progresser le développement et l’évaluation d’agents d’IA pour les opérations cloud. L’outil fournit une plate-forme standardisée et évolutive pour relever les défis liés au diagnostic des pannes, à l’atténuation des incidents et à la fiabilité des systèmes dans des environnements cloud complexes.
À mesure que les microservices et les architectures sans serveur deviennent la norme dans l’informatique d’entreprise, leur complexité introduit de nouveaux défis opérationnels. Les pannes peuvent perturber les opérations commerciales critiques, soulignant l’importance des outils conçus pour maintenir la disponibilité du système. De nombreuses solutions existantes dépendent de services propriétaires ou de méthodes ad hoc, qui peuvent manquer de flexibilité et de cohérence. AIOpsLab résout ces problèmes en fournissant un cadre standardisé pour évaluer et améliorer les agents AIOps dans divers environnements cloud.
AIOpsLab introduit plusieurs composants clés pour soutenir ses objectifs. Au cœur du framework se trouve l’interface Agent-Cloud (ACI), qui sépare l’agent IA du service d’application via un orchestrateur. Cet orchestrateur définit les tâches, valide les actions et interagit avec les API pour exécuter des stratégies de résolution de problèmes. Les tâches sont encore améliorées grâce à des générateurs de charges de travail et de pannes dynamiques, simulant des scénarios opérationnels réalistes tels que l’épuisement des ressources ou des pannes en cascade.
L’idée d’une telle interface a suscité l’intérêt de la communauté. Marco Casulaarchitecte de solutions chez Nestlé, commun son point de vue :
Idée intéressante. Nous préconisons également une couche d’orchestration pour gérer les états entre les utilisateurs et les robots. De plus, comme l’idée d’une interface prédéfinie pour tous les agents, cela facilite grandement la gestion des versions de l’infrastructure (nous l’appelons GenAI Virtual Agent Spec). Je vais y plonger davantage ; Je suis curieux de voir comment ils abordent des choses comme les actions hors domaine, hors sujet et requises.
En prenant en charge une gamme de tâches opérationnelles, notamment la détection des incidents, l’analyse des causes profondes et l’atténuation, AIOpsLab sert à la fois de référence et d’environnement de formation. Les chercheurs peuvent l’utiliser pour évaluer les performances des agents AIOps dans des conditions reproductibles tout en tirant parti de sa conception modulaire pour étendre le cadre à de nouvelles applications et défis.
AIOpsLab intègre également des frameworks d’agents populaires tels que React, Autogen et TaskWeaver, le rendant accessible à une large communauté de développeurs. Ses capacités d’injection de fautes permettent de tester en détail les interdépendances des systèmes, améliorant ainsi la résilience des services cloud.
De plus, AIOpsLab adhère aux normes de sécurité et aux principes d’IA responsable de Microsoft. Les plans incluent la collaboration avec des équipes d’IA générative pour intégrer AIOpsLab comme référence pour évaluer les modèles de pointe.
AIOpsLab est disponible en tant que projet open source sur GitHub sous licence MIT.
#Microsoft #Research #présente #AIOpsLab #cadre #pour #les #opérations #cloud #basées #sur #lIA