United Airlines s’est appuyée sur des données en temps réel pour se remettre de la panne de CrowdStrike

United Airlines ne pensait pas aux mises à jour logicielles, à la détection des menaces ou aux pannes informatiques lorsqu’elle a donné la priorité aux capacités de données en temps réel dans sa stratégie technologique. Le DSI Jason Birnbaum avait en tête l’amélioration de l’expérience client et l’efficacité opérationnelle.

“Nos clients voulaient et imploraient des informations”, a déclaré Birnbaum. “Nous avions besoin de meilleurs moyens de les fournir plus rapidement et avec plus de précision dans une langue qu’ils comprenaient, et pas seulement dans le jargon des compagnies aériennes.”

United s’est également attaché à fournir des données en temps réel à ses propres employés, à la fois en période d’exploitation normale et en cas de crise liée aux conditions météorologiques. Une mise à jour défectueuse du fournisseur de cybersécurité CrowdStrike qui fait tomber des millions d’ordinateurs à l’aube du 19 juillet n’était pas sur le radar de Birnbaum.

« Nous sommes constamment perturbés, qu’il s’agisse d’un ouragan, d’une tempête de neige ou autre. Nous devons être prêts à prendre des décisions et à récupérer rapidement », a déclaré Birnbaum au CIO Dive. « Nous avions investi dans nos capacités de récupération, renforcées par la communication entre différents groupes du réseau. Nous disposons tous des mêmes données et regardons tous le même écran. Nous avons donc pu exploiter de nombreux éléments dans une situation très difficile.

Les DSI mettent en place des technologies et des processus pour assurer le fonctionnement de l’entreprise lorsque des problèmes surviennent. L’événement CrowdStrike a rappelé douloureusement qu’il est difficile de se préparer à l’imprévisible.

Les compagnies aériennes ont été particulièrement touchées. United devait immobilisé près de 700 vols le vendredi 19 juillet, et plus de 700 les deux jours suivants, selon service de suivi FlightAware. Mais, alors que Delta a immobilisé plus de 1 000 vols le lundi 22 juillet, et des centaines d’autres le lendemain, les annulations quotidiennes de United sont tombées en dessous de 100.

La restauration a demandé de l’agilité et une capacité à se mobiliser rapidement. Des équipes de techniciens ont été dépêchées sur redémarrer plus de 26 000 ordinateurs et des terminaux dans 365 aéroports, a détaillé le PDG d’United, Scott Kirby, dans une lettre ouverte trois jours seulement après le début de la crise.

« Nous avons une organisation qui soutient ce domaine, mais nous n’avons pas de personnel partout », a déclaré Birnbaum. «Ils sont montés dans leur voiture, ils se sont rendus à certains endroits, certains ont amené leurs enfants et ils ont fait tout ce qu’ils pouvaient pour que cela continue. Il n’existe pas de tableau de bord officiel, mais ma lecture de la situation est que nous avons été parmi les plus rapides du secteur à nous rétablir.

Du cloud à la périphérie

Le parcours de modernisation de United a pris son envol dans le cloud. L’informatique a conduit l’entreprise à repenser à l’échelle de l’entreprise la prise de décision et le partage de données. L’objectif plus large était de fournir aux clients des informations plus récentes et d’aider les équipages à maintenir les avions à l’heure.

La compagnie aérienne a choisi AWS comme fournisseur cloud préféré en 2021 et se rapprochait du fin d’une longue migration en avril, lorsque le directeur financier Mike Leskinen a annoncé qu’entre 70 % et 90 % de ses charges de travail étaient dans le cloud.

Moins de 24 heures avant le début de la panne de CrowdStrike, lors d’une conférence téléphonique sur les résultats le 18 juillet, Kirby et Leskinen ont félicité les équipes informatiques et opérationnelles de l’entreprise pour avoir réduit le temps de récupération et les coûts des interruptions périodiques.

Alors que United améliorait sa technologie et ses processus, Peter Weill, chercheur scientifique principal à la MIT Sloan School of Management et président du MIT CISR, explorait les avantages de entreprises en temps réel. Birnbaum a assisté à une présentation de Weill et a vu des parallèles qui ont placé United sur le radar des chercheurs.

“Jason s’est levé et a dit : ‘Attendez, c’est ce que nous essayons de faire à United'”, a déclaré Weill dans une interview avec CIO Dive.

Les recherches de Weill se sont concentrées sur les améliorations de l’expérience utilisateur auxquelles Birnbaum avait donné la priorité.

«Lorsque nous avons effectué nos recherches, il ne s’agissait pas vraiment de crise ou de risque», a déclaré Weill. « Il s’est concentré sur la façon dont vous rendez les clients et les employés plus heureux et plus agiles. Ils sont bien plus heureux lorsqu’ils obtiennent une réponse immédiate, qu’il s’agisse d’un avion ou d’un paiement.»

Bien qu’ancrées dans le cloud, les améliorations apportées par United étaient liées aux technologies de pointe qui permettaient aux équipes d’accéder aux données et aux communications en temps réel.

« Nous voulions améliorer la gestion de nos avions : ravitaillement en carburant, réparation, restauration et embarquement de tout le monde. Nous souhaitons mesurer environ 250 points de données différents en temps réel”, a déclaré Birnbaum.

L’année dernière, United a été la première compagnie aérienne approuvée par la Federal Aviation Administration à déployer la fonction iPad Touch ID d’Apple pour numériser les documents de maintenance, une mesure qui a permis d’éviter des milliers de retards de vols, a déclaré Linda Jojo, vice-présidente exécutive et directrice de la clientèle de la compagnie aérienne, a déclaré CIO Dive en octobre dernier.

« Nous avons investi – et de manière assez importante – dans les appareils mobiles, car nos employés ne sont pas assis derrière leur bureau », a déclaré Birnbaum. « Nos collaborateurs doivent pouvoir accéder aux données en déplacement. »

L’élément de confiance

La modernisation des données commence par la technologie, mais le succès se mesure par les utilisateurs finaux à travers la satisfaction et les gains de productivité.

« Il s’agit de faire confiance aux données, de faire confiance à vos collaborateurs pour prendre des décisions et à vos clients d’utiliser les données efficacement », a déclaré Weill.

Les DSI doivent également faire suffisamment confiance à leurs équipes pour céder un certain degré de contrôle, selon Weill. « Si vous ne modifiez pas les droits de décision, vous ne serez jamais une entreprise en temps réel », a-t-il déclaré. « La chose de loin la plus difficile, ce ne sont pas les données, les interfaces système ou les API ; il s’agit de modifier les processus de décision. »

Pour Birnbaum, desserrer les rênes n’a pas été facile.

« En tant que DSI, l’essentiel de ce qui vous permet de vous mesurer est de pouvoir informer le PDG de l’état de tout », a déclaré Birnbaum. « Vous finissez par passer beaucoup de temps à tout apprendre de tout le monde, par peur de ne pas savoir quelque chose lorsqu’on vous le demande. »

L’accès aux données en temps réel et aux équipes qui surveillent les résultats peut s’avérer plus efficace que le suivi de chaque développement mineur.

“Depuis neuf ans que je suis ici, nous avons eu beaucoup de bonnes idées”, a déclaré Birnbaum. «Mais nous avions vraiment du mal à les exécuter. Nous nous sommes désormais libérés pour nous attaquer à certaines de ces très bonnes idées – et on ne sait jamais où elles vont aboutir.

Facebook
Twitter
LinkedIn
Pinterest

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.