l’évolution vers l’apprentissage fédéré

2024-08-25 21:47:55

Pour fonctionner correctement, un pourcentage élevé d’algorithmes d’intelligence artificielle (IA) nécessitent une phase préalable appelée apprentissage.

Dans ce document, les informations disponibles sont utilisées pour entraîner des algorithmes à effectuer une tâche spécifique.

Par exemple, dans le domaine de la détection précoce du cancer, une tâche pourrait être que l’algorithme, lors de l’analyse d’un test d’imagerie diagnostique (TDM, échographie, IRM, radiographie) ainsi que des données du patient (données démographiques, antécédents médicaux, antécédents familiaux , etc.), est capable d’indiquer s’il s’agit d’une tumeur potentiellement maligne ou non.

Pour ce faire, dans la phase de formation, on vous montre l’ensemble des données et des tests de diagnostic de différents patients, en indiquant dans chaque cas de quel type de tumeur il s’agit.

De cette manière, il devrait être capable, une fois entraîné, d’identifier les paramètres, tant à partir de l’histoire que des images diagnostiques, qui pointent vers une pathologie. L’un des facteurs clés est que l’algorithme a été entraîné avec un large éventail de cas.

Écran typique d’un logiciel diagnostic utilisant l’intelligence artificielle, montrant une vue 3D et trois vues MPR.
Wikimedia Commons, CC BY

Traditionnellement, les étapes de entraînement Auparavant, elles étaient réalisées en collectant des informations auprès de différents patients qui étaient envoyées à un serveur central. Celui-ci était chargé de le stocker et de former le système d’IA.

Une fois formées, les données d’un nouveau patient seraient envoyées du centre médical au serveur pour demander à l’algorithme son évaluation et, après avoir attendu la réponse, elles seraient renvoyées au centre médical d’origine.

Lire aussi  Old School Rally vous invite à de nouvelles courses comme sur PS1 » Vortex

Le problème des données sensibles

En lisant ce processus, vous aurez sûrement déjà remarqué l’un des inconvénients des systèmes d’apprentissage centralisés : la confidentialité des informations.

Dans un sujet aussi sensible que la santé, partager des données confidentielles avec des tiers ne semble pas être une mesure appropriée.

Ce n’est pas la seule faiblesse de l’approche centralisée. Nous avons fait remarquer qu’il est important d’entraîner l’algorithme avec un ensemble de données variées et représentatives, cela implique un volume très élevé d’informations qui doivent être collectées, stockées et traitées.

Par ailleurs, le temps d’attente Depuis l’envoi de la demande d’évaluation à l’algorithme jusqu’à sa réception, elle peut affecter le déroulement du processus médical, comme dans le cas d’un accident cardiovasculaire, où les délais de réaction sont essentiels.

Dans le but de résoudre ces trois difficultés – garanties de confidentialité, gestion de gros volumes d’informations et temps de réponse des algorithmes – un nouveau paradigme appelé apprentissage fédéré (DE).

Coordonner et répartir le travail

Dans un système AF, l’intelligence artificielle n’est pas formée et exécutée sur un seul serveur central, mais plutôt de manière coopérative entre un ensemble d’éléments propriétaires des données et est exécutée individuellement et localement sur chacun d’eux.

Dans notre exemple médical, les éléments qui collaborent au processus d’apprentissage seraient les différents systèmes de santé qui souhaitent travailler de manière coordonnée. Chacun d’entre eux sauvegarde et conserve les données de ses patients, qui ne sont en aucun cas partagées.

Lire aussi  l'astéroïde 2023 CX1 e+ en photos astronomiques de la semaine

Ces données sont utilisées pour entraîner le même algorithme de détection précoce du cancer. Il y aura autant d’algorithmes en cours d’exécution que de systèmes de santé participeront au réseau AF.

Échange d’informations dans un système d’apprentissage fédéré.
Rebeca P. Díaz utilisant des icônes de Flaticon.es.

Comment alors parvenir à une collaboration entre eux sans partage de données confidentielles ? L’essentiel est qu’au lieu de partager les données médicales des patients, un résumé de ce qui a été appris à partir de ces données médicales soit partagé.

En termes plus techniques, cette synthèse serait l’ensemble des paramètres qui caractérisent le système d’IA (aussi appelé modèle d’algorithme).

La valeur de ces paramètres varie à mesure que le processus d’apprentissage progresse, s’adaptant aux données avec lesquelles l’algorithme a été entraîné. Le résumé établit donc une vision locale : celle formée par les patients de ce système de santé.

Périodiquement, des résumés locaux sont envoyés à un serveur central qui se charge de les combiner dans un nouveau résumé ou modèle, mais cette fois global, puisqu’il a appris des données des patients de différents systèmes de santé.

Ce modèle global est renvoyé et, dans chaque système de santé, il sera combiné avec le modèle local pour créer un modèle enrichi qui a appris de ses propres données et de celles des autres.

Lire aussi  Les règles du bivouac en Belgique : dormir à la belle étoile en respectant la nature

Ce paradigme, en plus d’atténuer les risques liés à la vie privée, offre une solution d’évolutivité, puisqu’il n’est pas nécessaire de gérer des volumes de données aussi élevés que dans l’apprentissage traditionnel.

De plus, il est possible d’ajouter de nouvelles sources d’information et d’apprentissage en ajoutant de nouveaux éléments informatiques locaux – les systèmes de santé dans notre exemple. Ceci est important pour améliorer la diversité des données et éviter les biais dans les résultats.

Enfin, on obtient une exécution plus agile qui ne dépend pas des temps de latence dans les communications, puisque la requête à l’algorithme n’est pas adressée au serveur central, mais au système de santé lui-même.

Les défis de l’apprentissage fédéré

L’une des pistes à explorer est l’évolution vers un apprentissage décentralisé, où cet élément central d’agrégation n’existe plus.

Au lieu de cela, les différents éléments qui exécutent les algorithmes d’IA partagent directement entre eux les connaissances acquises ou résumées.

Les drones (photo Predator tirant un missile Hellfire) enrichissent leurs connaissances grâce à l’apprentissage fédéré.
Brigadier Lance Mans, Centre de coordination des opérations spéciales de l’OTAN, CC BY

Cela facilite l’agilité dans les environnements mobiles : comme les systèmes de vision artificielle dans les réseaux de drones ou les systèmes de conduite autonome.

D’un autre côté, et bien qu’il ait été mentionné que cette technologie atténue les risques liés à la vie privée, il est important de souligner qu’elle ne les évite pas complètement.

En ce sens, il y a des enquêtes les efforts continus pour protéger les réseaux AF contre les attaques qui tentent de modifier intentionnellement le modèle global ou de déduire des informations sensibles via l’analyse de modèles partagés.



#lévolution #vers #lapprentissage #fédéré
1724647937

Facebook
Twitter
LinkedIn
Pinterest

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.