Limites, risques et opportunités du machine learning dans le domaine de la santé

Limites, risques et opportunités du machine learning dans le domaine de la santé

2024-06-06 10:47:44

Voyons comment fonctionnent les technologies les plus utilisées aujourd’hui dans le secteur de la santé, à commencer par le Machine Learning.

Dans le dernier article (que vous pouvez retrouver ici) nous nous sommes demandé à quel point l’IA est intelligente, si elle est fiable et objective, c’est-à-dire dans quelle mesure elle peut réellement être utile dans les différents domaines d’utilisation que j’avais évoqués. Pour tenter d’apporter quelques réponses à ces questions, il est nécessaire d’examiner comment fonctionnent les technologies les plus utilisées aujourd’hui dans le secteur de la santé. Commençons par le machine learning, la traduction italienne de l’expression Machine Learning.

Comme je l’ai promis, je vais essayer d’expliquer ces technologies de manière simple même si, pour arriver à ce résultat, je devrai nécessairement simplifier certains concepts plus complexes. Les experts ne m’en veulent pas et je m’excuse désormais si j’écris des inexactitudes. Les commentaires, comme toujours, sont les bienvenus, tout comme la volonté d’accueillir les contributions d’autres auteurs.

L’apprentissage automatique est une forme d’intelligence artificielle (IA) qui permet aux systèmes d’information d’apprendre à effectuer des tâches sans être explicitement programmés pour le faire. Contrairement à la programmation traditionnelle, dans laquelle les développeurs écrivent des algorithmes pour indiquer aux ordinateurs les étapes nécessaires à l’exécution de fonctions simples, l’apprentissage automatique utilise des collections d’échantillons de données pour créer des modèles qui font des prédictions ou des choix en fonction des données qu’ils souhaitent analyser. Il existe de nombreux types d’apprentissage automatique, notamment l’apprentissage profond dans lequel les systèmes d’IA imitent la structure et le comportement du cerveau biologique à l’aide de réseaux neuronaux artificiels.

Pour créer un modèle avec du machine learning, vous avez donc besoin de données qui doivent être exactes, pertinentes et représentatives des cas que vous souhaitez gérer. Plus vous disposez de données pour entraîner le modèle, meilleures seront son efficacité et sa précision. Comme dans un échantillon statistique, il est important que les cas soient bien répartis et pondérés, afin d’éviter de créer des modèles qui pourraient souffrir de “les préjugés” ou être “conditionné» à partir d’aspects tels que l’âge, le sexe, la race, etc.

La disponibilité et la qualité des données sont l’aspect le plus critique pour cette forme d’IA. Il n’est pas facile de disposer de grandes quantités de données pour entraîner des modèles, également pour des raisons de confidentialité. Dans certains cas, il est possible d’acheter des jeux de données pour entraîner des modèles, par exemple des bibliothèques d’images radiologiques, mais il n’est pas toujours facile d’évaluer la qualité de ces données.

Il existe différents modes d’apprentissage automatique : supervisé, non supervisé et renforcé.

Dans la première, la machine (Machine) apprend (Learning) à associer certaines caractéristiques à des étiquettes, en traitant les données contenues dans l’ensemble de données d’entraînement qui ont déjà été étiquetées par les opérateurs humains. Dans notre cas, par exemple, un ensemble de données cliniques dans lesquelles, pour chaque ensemble de caractéristiques du patient, signes et symptômes, paramètres vitaux, résultats de laboratoire, diagnostics antérieurs, est associé le diagnostic réalisé par un médecin. Grâce à la formation, le système apprend à associer ces informations à un diagnostic, afin de suggérer le diagnostic le plus probable lorsque nous présentons un cas avec les informations attendues. Ces algorithmes sont appelés «classificateurs» et servent par exemple à formuler un diagnostic ou à indiquer un risque.

Plus formellement, nous pouvons dire que ces méthodes fonctionnent en trouvant une fonction qui, étant donné un ensemble de données, est variable, parlons de « régression ». Ce dernier s’efforce de créer des modèles prédictifs qui, sur la base des données d’entrée, sont capables de prédire, par exemple, le pronostic d’un patient et le nombre de jours d’hospitalisation.

Dans l’apprentissage non supervisé, des données non étiquetées sont utilisées. Grâce à la formation, le modèle apprend à diviser l’ensemble de données en groupes ou clusters en fonction de caractéristiques partagées. Ces modèles sont utilisés dans le domaine de la santé pour profiler les patients selon différents critères, par exemple par pathologie, intensité des soins, risque clinique, etc. En général, il est plus facile de trouver des ensembles de données non étiquetés sur lesquels, avec des affinements ultérieurs, vous pourrez trouver le modèle de clustering le mieux adapté à vos besoins.

Il existe également un troisième mode d’apprentissage automatique dit renforcé. Dans ce cas, la machine est entraînée à exécuter une tâche en procédant par essais et erreurs. Chaque fois que la machine fait une erreur, elle reçoit un «Châtiment“, alors que quand c’est fait correctement un “récompense« . Par approximations successives, le système apprend à remplir sa fonction de la meilleure façon possible. C’est une méthode normalement utilisée dans des contextes où l’on interagit avec le milieu environnant, par exemple la robotique.

Pour résoudre des problèmes complexes, on utilise des réseaux de neurones artificiels, des modèles d’apprentissage automatique basés sur des algorithmes qui utilisent des structures qui ressemblent au cerveau humain, c’est-à-dire des réseaux de nœuds interconnectés – les neurones – qui sont organisés en plusieurs niveaux. Les nœuds de chaque niveau reçoivent, traitent et envoient des données au suivant jusqu’à ce qu’un résultat soit obtenu. À l’aide des données de formation, les programmeurs expliquent au modèle comment apprendre à fournir les résultats attendus.

Les niveaux internes sont appelés niveaux “caché” car les données contenues ne sont pas visibles pour les utilisateurs qui interagissent uniquement avec celles d’entrée et de sortie. Les réseaux plus complexes peuvent inclure des centaines de couches cachées.

L’apprentissage automatique a de nombreuses applications dans le domaine de la santé. Entre ceux-ci :

  • Formuler un diagnostic à partir d’une série d’informations
  • Estimer le risque d’un patient pour un résultat spécifique, aidant ainsi le médecin à définir des thérapies plus efficaces
  • Identifiez les patients susceptibles de mieux répondre à une thérapie particulière, en orientant le médecin vers la meilleure stratégie de traitement (médecine de précision).
  • Identifiez de nouveaux prédicteurs de risque, améliorant ainsi la précision du diagnostic par rapport aux méthodes traditionnelles.
  • En imagerie où, grâce à la capacité des algorithmes à reconnaître des modèles au-delà de la perception humaine, ils dépassent parfois les performances des radiologues.

Mais quelle est la fiabilité de ces algorithmes ? Peuvent-ils être utilisés en pratique clinique ? Et si oui, comment ? Nous en parlerons dans le prochain article.

2 – Continuer



#Limites #risques #opportunités #machine #learning #dans #domaine #santé
1717696556

Facebook
Twitter
LinkedIn
Pinterest

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.