Les rhumatologues et leur personnel enregistrent consciencieusement l’activité de la maladie et les résultats rapportés par les patients depuis des décennies, et maintenant, toute cette corvée commence à porter ses fruits avec l’introduction de l’intelligence artificielle (IA) et des systèmes de traitement du langage naturel qui peuvent exploiter les dossiers de santé électroniques ( DSE) pour trouver des pépites d’or en recherche et prédire avec précision les résultats à court terme de la polyarthrite rhumatoïde (PR).
Jinoos Yazdany, MD
“Je pense que nous avons appris de nos toutes premières expériences que les modèles longitudinaux d’apprentissage profond peuvent prédire la polyarthrite rhumatoïde. [RA] résultats avec une efficacité réellement surprenante, avec moins de patients que nous pensions qu’ils seraient nécessaires », a déclaré Jinoos Yazdany, MD, MPH, chef du service de rhumatologie à l’hôpital général Zuckerberg de San Francisco et codirecteur de la qualité et de l’Université de Californie à San Francisco (UCSF). Laboratoire d’informatique.
Lors du Sommet de recherche sur la polyarthrite rhumatoïde 2024 (RA Summit 2024), présenté par l’Arthritis Foundation et l’Hospital for Special Surgery de New York, Yazdany a expliqué pourquoi les rhumatologues sont bien placés pour tirer parti de l’analyse prédictive et comment les systèmes de traitement du langage naturel peuvent être utilisé pour extraire des données des DSE auparavant difficiles à trouver, qui peuvent ensuite être appliquées aux pronostics et à la recherche sur la PR.
Des données à gogo
Les données du DSE peuvent être particulièrement utiles pour la recherche sur la PR en raison du grand volume d’informations, des données cliniques telles que les notes et l’imagerie, du moindre biais de sélection par rapport à d’autres sources de données telles que les cohortes ou les essais contrôlés randomisés, de l’accès en temps réel et du fait que de nombreux enregistrements contiennent des données longitudinales (suivi, etc.).
Cependant, les données du DSE peuvent présenter des lacunes ou un codage inexact, et les données telles que le texte et les images peuvent nécessiter un traitement et un nettoyage importants avant de pouvoir être utilisées pour faire avancer la recherche. En outre, les données du DSE sont soumises aux problèmes de confidentialité et de sécurité des patients, peuvent être en proie à des incompatibilités entre différents systèmes et peuvent ne pas représenter les patients qui ont moins accès aux soins, a déclaré Yazdany.
Elle a noté que la plupart des rhumatologues enregistrent certaines mesures de l’activité de la PR et de la fonction physique des patients, et que les résultats rapportés par les patients ont été systématiquement intégrés aux dossiers cliniques, en particulier depuis l’introduction en 1980 du questionnaire d’évaluation de la santé.
“En rhumatologie, en parvenant à un consensus et en élaborant un programme national de mesure de la qualité, nous disposons d’une stratégie nationale cohérente de sélection des mesures des résultats de la PR. Les résultats de la PR sont disponibles pour la majorité des patients vus par les rhumatologues, et c’est un atout essentiel des données de DSE”, a-t-elle déclaré. dit.
Transformer le texte en analyses
Le défi pour les enquêteurs qui souhaitent utiliser ce trésor de données sur la PR est que plus de 80 % des données sont sous forme de texte, ce qui soulève des questions sur la meilleure façon d’extraire les données sur les résultats et les informations sur la posologie des médicaments à partir du dossier écrit.
Comme décrit dans un article publié dans Soins et recherche sur l’arthrite en mars 2023, Yazdany et ses collègues de l’UCSF et de l’Université de Stanford ont développé un « pipeline » de traitement du langage naturel conçu pour extraire les résultats de la PR à partir de notes cliniques sur tous les patients inclus dans le registre du système informatique de rhumatologie pour l’efficacité (RISE) de l’American College of Rheumatology.
Le modèle a utilisé des termes sélectionnés par des experts et un outil de traitement de texte pour identifier des modèles et des scores numériques liés aux mesures de résultats dans les enregistrements.
“C’était un projet extrêmement difficile et ambitieux car nous avions de très nombreux sites, les données étaient très confuses, nous avions des tâches très compliquées. [independent review board] procédures, et nous avons en fait dû passer par des procédures de désidentification parce que nous utilisions ces données à des fins de recherche, nous avons donc beaucoup appris”, a déclaré Yazdany.
Le modèle a traité 34 millions de notes sur 854 628 patients dans 158 cabinets et 24 systèmes DSE différents.
Dans les études de validation internes, les modèles avaient une sensibilité de 95 %, une valeur prédictive positive (VPP) de 87 % et un score F1 (une mesure de la performance prédictive) de 91 %. En appliquant le modèle à un DSE d’un grand système de santé non-RISE pour une validation externe, le pipeline de traitement du langage naturel avait une sensibilité de 92 %, une VPP de 69 % et un score F1 de 79 %.
Les enquêteurs ont également examiné l’utilisation de grands modèles de langage OpenAI, notamment GPT 3.5 et 4, pour interpréter des ordonnances de prescription complexes et ont constaté qu’après une formation avec 100 exemples, GPT 4 était capable d’interpréter correctement 95,6 % des ordonnances. Mais cette expérience a entraîné un coût informatique et financier élevé, avec une expérience dépassant les 3 000 dollars, a prévenu Yazdany.
Prédire les résultats
Les expériences visant à déterminer si un système d’IA peut prévoir l’activité de la PR lors de la prochaine visite à la clinique en sont à leurs débuts.
Yazdany et ses collègues ont utilisé les données DSE de l’UCSF et de l’hôpital général Zuckerberg de San Francisco sur des patients présentant deux codes de diagnostic de PR à 30 jours d’intervalle, qui avaient au moins une prescription de médicament antirhumatismal modificateur de la maladie et deux scores d’indice d’activité clinique de la maladie (CDAI) à 30 jours d’intervalle.
Un modèle, conçu pour prédire le CDAI lors de la prochaine visite en « jouant avec les probabilités » sur la base de l’expérience clinique, a montré qu’environ 60 % des patients de l’UCSF ont atteint les objectifs de traitement par rapport à l’objectif, tandis que les 40 % restants ne l’ont pas fait.
Ce modèle a donné des résultats à peine meilleurs que le pur hasard, avec une aire sous la courbe caractéristique de fonctionnement (AUC) du récepteur de 0,54.
Un deuxième modèle incluant le dernier score CDAI du patient s’en sort également à peine mieux qu’un lancer de dés, avec une AUC de 0,55.
Cependant, un modèle de réseau neuronal ou « d’apprentissage profond » conçu pour traiter les données de la même manière que le cerveau humain fonctionne bien mieux pour prédire les résultats lors de la deuxième visite, avec une AUC de 0,91.
En appliquant le modèle de réseau neuronal formé par l’UCSF à la population de l’hôpital général Zuckerberg de San Francisco, présentant des caractéristiques de patients différentes de celles de l’UCSF, l’ASC était de 0,74. Bien que ce résultat ne soit pas aussi bon que celui observé lorsqu’il est appliqué aux patients de l’UCSF, il a démontré que le modèle conserve une certaine capacité prédictive dans différents systèmes hospitaliers, a déclaré Yazdany.
Les prochaines étapes, a-t-elle déclaré, consistent à créer des modèles plus robustes basés sur des pools de données vastes et variés sur les patients, ce qui permettra de généraliser les modèles prédictifs dans divers contextes de soins de santé.
Le ici et maintenant
Lors de la séance de questions et réponses qui a suivi la présentation, un membre de l’auditoire a déclaré que l’étude était « un truc très intéressant ».
« Existe-t-il un moyen d’aller de l’avant et de réfléchir à la technologie que nous commençons à piloter ? Les hôpitaux utilisent déjà des scribes IA, par exemple, pour collecter les données, ce qui facilitera grandement leur transmission au système. l’analyse prédictive que nous allons utiliser”, a-t-elle déclaré.
Yazdany a répondu que « au cours des deux dernières années, l’un des projets sur lesquels nous avons travaillé consiste à interroger les rhumatologues qui participent au registre RISE sur la manière dont ils collectent [patient-reported outcomes]et cela a été fascinant : une grande majorité de personnes utilisent encore des formulaires papier.”
“Le défi est que nos populations de patients sont très diverses. La technologie, et en particulier le remplissage de formulaires via des plateformes en ligne, ne fonctionne pas pour tout le monde et, d’une certaine manière, remplir des formulaires papier lorsque vous vous rendez chez le médecin est une excellente solution. Je pense donc que nous avons de réels défis à relever et que les solutions doivent être ancrées dans le monde réel”, a-t-elle ajouté.
Les recherches de Yazdany ont été financées par des subventions de l’Agence pour la recherche et la qualité des soins de santé et des National Institutes of Health. Elle a divulgué les honoraires de consultation et/ou le soutien à la recherche d’AstraZeneca, Aurinia, Bristol Myers Squibb, Gilead et Pfizer.
2024-04-19 10:57:34
1713513886
#Les #enquêteurs #forment #des #systèmes #dIA #pour #prédire #les #résultats