14.01.2025 17:36
Résultats de recherche, publications scientifiques
Remarque sur l’utilisation des images : L’utilisation des images pour le communiqué de presse est autorisée gratuitement, à condition que la source soit mentionnée. Les images ne peuvent être utilisées qu’en relation avec le contenu de ce communiqué de presse. Si vous avez besoin de l’image dans une résolution plus élevée ou si vous avez des questions sur une utilisation ultérieure, veuillez contacter directement le service de presse qui l’a publiée.
Du texte aux informations structurées en toute sécurité grâce à l’IA : le Dr Sebastian Nowak clarifie l’utilisation sécurisée de l’IA en matière de protection des données pour structurer les résultats radiologiques.
| Ceux:
Rolf Müller
| Droits d’auteur :
Hôpital universitaire de Bonn (UKB)
| Télécharger
Des chercheurs de Bonn étudient l’utilisation de divers grands modèles linguistiques pour analyser les résultats radiologiques : dans les hôpitaux, l’intelligence artificielle (IA) et surtout les LLM (Large Language Models, ou LLM en abrégé), qui constituent également la base de ChatGPT, sont de plus en plus demandés. . Cependant, les données des patients doivent toujours être protégées.
Des chercheurs de l’hôpital universitaire de Bonn (UKB) et de l’université de Bonn ont désormais pu démontrer que les LLM locaux, dans lesquels toutes les données restent au sein de la clinique lorsqu’elles sont utilisées de manière sécurisée, peuvent aider à structurer les résultats radiologiques. Pour ce faire, ils ont comparé différents LLM basés sur des résultats publics sans protection des données et sur des résultats protégés par des données. Les modèles commerciaux avec transfert de données vers des serveurs externes ne présentent aucun avantage par rapport aux modèles conformes à la protection des données. Les résultats ont été publiés dans la revue spécialisée « Radiology ».
Il faut qu’il y ait de l’ordre. Pas seulement sur la table d’opération ou au bureau, mais aussi avec les données. Par exemple, les résultats structurés sont utiles à la fois aux médecins et à une utilisation ultérieure dans les bases de données à des fins de recherche. Ces données structurées peuvent ensuite également être utilisées pour former d’autres modèles d’IA pour un diagnostic basé sur l’image. Dans la pratique, cependant, les résultats sont généralement rédigés sous forme de texte libre, ce qui complique leur utilisation ultérieure. C’est exactement là que l’application de l’IA, ou plus précisément des LLM, entre en jeu.
Modèles ouverts et fermés
Les LLM peuvent être divisés en deux catégories : les modèles fermés sont les variantes commerciales et bien connues de l’IA qui sont également utilisées dans les chatbots tels que Chat-GPT and Co. Les modèles ouverts, tels que les modèles Llama de Meta, sont une option qui peut être exécutée. sur les serveurs internes de la clinique et même formés davantage. Toutes les données restent stockées localement, ce qui rend l’utilisation locale de LLM ouverts avantageuse en termes de sécurité des données. «Le problème avec les modèles commerciaux fermés est que pour les utiliser, il faut transférer les données vers des serveurs externes, qui sont souvent même situés en dehors de l’UE. Une telle chose n’est pas recommandée avec les données des patients », souligne le professeur Julian Luetkens, comm. Directeur de la Clinique de Radiologie Diagnostique et Interventionnelle de l’UKB.
« Mais tous les LLM sont-ils également adaptés à la compréhension et à la structuration du contenu médical des résultats radiologiques ? Pour savoir quel LLM convient à une clinique, nous avons testé divers modèles ouverts et fermés », explique le Dr Sebastian Nowak, premier auteur correspondant de l’étude et chercheur postdoctoral à l’Université de Bonn au Département de radiologie diagnostique et interventionnelle de l’UKB. «Nous souhaitions également savoir si les LLM ouverts pouvaient être développés efficacement sur place, en clinique, avec seulement quelques résultats structurés.»
L’équipe de recherche a donc mené une analyse de 17 modèles de langage ouverts et quatre modèles de langage fermés. Tout le monde devrait analyser des milliers de rapports radiologiques sous forme de texte libre. Pour l’évaluation, tant les résultats radiologiques publics en anglais et sans protection des données que les résultats protégés des données de l’UKB en allemand ont été utilisés.
La formation fait la différence
Les résultats montrent que dans le cas de résultats sans protection des données, les modèles fermés n’ont aucun avantage par rapport à certains LLM ouverts. Lorsqu’ils sont utilisés directement sans formation, les grands LLM ouverts étaient meilleurs que les petits LLM ouverts. L’utilisation de résultats déjà structurés comme données de formation pour les LLM ouverts a conduit à une amélioration efficace de la qualité du traitement de l’information, même avec quelques rapports préparés manuellement. La formation a également réduit la différence entre les grands et les petits LLM.
“Dans une formation comportant plus de 3 500 résultats structurés, il n’y avait plus de différence pertinente entre le plus grand LLM ouvert et un modèle de langage 1 200 fois plus petit”, explique Nowak. « Dans l’ensemble, on peut conclure que les LLM ouverts peuvent rivaliser avec les LLM fermés et ont l’avantage de pouvoir être développés localement et dans le respect de la protection des données. »
Cette découverte a le potentiel d’exploiter la richesse des données des bases de données cliniques pour des études épidémiologiques complètes et des recherches sur l’IA prédictive des maladies. «En fin de compte, cela profite au patient, tout cela dans le strict respect de la protection des données», explique Nowak. “Nous souhaitons permettre à d’autres cliniques d’utiliser directement nos recherches et avons donc publié le code du programme et les méthodes d’utilisation et de formation sous licence ouverte.”
Financement : Cette étude a été soutenue par le Fonds de publication en libre accès de la Rheinische Friedrich-Wilhelms-Universität Bonn et par l’État de Rhénanie du Nord-Westphalie (SIM-1-1, Innovative Secure Medical Campus).
Publication : Sebastian Nowak et al. : Les modèles en langage large à poids ouverts garantissant la confidentialité sont compétitifs avec le GPT-4o à poids fermés pour l’extraction des résultats de radiographie thoracique à partir de rapports en texte libre ; Radiologie; DOÏ :
Contact presse :
Dr Inka Väth
Porte-parole adjointe de l’hôpital universitaire de Bonn (UKB)
Service de communication et des médias de l’hôpital universitaire de Bonn
Téléphone : (+49) 228 287-10596
E-mail : [email protected]
À propos de l’hôpital universitaire de Bonn : environ 500 000 patients sont soignés chaque année à l’UKB, l’hôpital emploie environ 9 500 personnes et le total du bilan s’élève à 1,8 milliard d’euros. Outre les 3 500 étudiants en médecine et en médecine dentaire, 550 personnes sont formées chaque année à de nombreux métiers de la santé. L’UKB occupe la première place dans la liste des cliniques Focus parmi les hôpitaux universitaires (Royaume-Uni) de Rhénanie du Nord-Westphalie, a bénéficié de plus de 100 millions de financements de tiers pour la recherche en 2023 et possède le deuxième indice de mixité de cas (gravité des cas) le plus élevé d’Allemagne. . L’Institut FAZ a attribué à l’UKB la première place parmi les hôpitaux universitaires dans la catégorie « Champions allemands de la formation 2024 ».
Personne de contact scientifique :
Dr Sébastien Nowak
Data Scientist, Université de Bonn
Clinique de radiologie diagnostique et interventionnelle
Hôpital universitaire de Bonn
E-mail : [email protected]
Parution originale :
Sebastian Nowak et al. : Les modèles en langage large à poids ouverts garantissant la confidentialité sont compétitifs avec les poids fermés GPT-4o dans l’extraction des résultats de radiographie thoracique à partir de rapports en texte libre ; Radiologie; DOI : 10.1148/radiol.240895
Informations complémentaires :
publication
#toute #sécurité #texte #aux #informations #structurées #grâce #lIA