2025-02-21 07:20:00
La famille de modèles de Intelligence artificielle espagnole (IA), Aliaaura une première demande publique avant la fin de l’année. Il s’appelle cardiomentor et le développe et le Barcelone Supercomputing Center (BSC) En collaboration avec la Société espagnole de cardiologie. Dans une première phase, actuellement en exécution, Cardiomentor s’appuiera sur des modèles fondamentaux d’Alia pour développer une sorte de chatppt spécialisé dans les maladies cardiaques pour les médecins généraux, dans le but qu’ils ont un accès facile à des connaissances mises à jour et véridiques à propos de ces maladies.
Une fois cette phase terminée, le système s’entraînera avec des données anonymisées de patients dans le but de raffiner la capacité de prédiction et de diagnostic de l’outil. L’idée est que le modèle est capable d’analyser une série de paramètres du patient et de pouvoir dire au médecin, par exemple, quel type de traitements a fonctionné avec d’autres sujets qui présentaient des conditions très similaires.
Cette deuxième partie du projet, qui sera soumise cette année et commencera à mettre en œuvre la suivante, présente plusieurs inconnues. Qui s’occupera de l’anonymat et gardera les données des dossiers médicaux du patient? Quelle technologie sera utilisée pour cela? Qui supervisera que le processus sera effectué en toute sécurité? Des sources du Secrétaire d’État à la Digitalization et à l’intelligence artificielle, dans le cadre du ministère de la Transformation numérique et de la fonction publique, et qui a supposé la coordination du projet, expliquez à El País que l’accent est toujours mis dans le premier, donc tous ces problèmes sont Toujours “à définir”.
Première phase: un assistant en cardiologie
Quelque 800 000 personnes souffrent d’insuffisance cardiaque en Espagne. Son incidence est élevée chez les personnes âgées et avec la morbidité, et on a estimé que son impact économique peut être d’environ 2,5 milliards d’euros par an (ils sont attribués à des maladies cardiaques environ 10 000 revenus hospitaliers par an). «Nous pensions que l’insuffisance cardiaque est une pathologie qui affecte de nombreuses personnes et a un grand impact sur le système de santé, donc cela pourrait être un bon point de départ pour commencer à utiliser le modèle de grande langue (LLM pour son acronyme anglais) que le gouvernement a développé », Explique le Dr Julián Villacastín, chef de cardiologie à l’hôpital clinique de San Carlos de Madrid et ancien président de la Société espagnole de cardiologie (SEC).
Villacastín dirige l’équipe de la SEC qui a travaillé sur la preuve du concept assistant en insuffisance cardiaque pour les généralistes (cardiomentor). “Initialement, ce sera un outil formatif: cela aidera les généralistes à être à jour et à prendre des décisions, qui ne seront toujours que les vôtres.” Le médecin et ses collègues seront les conservateurs du contenu avec lequel le modèle est formé: des articles scientifiques et des guides cliniques révisables qui reflètent le consensus des experts. “Ce sera un modèle vivant, nous incluons des nouvelles telles qu’elles sont publiées”, ajoute-t-il.
La preuve de concept dans laquelle ils travaillent actuellement ont un budget de 50 000 euros, comme l’a confirmé le secrétaire d’État. Il a été préparé par Tecnalia avec les médias du BSC et les conseils de la Société espagnole de cardiologie. Villacastín estime que le prototype formatif peut être prêt dans quelques mois. “Le simple fait de répondre aux questions scientifiques avec l’assurance que les réponses de l’outil n’ont pas de biais, ce sera très précieux”, dit-il. Le fait qu’il soit basé sur Allia et, par conséquent, fonctionne bien en espagnol, fait que Cardiomentor est susceptible d’être utilisé dans n’importe quel pays espagnol.
Pouvons-nous vraiment faire confiance à l’IA dans des domaines critiques comme le diagnostic d’image médicale? Non, et ils sont encore pires que aléatoires. Notre dernière étude, “Pire que le hasard? Une évaluation de sondage embarrassante des grands modèles multimodaux dans le VQA médical”, découvre les limites frappantes de… pic.twitter.com/pt3d02rzcm
– Xin Eric Wang (@xwang_lk) 3 juin 2024
Cependant, l’idée d’appliquer de grands modèles de langue au secteur médical a été remise en question par littérature scientifique. «Le problème fondamental de la LLM est que leurs résultats ne sont pas reproduits. Ce sont des modèles stochastiques: les mêmes entrées atteignent différentes sorties, le système vous donnera des réponses différentes au même problème », explique Lorena Jaume-Palasí, chercheuse indépendante en éthique et technologie. «Les LLM ne sont pas en mesure de distinguer les articles scientifiques anciens, sexistes et dépassés et de nouvelles informations, et que C’est un problème connu», Abunda l’expert.
Les données générées par Cardiomentor appartiendront à Tecnalia, bien que le BSC et la Direction générale de l’intelligence artificielle disposent d’une licence sur eux. Avant de commencer à fonctionner, l’outil sera médicalement validé par la Société de cardiologie espagnole elle-même. Le Dr Villacastín connaît les études qui remettent en question la valeur du LLM en matière médicale. “C’est pourquoi nous devons faire un modèle aussi fiable que possible, et nous y travaillons”, dit-il.
Deuxième phase: un modèle prédictif
Une fois que l’assistant est prêt, l’intention est d’ajouter de vrais cas pour pouvoir tirer des conclusions d’utilité médicale. Cela sera obtenu en entrant des données à partir des dossiers médicaux des patients qui ont souffert d’une maladie cardiaque. “Il existe de nombreuses interactions entre différents aspects personnels, sociaux et thérapeutiques qui influencent le patient, et il est souvent difficile de les détecter avec les moyens que nous avons”, explique le Dr Villacastín. Dépressions, situation familiale, type de nourriture, type de travail … “La complexité de l’interaction est énorme. Si nous avons beaucoup de connaissances, nous pouvons éventuellement développer des jumeaux pratiquement numériques: sachant qu’un tel traitement peut servir une telle personne, car il a déjà été constaté que cela a fonctionné avec 1000 autres patients qui avaient des caractéristiques similaires.
La qualité des données dont ils ont besoin pour former le modèle rendent Villacastín et ses collègues très restrictifs. «Peut-être que nous pouvons rassembler les dossiers médicaux de 2 000 ou 3 000 sujets. Nous allons d’abord intégrer des données de patients qui ont cette pathologie pour savoir pourquoi ils ont dû être réadmis à l’hôpital, pourquoi ils ont eu des complications ou pourquoi tout s’est bien passé, quels facteurs ont aidé ou blessé, etc. Nous concevons déjà l’ensemble de données que nous voulons entrer pour alimenter le modèle », dit-il.
“L’objectif est de s’assurer que le modèle est en mesure de dire que, compte tenu de vos caractéristiques et de l’expérience dans des cas similaires, si vous continuez à fumer, vous serez susceptible de subir un accident vasculaire cérébral, une crise cardiaque ou un cancer entre 35 et 60 ans”, ” résume le médecin. L’idée, à long terme, serait de développer des jumeaux de patients: des répliques aussi similaires que possible.
Jaume-Palasí considère que cette approche est problématique. “L’idée d’utiliser des jumeaux numériques en médecine semble inquiétante car il ne s’agit pas de mieux comprendre un patient, mais de profil, et c’est un moyen de précarité, car il finit par minimiser le contact du patient avec le médecin.”
Le modèle fondamental espagnol
La famille des modèles génératifs alia, Présenté par le gouvernement en janviern’a pas l’intention de rivaliser avec Chatgpt, Gemini ou Deepseek, mais rendre à la disposition de chacun un outil qui fonctionne bien en espagnol et dans les langues co-officielles. Ainsi, 20% de tous les textes avec lesquels ils ont formé sont en espagnol, catalan, galicien et basque (l’anglais, avec près de 40%, est le prédominant). Cela peut sembler une faible proportion, mais il est beaucoup supérieur à celui utilisé par les modèles les plus connus. Cela imprimera aux modèles une fiabilité supérieure, une plus grande connaissance des phrases faites et des expressions nationales et moins susceptibles de faire des erreurs. “Nous pensons que nous allons surmonter les préjugés culturels”, a déclaré le secrétaire d’État à la numérisation et IA, María González Veracruz, lors d’une réunion avec des journalistes.
Alia est un projet open source, afin que toute personne ou entreprise puisse la télécharger et la manipuler. En plus d’une plus grande fiabilité dans la langue, Alia fournit la garantie de la conformité aux réglementations européennes applicables, à la fois en transparence et en droit d’auteur. Le modèle s’est formé avec la documentation publique officielle: de l’historique des newsletters de la BOE ou de la Journal officiel du Registre Mercantile aux interventions parlementaires ou aux résolutions judiciaires. Le gouvernement a consacré 2,2 millions d’euros à développer l’algorithme et huit autres à l’infrastructure nécessaire, fournie par le BSC, et à configurer les bases de données. Il travaille déjà sur la conception de nouveaux cas d’utilisation, au-delà du cardiomentor et une application pilote interne de l’agence fiscale conçue pour accélérer les procédures bureaucratiques.
«Les modèles Alia ont eu des limitations budgétaires par rapport à d’autres outils de marché, mais ont des forces. Je soulignerais que les langues espagnoles et co-officielles ont eu du poids, et nous pouvons guérir le contenu pour corriger les biais; et qu’ils ont la garantie qu’ils respectent la réglementation européenne de l’IA », souligne Andrés Pedreño, ancien recteur de l’Université d’Alicante et fondateur et président de 1 million de fonds. Pedreño a été l’un des experts auxquels le gouvernement a fait confiance à l’évaluation du modèle.
«Nous avons fait un test avec les modèles Salamandra [los menos sofisticados] d’Alia et avec le dernier, le 40b et, pour le moment, les résultats sont un peu irréguliers », explique Álvaro Barbero, directeur de l’intelligence artificielle à l’Institut d’ingénierie des connaissances. «Mon équipe a effectué des tests et tous, en particulier Salamandra, sont inférieurs aux modèles en janvier 2025. Si nous le comparons à Flame, le modèle de source cible ouverte, qui va pour sa version 3.2, serait équivalent à l’appel 2, Ce qui a un an et demi », dit-il.
#Ceci #est #cardiomentor #première #demande #publique #basée #sur #lAI #espagnole #Technologie
1740122816