Nouvelles Du Monde

L’outil d’IA ChatGPT écrit moins de bêtises

L’outil d’IA ChatGPT écrit moins de bêtises

2023-07-04 12:03:21

Dusseldorf ChatGPT est comme un stagiaire trop confiant : le programme accomplit les tâches à la volée et présente les résultats sur un ton comme s’il avait rédigé une thèse sur le sujet. Cependant, lorsque les professionnels scrutent le travail de près, ils découvrent souvent des inexactitudes et des erreurs. Cela limite les utilisations possibles.

Malgré ces faiblesses, la dernière génération d’intelligence artificielle (IA) sur laquelle repose ChatGPT offre un grand potentiel pour les entreprises. Les grands modèles linguistiques peuvent formuler des e-mails, résumer des rapports commerciaux, répondre aux plaintes des clients – et bien plus encore.

Mais comme pour un stagiaire, ce qui suit s’applique : si c’est vraiment important, une personne expérimentée doit toujours vérifier le résultat par la suite.

La puissance productive de ces programmes ne peut vraiment être utilisée que si des IA comme ChatGPT sont capables de se débarrasser de leurs fantasmes. Il s’agit de transformer le stagiaire exagérément sûr de lui en quelqu’un avec une auto-évaluation réaliste, qui vous fera savoir quand il ne sait plus quoi faire.

Lire aussi  Apple envisage Google Gemini AI pour les iPhones : rapport

Quelques exemples montrent comment cela peut être réalisé. Les domaines d’application vont du contrôle de groupe au classement des notes dans l’administration publique.

1. BASF Coatings : Intelligence artificielle ChatGPT pour le contrôle

La tâche: BASF Coatings Controlling prépare des rapports mensuels sur le développement de l’activité. En plus des données telles que les prix, les volumes de vente et les taux de change dans les différentes régions, il existe des explications pour la gestion, telles que les particularités du développement du marché telles que les crises macroéconomiques.

“C’est un point sensible du contrôle”, déclare Tobias Kawohl, responsable du développement des solutions de contrôle numérique dans le monde entier chez BASF Coatings. “Les collègues sont occupés pendant quelques heures avec ça.” Comme il existe des rapports de ce type dans tout le groupe BASF, des gains d’efficacité considérables peuvent être obtenus grâce à l’automatisation.

>> Lire aussi : Comment l’IA apprend à lire dans nos pensées

Les défis: Chez BASF Coatings, qui produit des peintures et autres revêtements, il y a déjà eu plusieurs tentatives pour automatiser les commentaires sur les rapports. Cependant, jusqu’ici sans succès. Le logiciel a donné de mauvais résultats ou était difficile à intégrer dans l’informatique, rapporte le contrôleur Kawohl.

Tobias Kawohl (à gauche) et Marvin Pohl

Les développeurs ont créé BASF Coatings.

(Photo : Westphalia Data Night)

Lorsque OpenAI a rendu l’interface vers ChatGPT disponible au début de l’année, il a lancé une nouvelle expérience avec le scientifique des données Marvin Pohl – également pour démontrer les possibilités de la nouvelle technologie en interne. Le but des deux : Le modèle doit apporter ses compétences linguistiques sans raconter d’histoires.

La solution: Pour s’assurer que ChatGPT ne signale pas de bêtises, l’équipe de développement a pris deux mesures. D’une part, l’équipe oriente le modèle linguistique – dans ce cas, GPT 3.5 – dans la bonne direction. À l’aide de quelques règles, un programme utilise les chiffres d’affaires pour créer le début d’une phrase, par exemple : “Les ventes en Asie de l’Est ont chuté de cinq pour cent…” Cela doit être complété.

>> Lire aussi : “L’IA a besoin de règles du jeu claires”, déclare Christian Klein, PDG de SAP

D’autre part, les développeurs de BASF utilisent certains rapports d’analystes comme base de données. “Vous pouvez donner aux pages système des sources le contexte”, explique Pohl. Le modèle ne doit donc pas puiser dans son propre vivier de connaissances, qui s’appuie sur des sources issues d’Internet, mais plutôt sur des évaluations réalisées par des professionnels.

La mesure du succès : Du point de vue du développeur, le système remplit son objectif – il fournit un contexte aux chiffres en un rien de temps. Le résultat peut être, par exemple : “Les ventes en Asie de l’Est ont chuté de 5 % en raison de goulots d’étranglement dans l’approvisionnement du segment des semi-conducteurs et des mesures de verrouillage en cours en Chine”.

Pour l’équipe de développement, ce projet phare ne concerne pas seulement l’application spécifique. L’objectif était d’inspirer d’autres unités, telles que le marketing, explique Kawohl – elles aussi devraient bientôt pouvoir utiliser l’intelligence artificielle générative.

Les cours: “Nous avons tous les deux développé ce projet côte à côte en l’espace de trois mois”, rapporte Pohl. Le travail complexe est effectué par la technologie OpenAI. “Vous pouvez développer des logiciels sophistiqués avec de petites équipes”, résume Kawohl – c’est une différence par rapport aux générations précédentes d’intelligence artificielle.

Maintenant, une équipe doit être créée qui, d’une part, a le savoir-faire pour mener à bien d’autres projets avec l’IA générative et, d’autre part, garde un œil sur le marché. Ce n’est pas si facile. “La situation est très confuse pour le moment, vous ne savez pas exactement quelles solutions viendront des fabricants de logiciels”, explique Pohl.

2. L’intelligence artificielle chez les autorités : la production de l’IA doit être contrôlée

La tâche: Trop de tâches, pas assez de personnel : la plupart des autorités sont surchargées. Dans le Bade-Wurtemberg, le gouvernement du Land a chargé le laboratoire d’innovation Innolab_bw de rechercher comment la technologie peut apporter un soulagement.

Cinq employés identifient les tendances et développent des prototypes. Ces derniers mois, par exemple, ils ont travaillé avec la start-up de Heidelberg Aleph Alpha pour tester comment l’intelligence artificielle générative peut alléger la charge de travail des employés. Il y a là un potentiel “de révolutionner la qualité de service de l’administration”, estime Florian Stegmann, chef de la Chancellerie d’Etat.

Assistante administrative F13

L’IA du Land de Badem-Wurtemberg est destinée à faciliter les processus quotidiens au sein des autorités.

Le nouveau système s’appelle F13 et est destiné à offrir une aide rapide comme une touche de fonction sur un PC – “Le raccourci sur votre bureau” est le slogan publicitaire interne. L’assistant synthétise les textes, simplifie la recherche dans les bases de données du pays et crée des notes à partir de modèles de cabinet. Un « Vermerkomat », qui devrait être capable de créer un texte continu à partir de notes, de notes et d’études, est en préparation.

Les défis: Les grands modèles de langage ont une propriété que les autorités hésitent à voir : ils fabriquent de fausses déclarations, ce qu’on appelle des hallucinations. “Les modèles de langage ne savent pas si leurs déclarations sont correctes ou non”, explique le chef de projet Johannes Ast. La technologie est sujette aux erreurs, en particulier en ce qui concerne les nombres et les heures. En d’autres termes : une réponse peut sembler plausible, mais elle ne suit aucune logique mathématique.

>> Lire aussi : Ces outils d’IA facilitent le quotidien

Lors de l’introduction de l’assistant linguistique, les développeurs ont rencontré un autre problème : la plupart des documents administratifs de l’État ne sont pas sous une forme lisible par machine, mais dans des formats tels que PDF. Lors de la lecture, les paragraphes sont souvent coupés – et avec eux un contexte important. “La principale cause d’hallucinations sont de telles erreurs de lecture, qui peuvent survenir en particulier avec des documents d’entrée complexes”, explique Ast.

La solution: F13 est délibérément conçu comme un assistant. Les résumés et la formulation sont conçus comme des suggestions que le personnel est toujours tenu d’examiner. La personne reste dans la “responsabilité ultime”, déclare le chef de la chancellerie d’État Stegmann. Les utilisateurs peuvent visualiser les sources originales des textes en un seul clic, une caractéristique clé des modèles linguistiques d’Aleph Alpha.

L’équipe de développement a installé des boîtes d’information à divers endroits afin que les utilisateurs soient conscients de leur responsabilité. Il existe également des formations pour le personnel. Afin de créer de la transparence et de la confiance, on pense aussi à l’étiquetage, dit Stegmann : les textes sur lesquels l’assistant a été impliqué doivent être reconnaissables.

Afin de vérifier son fonctionnement, l’équipe a également installé un bouton de rétroaction à de nombreux endroits, que les utilisateurs peuvent utiliser pour donner des commentaires concrets sur le fonctionnement compréhensible, complet et correct de l’IA.

Ce texte fait partie du grand spécial du Handelsblatt sur l’intelligence artificielle. Êtes-vous intéressé par ce sujet? Tous les textes déjà parus dans le cadre de notre semaine thématique

Vous trouverez ici.

Les cours: Le projet vient à peine de démarrer, il est donc difficile à évaluer. En tout cas, les nouvelles technologies suscitent un grand intérêt dans l’administration de l’État, plus de 400 employés ont participé à un atelier et une centaine de résumés sont actuellement demandés chaque jour. L’évaluation court jusqu’à l’automne.

Ce qui est déjà clair pour l’utilisation future de l’IA : la gestion des attentes est importante. “Par exemple, nous recevons des demandes pour savoir si le système peut être utilisé pour poser des questions spécifiques sur le budget de l’État”, rapporte Hannah Reitter, consultante chez InnoLab_bw – mais F13 n’est pas adapté à cela compte tenu des problèmes de chiffres. “Nous devons créer une prise de conscience de ce à quoi sert exactement cette assistance textuelle”, conclut-elle.

Plus: 50 emplois – et comment l’IA va les changer.

Première publication : 01/07/2023, 14h02



#Loutil #dIA #ChatGPT #écrit #moins #bêtises
1688462056

Facebook
Twitter
LinkedIn
Pinterest

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.

ADVERTISEMENT