OpenAI, voici ce qu’était Strawberry : o1 révélé, le nouveau modèle qui « réfléchit » avant de répondre

2024-09-12 21:43:44

OpenAI a été lancé o1un modèle d’intelligence artificielle jusqu’à présent connu sous le nom de « code » Fraise.

Une photo d’un fraisier, pris il y a quelque temps et Sam Altman et publié sur les réseaux sociaux, avait alimenté l’attente d’une IA annoncée comme une avancée notable pour OpenAI, la société de San Francisco qui a créé ChatGpt.

OpenAI o1 est un nouveau grand modèle de langage. Il a été formé par apprentissage par renforcement effectuer un raisonnement complexe.

OpenAI affirme que « o1 réfléchis avant de répondre: peut produire une longue chaîne de pensée interne avant de répondre à l’utilisateur.”

“OpenAI o1 se classe au 89e centile dans les applications de programmation compétitives (Codeforces) – lit-on sur le blog officiel de la société californienne -. Il se classe également parmi les 500 meilleurs étudiants des États-Unis dans le cadre d’une qualification pour l’Olympiade de mathématiques des États-Unis (AIME) et dépasse la précision humaine au niveau du doctorat dans un test de référence en physique, biologie et chimie (GPQA).

Semaine italienne de la technologie 2024

Sam Altman est-il le nouvel Oppenheimer ? Son IA entre rêve et cauchemar

par Pier Luigi Pise


OpenAI travaille toujours sur le nouveau modèle, mais en attendant, il a décidé de publier immédiatement un aperçu de o1 aux utilisateurs Plus et Team.

La raison l’explique Noam Brownl’un des chercheurs qui ont travaillé sur le développement de o1 et de ses capacités de raisonnement: « Nos modèles o1 ne sont pas toujours meilleurs que GPT-4o – [il modello più avanzato attualmente disponibile su ChatGpt, ndr] -. De nombreuses tâches ne nécessitent pas de raisonnement, et parfois cela ne vaut pas la peine d’attendre une réponse o1 plutôt qu’une réponse rapide GPT-4o. L’une des motivations pour publier o1-preview est de voir quels cas d’utilisation deviennent populaires et où les modèles doivent être améliorés. »

[[(FckEditorEmbeddedHtmlLayoutElement) brown]]

Un graphique publié par Brown, qui fait référence au cas où Gpt-4o est utilisé plus de o1et vice versa, souligne que, par exemple, le nouveau modèle n’est pas le premier choix pour ceux qui utilisent ChatGpt pour écrire, par exemple, ou modifier un texte déjà écrit.

La situation est différente pour ceux qui écrivent des codes de programmation, effectuent des analyses de données ou doivent effectuer des calculs mathématiques. Dans ces cas, l’utilisation de o1 augmente considérablement, atteignant 75 % lorsqu’il s’agit de résoudre des questions mathématiques.

« Tout comme un humain pourrait réfléchir longtemps avant de répondre à une question difficile, o1 utilise une chaîne de pensée lorsqu’il tente de résoudre un problème – explique OpenAI sur son blog – grâce à l’apprentissage par renforcement, o1 apprend à affiner sa chaîne de pensée et. Affinez les stratégies qu’il utilise. Apprenez à reconnaître et à corriger vos erreurs. Apprenez à décomposer les étapes complexes en étapes plus simples. Apprenez à essayer une approche différente lorsque celle actuelle ne fonctionne pas pour réfléchir.

Le plus souvent o1 réfléchis juste quelques secondesavant de générer sa réponse.

«Mais nous visons des versions futures – explique Brown – qui réfléchissent pendant des heures, des jours, voire des semaines. Les coûts d’inférence seront plus élevés, mais quel prix paieriez-vous pour un nouveau médicament contre le cancer ? Pour des batteries innovantes ? Pour une preuve de l’hypothèse de Riemann ? L’IA peut être plus qu’un chatbot.




#OpenAI #voici #quétait #Strawberry #révélé #nouveau #modèle #qui #réfléchit #avant #répondre
1726326795

Facebook
Twitter
LinkedIn
Pinterest

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.