2024-09-12 21:43:44
OpenAI a été lancé o1un modèle d’intelligence artificielle jusqu’à présent connu sous le nom de « code » Fraise.
Une photo d’un fraisier, pris il y a quelque temps et Sam Altman et publié sur les réseaux sociaux, avait alimenté l’attente d’une IA annoncée comme une avancée notable pour OpenAI, la société de San Francisco qui a créé ChatGpt.
OpenAI o1 est un nouveau grand modèle de langage. Il a été formé par apprentissage par renforcement effectuer un raisonnement complexe.
OpenAI affirme que « o1 réfléchis avant de répondre: peut produire une longue chaîne de pensée interne avant de répondre à l’utilisateur.”
“OpenAI o1 se classe au 89e centile dans les applications de programmation compétitives (Codeforces) – lit-on sur le blog officiel de la société californienne -. Il se classe également parmi les 500 meilleurs étudiants des États-Unis dans le cadre d’une qualification pour l’Olympiade de mathématiques des États-Unis (AIME) et dépasse la précision humaine au niveau du doctorat dans un test de référence en physique, biologie et chimie (GPQA).
Semaine italienne de la technologie 2024
Sam Altman est-il le nouvel Oppenheimer ? Son IA entre rêve et cauchemar
par Pier Luigi Pise
OpenAI travaille toujours sur le nouveau modèle, mais en attendant, il a décidé de publier immédiatement un aperçu de o1 aux utilisateurs Plus et Team.
La raison l’explique Noam Brownl’un des chercheurs qui ont travaillé sur le développement de o1 et de ses capacités de raisonnement: « Nos modèles o1 ne sont pas toujours meilleurs que GPT-4o – [il modello più avanzato attualmente disponibile su ChatGpt, ndr] -. De nombreuses tâches ne nécessitent pas de raisonnement, et parfois cela ne vaut pas la peine d’attendre une réponse o1 plutôt qu’une réponse rapide GPT-4o. L’une des motivations pour publier o1-preview est de voir quels cas d’utilisation deviennent populaires et où les modèles doivent être améliorés. »
[[(FckEditorEmbeddedHtmlLayoutElement) brown]]
Un graphique publié par Brown, qui fait référence au cas où Gpt-4o est utilisé plus de o1et vice versa, souligne que, par exemple, le nouveau modèle n’est pas le premier choix pour ceux qui utilisent ChatGpt pour écrire, par exemple, ou modifier un texte déjà écrit.
La situation est différente pour ceux qui écrivent des codes de programmation, effectuent des analyses de données ou doivent effectuer des calculs mathématiques. Dans ces cas, l’utilisation de o1 augmente considérablement, atteignant 75 % lorsqu’il s’agit de résoudre des questions mathématiques.
« Tout comme un humain pourrait réfléchir longtemps avant de répondre à une question difficile, o1 utilise une chaîne de pensée lorsqu’il tente de résoudre un problème – explique OpenAI sur son blog – grâce à l’apprentissage par renforcement, o1 apprend à affiner sa chaîne de pensée et. Affinez les stratégies qu’il utilise. Apprenez à reconnaître et à corriger vos erreurs. Apprenez à décomposer les étapes complexes en étapes plus simples. Apprenez à essayer une approche différente lorsque celle actuelle ne fonctionne pas pour réfléchir.
@OpenAIL’IA o1 pense en quelques secondes, mais nous souhaitons que les versions futures pensent en quelques heures, jours, voire semaines. Les coûts d’inférence seront plus élevés, mais quel prix paieriez-vous pour un nouveau médicament contre le cancer ? Pour des batteries révolutionnaires ? Pour une preuve de l’hypothèse de Riemann ? L’IA peut être bien plus que des chatbots pic.twitter.com/AtqjRTzNMN
— Noam Brown (@polynoamial) 12 septembre 2024
Le plus souvent o1 réfléchis juste quelques secondesavant de générer sa réponse.
«Mais nous visons des versions futures – explique Brown – qui réfléchissent pendant des heures, des jours, voire des semaines. Les coûts d’inférence seront plus élevés, mais quel prix paieriez-vous pour un nouveau médicament contre le cancer ? Pour des batteries innovantes ? Pour une preuve de l’hypothèse de Riemann ? L’IA peut être plus qu’un chatbot.
#OpenAI #voici #quétait #Strawberry #révélé #nouveau #modèle #qui #réfléchit #avant #répondre
1726326795