OpenAI, voici ce qu’était Strawberry : o1 révélé, le nouveau modèle qui « réfléchit » avant de répondre

Home » Sciences et technologies » OpenAI, voici ce qu’était Strawberry : o1 révélé, le nouveau modèle qui « réfléchit » avant de répondre

2024-09-12 21:43:44

OpenAI a été lancé o1un modèle d’intelligence artificielle jusqu’à présent connu sous le nom de « code » Fraise.

Une photo d’un fraisier, pris il y a quelque temps et Sam Altman et publié sur les réseaux sociaux, avait alimenté l’attente d’une IA annoncée comme une avancée notable pour OpenAI, la société de San Francisco qui a créé ChatGpt.

OpenAI o1 est un nouveau grand modèle de langage. Il a été formé par apprentissage par renforcement effectuer un raisonnement complexe.

OpenAI affirme que « o1 réfléchis avant de répondre: peut produire une longue chaîne de pensée interne avant de répondre à l’utilisateur.”

“OpenAI o1 se classe au 89e centile dans les applications de programmation compétitives (Codeforces) – lit-on sur le blog officiel de la société californienne -. Il se classe également parmi les 500 meilleurs étudiants des États-Unis dans le cadre d’une qualification pour l’Olympiade de mathématiques des États-Unis (AIME) et dépasse la précision humaine au niveau du doctorat dans un test de référence en physique, biologie et chimie (GPQA).

Semaine italienne de la technologie 2024

Sam Altman est-il le nouvel Oppenheimer ? Son IA entre rêve et cauchemar

par Pier Luigi Pise

12 septembre 2024

OpenAI travaille toujours sur le nouveau modèle, mais en attendant, il a décidé de publier immédiatement un aperçu de o1 aux utilisateurs Plus et Team.

La raison l’explique Noam Brownl’un des chercheurs qui ont travaillé sur le développement de o1 et de ses capacités de raisonnement: « Nos modèles o1 ne sont pas toujours meilleurs que GPT-4o – [il modello più avanzato attualmente disponibile su ChatGpt, ndr] -. De nombreuses tâches ne nécessitent pas de raisonnement, et parfois cela ne vaut pas la peine d’attendre une réponse o1 plutôt qu’une réponse rapide GPT-4o. L’une des motivations pour publier o1-preview est de voir quels cas d’utilisation deviennent populaires et où les modèles doivent être améliorés. »

[[(FckEditorEmbeddedHtmlLayoutElement) brown]]

Un graphique publié par Brown, qui fait référence au cas où Gpt-4o est utilisé plus de o1et vice versa, souligne que, par exemple, le nouveau modèle n’est pas le premier choix pour ceux qui utilisent ChatGpt pour écrire, par exemple, ou modifier un texte déjà écrit.

La situation est différente pour ceux qui écrivent des codes de programmation, effectuent des analyses de données ou doivent effectuer des calculs mathématiques. Dans ces cas, l’utilisation de o1 augmente considérablement, atteignant 75 % lorsqu’il s’agit de résoudre des questions mathématiques.

« Tout comme un humain pourrait réfléchir longtemps avant de répondre à une question difficile, o1 utilise une chaîne de pensée lorsqu’il tente de résoudre un problème – explique OpenAI sur son blog – grâce à l’apprentissage par renforcement, o1 apprend à affiner sa chaîne de pensée et. Affinez les stratégies qu’il utilise. Apprenez à reconnaître et à corriger vos erreurs. Apprenez à décomposer les étapes complexes en étapes plus simples. Apprenez à essayer une approche différente lorsque celle actuelle ne fonctionne pas pour réfléchir.

@OpenAIL’IA o1 pense en quelques secondes, mais nous souhaitons que les versions futures pensent en quelques heures, jours, voire semaines. Les coûts d’inférence seront plus élevés, mais quel prix paieriez-vous pour un nouveau médicament contre le cancer ? Pour des batteries révolutionnaires ? Pour une preuve de l’hypothèse de Riemann ? L’IA peut être bien plus que des chatbots pic.twitter.com/AtqjRTzNMN
— Noam Brown (@polynoamial) 12 septembre 2024

Le plus souvent o1 réfléchis juste quelques secondesavant de générer sa réponse.

«Mais nous visons des versions futures – explique Brown – qui réfléchissent pendant des heures, des jours, voire des semaines. Les coûts d’inférence seront plus élevés, mais quel prix paieriez-vous pour un nouveau médicament contre le cancer ? Pour des batteries innovantes ? Pour une preuve de l’hypothèse de Riemann ? L’IA peut être plus qu’un chatbot.

#OpenAI #voici #quétait #Strawberry #révélé #nouveau #modèle #qui #réfléchit #avant #répondre
1726326795

Quatre personnes hospitalisées après un accident sur Chuckanut Drive; le conducteur arrêté pour agression au volant

Les autorités ont arrêté un homme après que quatre personnes ont été blessées dans un accident de

Le TIFF 2024 dévoilé : le tapis rouge de Toronto pour le meilleur du cinéma The Hype Magazine : dévoiler le pouls de la culture urbaine – du hip-hop à Hollywood ! Explorez une tapisserie diversifiée d’histoires, d’interviews et d’éditoriaux percutants couvrant la mode, les jeux, les films, le MMA, l’EDM, le rock et au-delà ! www.thehypemagazine.com – The Hype Magazine The Hype Magazine

2024-09-18 01:35:17 Événements Publié le 17 septembre 2024 | par Elisa P Le Festival international du film

Nouvelles Du Monde

OpenAI, voici ce qu’était Strawberry : o1 révélé, le nouveau modèle qui « réfléchit » avant de répondre

Sam Altman est-il le nouvel Oppenheimer ? Son IA entre rêve et cauchemar

Leave a Comment Cancel Reply

Quatre personnes hospitalisées après un accident sur Chuckanut Drive; le conducteur arrêté pour agression au volant

Ce lézard plongeur crée sa propre « cartouche » d’oxygène et peut durer 20 minutes sous l’eau

Le Tribunal national condamne un membre de l’ETA à 85 ans de prison pour l’attentat de la rue Platerías à Madrid en 2000

RECENT POSTS

7 conseils efficaces pour communiquer avec les gens et établir des contacts utiles

Comment trouver l’amour en 2022 ?

ADVERTISEMENT

Nouvelles Du Monde

OpenAI, voici ce qu’était Strawberry : o1 révélé, le nouveau modèle qui « réfléchit » avant de répondre

Sam Altman est-il le nouvel Oppenheimer ? Son IA entre rêve et cauchemar

Share this:

Leave a Comment Cancel Reply

Quatre personnes hospitalisées après un accident sur Chuckanut Drive; le conducteur arrêté pour agression au volant

Share this:

Share this:

Ce lézard plongeur crée sa propre « cartouche » d’oxygène et peut durer 20 minutes sous l’eau

Share this:

Le Tribunal national condamne un membre de l’ETA à 85 ans de prison pour l’attentat de la rue Platerías à Madrid en 2000

Share this:

RECENT POSTS

7 conseils efficaces pour communiquer avec les gens et établir des contacts utiles

Comment trouver l’amour en 2022 ?

ADVERTISEMENT

Tags