Les modèles d’IA dits raisonnés sont de plus en plus faciles – et moins coûteux – à développer.
Vendredi, NovaSky, une équipe de chercheurs basée au Sky Computing Lab de l’UC Berkeley, a publié Sky-T1-32B-Preview, un modèle de raisonnement compétitif avec une version antérieure d’o1 d’OpenAI sur un certain nombre de tests clés. Sky-T1 semble être le premier modèle de raisonnement véritablement open source dans le sens où il peut être répliqué à partir de zéro ; l’équipe a publié l’ensemble de données qu’elle a utilisé pour la former ainsi que le code de formation nécessaire.
“Remarquablement, Sky-T1-32B-Preview a été formé pour moins de 450 dollars”, a écrit l’équipe dans un communiqué. article de blog« démontrant qu’il est possible de reproduire des capacités de raisonnement de haut niveau de manière abordable et efficace. »
450 $ ne semblent peut-être pas si abordables. Mais il n’y a pas si longtemps, le prix à payer pour entraîner un modèle aux performances comparables se chiffre souvent en millions de dollars. Les données de formation synthétiques, ou les données de formation générées par d’autres modèles, ont contribué à réduire les coûts. Palmyra X 004, un modèle récemment publié par la société d’IA Writer, formé presque entièrement sur des données synthétiques, n’aurait coûté que 700 000 $ à développer.
Contrairement à la plupart des IA, les modèles de raisonnement vérifient eux-mêmes les faits, ce qui les aide à éviter certains des pièges qui font normalement échouer les modèles. Les modèles de raisonnement mettent un peu plus de temps (généralement de quelques secondes à quelques minutes) pour parvenir à des solutions par rapport à un modèle classique sans raisonnement. L’avantage est qu’ils ont tendance à être plus fiables dans des domaines tels que la physique, les sciences et les mathématiques.
L’équipe NovaSky affirme avoir utilisé un autre modèle de raisonnement, le QwQ-32B-Preview d’Alibaba, pour générer les données d’entraînement initiales pour Sky-T1, puis « organiser » le mélange de données et exploiter le GPT-4o-mini d’OpenAI pour refactoriser les données dans un format plus format réalisable. La formation du Sky-T1, doté de 32 milliards de paramètres, a pris environ 19 heures en utilisant un rack de 8 GPU Nvidia H100. (Les paramètres correspondent à peu près aux compétences de résolution de problèmes d’un modèle.)
Selon l’équipe NovaSky, Sky-T1 fonctionne mieux qu’une première version préliminaire de o1 sur MATH500, une collection de défis mathématiques « de niveau compétition ». Le modèle bat également l’aperçu de o1 sur un ensemble de problèmes difficiles de LiveCodeBench, une évaluation de codage.
Il est également important de noter que la version GA d’OpenAI d’o1 est un modèle plus puissant que la version préliminaire d’o1, et qu’OpenAI devrait publier un modèle de raisonnement encore plus performant, o3, dans les semaines à venir.
Mais l’équipe NovaSky affirme que Sky-T1 ne marque que le début de son parcours visant à développer des modèles open source dotés de capacités de raisonnement avancées.
“À l’avenir, nous nous concentrerons sur le développement de modèles plus efficaces qui maintiennent de solides performances de raisonnement et sur l’exploration de techniques avancées qui améliorent encore l’efficacité et la précision des modèles au moment du test”, a écrit l’équipe dans le message. « Restez à l’écoute alors que nous progressons sur ces initiatives passionnantes. »
#Les #chercheurs #open #source #SkyT1 #modèle #dIA #raisonnant #qui #peut #être #entraîné #pour #moins