Alors qu’OpenAI semble avoir du mal à sortir son nouveau modèle de langage, GPT-5o, la société chinoise DeepSeek fait des progrès extraordinaires.
Même s’il était jusqu’ici méconnu du grand public, l’entreprise chinoise travaille depuis un an sur un grand modèle de langage (LLM) susceptible de concurrencer ceux d’OpenAI (ChatGPT) ou d’Anthropic (Claude). D’après les premiers retours sur DeepSeek v3, la promesse est – largement – tenue.
Depuis
1 649,99€
Un stock
Acheter sur Fnac.com
Un LLM open source ultraperformant
Annoncé il y a quelques jours, DeepSeek V3 est la dernière version du LLM conçu par la société éponyme. Un modèle entièrement open source, offrant 671 milliards de paramètres, soit 65 % de plus que Llama 3.1, le LLM de Meta considéré jusqu’ici comme le plus grand au monde.
Accessible gratuitement pour tous les internautes à cette adresse (la création d’un compte est obligatoire), DeepSeek V3 se présente dans une interface extrêmement proche (pour ne pas dire copiée) de celle de ChatGPT. Une fenêtre épurée, au centre de laquelle trône un champ permettant de saisir du texte et de poser des questions.intelligence artificielle. Un bouton « Rechercher », copiant celui permettant d’utiliser le moteur de recherche ChatGPT, est même présent pour obtenir des résultats sourcés sur le Web.
L’un des points forts de DeepSeek V3 est qu’il offre une meilleure réponse de traitement que ses concurrents, avec 60 tokens par seconde.
Plus efficace et plus efficient ?
Dans une série d’articles sur
DeepSeek V3 aurait en effet été entraîné en un an à partir de 14 800 milliards de tokens « de haute qualité » (autrement dit de données), pour « seulement » 5,5 millions de dollars. Nous écrivons « seulement » parce que les gros modèles américains auraient coûté dix fois plus cher à développer, assure l’entreprise chinoise.
En tant que solution ouverte et grâce à la disponibilité d’interfaces de programmation (API), DeepSeek espère convaincre les développeurs d’utiliser son modèle plutôt que celui de la concurrence en leur faisant miroiter sous le nez la promesse de meilleurs résultats, autrement moins coûteux.
Quant à savoir si son modèle a été formé sur des données personnelles et des œuvres d’art protégées par le droit d’auteur, le livre blanc de DeepSeek reste silencieux, tout comme la quantité d’énergie nécessaire pour alimenter son somptueux modèle de langage.
#ChatGPT #chinois #dévoile #les #Américains #risquent #trembler