Home » International » Qu’est-ce que Deepseek? Coût de formation ultra-standard? Deepseek est-il vraiment si puissant? -Dessine de stockage

Qu’est-ce que Deepseek? Coût de formation ultra-standard? Deepseek est-il vraiment si puissant? -Dessine de stockage

by Nouvelles

En seulement un mois, la recherche de Deep de Deep (Deepseek) a publié deux grands modèles: Deepseek-V3 et Deepseek-R1. Essayez de copier les résultats de Deepseek du jour au lendemain.

Le fondateur de l’échelle de l’IA, Alexander Wang, a déclaré dans une interview le 24 janvier que Deepseek avait effectué le meilleur de leurs tests et était équivalent aux meilleurs modèles des États-Unis.

Auparavant, Alexander Wang a déclaré que Deepseek-V3 était une leçon amère apportée par l’industrie des sciences et de la technologie chinoises aux États-Unis. “Lorsque les États-Unis se reposent, la Chine (industrie technologique) s’efforce de rattraper son retard à moindre coût, à une vitesse plus rapide et à une force plus forte.”

En outre, la “lavage” de l’IA de la Chine des principaux médias étrangers à l’étranger, ils croient que les nouveaux progrès des grands modèles chinois semblent un réveil pour la Silicon Valley.

Lorsque les 500 milliards de dollars américains du plan “Star Gate” ont été annoncés, Deepseek a établi un modèle d’interdiction de percée à un prix très bas et n’a pas utilisé de puces à couper le souffle.

Meta entre en mode panique, essayant de copier Deepseek

Le 24 janvier, un article publié sur la plate-forme anonyme TeamBlind est devenu fou. Un employé de méta a dit,Maintenant à cause du modèle Deepseek, la méta interne est entrée dans le mode panique

Cet employé de Meta a écrit:

“Tout vient de l’émergence de Deepseek-V3. Il a rendu Llama 4 éclipsé dans le test de référence. Ce qui est encore plus embarrassant, c’est que cela l’a fait avec une entreprise chinoise avec seulement 5,5 millions de dollars de budget de formation.

Les ingénieurs essaient d’analyser Deepseek contre le temps, essayant de copier toutes les technologies possibles. Ce n’est pas exagéré.

La direction s’inquiète de l’énorme investissement du département de R&D Genai. Lorsqu’un salaire de haut niveau dans le département dépasse le coût de la formation de l’ensemble du V3 Deepseek, il y a des dizaines de niveaux aussi élevés.

L’émergence de Deepseek-R1 rend la situation encore plus grave. Les détails spécifiques sont confidentiels et sont gênants à divulguer, mais il sera bientôt fabriqué. “

Le 27 décembre 2024, Deepseek a lancé le modèle open source Deepseek-V3. À cette époque, Chatbot Arena a montré que Deepseek-V3 se classait septième parmi tous les modèles et s’est classé premier dans des modèles open source. De plus, Deepseek-V3 est le modèle le plus élevé des dix premières valeurs CP au monde.

Moins d’un mois plus tard, le 20 janvier de cette année, Deepseek a officiellement ouvert le modèle de raisonnement R1 Source, permettant à chacun de distribuer R1 à former d’autres modèles conformément à la licence MIT (Remarque: une clause de licence logicielle largement utilisée).

Le 24 janvier, Deepseek-R1 s’est classé troisième sur la liste complète de Chatbot Arena, et à égalité avec le modèle de premier ordre O1.

Dans des domaines techniques élevés tels que les mots de rappel difficile, le code et les mathématiques, Deepseek-R1 est en tête, se classant en premier.

En termes de contrôle du style, Deepseek-R1 et O1 sont à égalité pour la première fois, ce qui signifie que le modèle fonctionne bien dans la compréhension et les instructions de l’utilisateur suivant, et elle est exceptionnelle en termes de styles spécifiques.

Dans le test des mots de rappel à haute difficulté et du contrôle du style, Deepseek-R1 et O1 sont également liés au premier, ce qui prouve en outre ses capacités puissantes dans les tâches complexes et le contrôle raffiné.

Les résultats des tests initiaux de l’analyse artificielle de Deepseek-R1 ont également montré que Deepseek-R1 a obtenu un deuxième score le plus élevé dans l’indice de qualité de l’analyse AI, et le prix était d’environ un tige de l’O1.

L’IA chinois a rattrapé les États-Unis?

Après la publication de Deepseek-V3 en décembre de l’année dernière, Alexander Wang, fondateur de la société de services de données AI Scale Scale, a annoncé que Deepseek-V3 était une leçon amère apportée par la communauté technologique chinoise aux États-Unis. “Lorsque les États-Unis se reposent, la Chine (industrie technologique) s’efforce de rattraper son retard à moindre coût, à une vitesse plus rapide et à une force plus forte.”

Mark Anderson, le fondateur de la célèbre société d’investissement A16Z, a publié un texte le 24 janvier que Deepseek-R1 est l’une des percées les plus incroyables et les plus impressionnantes qu’il ait vues.

Le 24 janvier, Anjney Midha, membre de l’A16Z et membre du conseil d’administration de Mistral AI, a déclaré: “De Stanford au MIT, Deepseek-R1 est devenu le modèle préféré des meilleurs chercheurs américains aux États-Unis presque du jour au lendemain.”

Pour expliquer pourquoi l’IA de la Chine peut faire de tels progrès rapides, le lauréat du prix Nobel, “IA Godfather”, Jeffrey Seton, a déclaré dans une interview exclusive avec le blogueur Curt Jaimungal le 21 janvier que l’éducation STEM de la Chine (science, technologie, ingénierie, mathématiques, mathématiques) est Mieux que les États-Unis, et a plus de talents avec une bonne éducation, ce qui fournira une base solide pour le développement de l’IA. Bien que les États-Unis essaient de ralentir le développement de la Chine en limitant les limites (comme Nvidia, NVDA-USS), il ne fera qu’accélérer la Chine pour accélérer sa propre technologie. ” Essence

Deepseek ou change complètement le jeu?

Une étude publiée par des chercheurs de l’Université de Stanford et de l’IA Epoch au milieu de -2024 montre qu’en 2027, le coût de formation du modèle le plus élevé dépassera 1 milliard de dollars. Gartner prédit qu’en 2028, des entreprises super grandes à l’échelle telle que Google, Microsoft et AWS ne coûteront que 500 milliards de dollars dans les serveurs d’IA.

Mais Deepseek est complètement différent et son coût de formation n’est pas cher. La société de gestion des capitaux de Noah a déclaré que le modèle Deepseek-V3 pourrait complètement modifier les règles de jeu dans le domaine de la formation et du raisonnement.

Surtout après l’annonce du plan “Star Gate” de 500 milliards de dollars, Deepseek a été encore plus douteux.

US Stock V (leader d’opinion avec un grand nombre de fans) “The Short Bear” a publié sur X le 24 janvier que Deepseek a apporté des moments de douleur aux géants de l’IA, et les investisseurs doivent sonner l’alarme.

Il a déclaré: “Si vous n’avez besoin que de 55 millions de dollars pour vaincre Openai, la commercialisation de cette industrie sera beaucoup plus rapide que beaucoup de gens ne s’attendaient.”

Il a également souligné: “Selon Sequoia, la société américaine AI doit générer environ 600 milliards de dollars de revenus chaque année pour payer ses coûts matériels de l’IA. Il semble maintenant que cette aventure est devenue de plus en plus non rentable.”

Le célèbre journaliste financier Holger Zschaepitz a déclaré le 25 janvier que Deepseek avait créé un modèle de percée AI à un prix très bas et n’avait pas utilisé de puces de coupe, ce qui a fait remettre en question les gens de l’efficacité de centaines de milliards de dollars de dépenses en capital dans l’industrie.

Capitale profonde

Certains investisseurs pensent même que le cours de l’action des actions de la puce de stock américains sera également confrontée à des défis.

L’investisseur Geiger Capital a déclaré que Deepseek est aussi bon qu’Openai, ou même mieux, et que le prix n’est que de 3% de ces derniers … mais les sociétés américaines ont investi des centaines de milliards de dollars. Alors … qu’est-ce que Nasdaq?

Il convient de noter qu’après la libération de Deepseek-V3, le cours de l’action de Huida a chuté de 2%. Après que Deepseek-R1 a provoqué des discussions à l’étranger, le cours de l’action de Huida a chuté de 3,12% le 24 janvier.

Deepseek frappe l’alarme pour la Silicon Valley

Si Deepseek-V3 ne déclenche qu’une vague, alors Deepseek-R1 provoque une sensation. Au cours des quatre derniers jours, les médias étrangers se sont concentrés sur Deepseek et ont convenu que les nouveaux progrès des grands modèles chinois ont sonné l’alarme pour la Silicon Valley.

Le 22 janvier, l’American Media Business Insider a rapporté que le modèle Deepseek-R1 adhérant à l’esprit ouvert et entièrement open source, ce qui a causé des ennuis aux joueurs américains de l’IA. L’IA avancée open source peut défier les entreprises qui tentent de réaliser d’énormes bénéfices grâce à la technologie de vente.

Le 24 janvier, le US Media CNBC a lancé un programme de 40 minutes, invitant le PDG de Perplexity, Aravind Srinivas

Le “Financial Times” britannique a rapporté le 25 janvier que la petite startup chinoise de l’IA Deepseek a choqué la Silicon Valley. Il est signalé si la société d’IA américaine qui se concentre sur davantage de ressources peut défendre ses avantages techniques.

Temps financier en profondeur

Le rapport cité Ritwik Gupta, chercheur en politique de l’IA à l’Université de Californie, a déclaré que le récent modèle publié par Deepseek a montré que “la capacité de l’IA n’a pas de protection de la ville”. Gupta a ajouté que le bassin de talents de l’ingénieur du système chinois est beaucoup plus grand que les États-Unis.

Net de l’odeur de tigre》 Réimpression autorisée

【Lecture complémentaire】

You may also like

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.