Une brillante performance des développeurs d'IA chinois

2025-01-28 14:07:00

Haben die Chinesen in der Künstlichen Intelligenz geschafft, wovon Amerikaner und Europäer bislang nur träumen? Haben die Tüftler eines Start-ups aus Fernost die führenden Internetkonzerne des Westens mit ihren Milliardenmitteln vorgeführt, weil sie mit älterer Technik und deutlich weniger Energie die mindestens selbe Qualität erbracht haben wie die führenden großen Sprachmodelle à la ChatGPT?

Die Reaktionen auf die nun breit bekanntgewordene Leistungsfähigkeit des KI-System aus dem Hause Deepseek sprechen eine eindeutige Sprache: Sie sind bewundernd bis alarmiert, was in diesem Fall ungefähr auf dasselbe hinausläuft.

Der Aktienkurs des KI-Chipspezialisten Nvidia verminderte sich um mehrere hundert Milliarden Dollar, alleine der hierdurch vernichetete Börsenwert entspricht einer ganzen Reihe von Dax-Werten aufsummiert. Der Open-AI-Vorstandsvorsitzende Sam Altman versprach sogleich, neue eigene Modelle nun schneller zu entwickeln und auf den Markt zu bringen. Und sogar der amerikanische Präsident Donald Trump zollte Anerkennung, in dem er das Silicon Valley dazu aufrief, „laser-fokussiert“ zu sein, um diesen Wettbewerb zu gewinnen.

Geniale Ingenieursleistung

Was ist passiert? Offenbar hat Deepseek ein KI-Modell entwickelt, dass merklich kostengünstiger ist als die führenden amerikanischen Modelle, zugleich aber ebenso kompetent Fragen beantworten kann. Wenn das stimmt, dann wäre dies in mehrfacher Hinsicht ein Durchbruch.

Erstens mit Blick auf den Energiebedarf: Um die gängigen großen KI-Sprachmodelle zu trainieren und zu betreiben, braucht es gewaltige Mengen Strom. In nahezu allen Projektionen ist die äußerst energieintensive generative KI wesentlich für einen weiter wachsenden Strombedarf in den kommenden Jahren. Tech-Konzerne denken auch deshalb darüber nach, neue Kernkraftwerke zu mobilisieren oder haben teilweise spezielle Verträge mit bestehenden Anbietern geschlossen. Ob Elektriziät ausreichend verfügbar ist zu erschwinglichen Preisen, ist in der jüngeren Vergangenheit zu einer zentralen Frage für weiteren KI-Fortschritt geworden. Die Chinesen haben nun womöglich die Antwort gegeben.

Zweitens mit Blick auf die eingesetzte Technik: Die Entwicklung der großen KI-Sprachmodelle fußt ganz wesentlich auf der Annahme, dass sie umso besser werden, je größer die Modelle sind, je mehr Daten sie verfügbar haben und je leistungsfähiger die Computer sind, auf denen sie trainiert und betrieben werden. Die KI-Unternehmen bauen inzwischen spezielle KI-Rechnenzentren und fragen besondere Chips nach, wie sie der führende Anbieter Nvidia herstellt – weil die besonders geeignet sind, um jene auf linearer Algebra basierenden Berechnungen durchzuführen, die zentral in dieser Art von Künstlicher Intelligenz ist. Deswegen ist Nvidia das wertvollste an der Börse notierte Unternehmen der Welt geworden (vor Apple und Microsoft) und deshalb ist die Nachfrage nach der jeweils neuesten Chip-Generation bislang enorm. Die chinesischen Entwickler haben nun eigenen Angaben zufolge demonstriert, dass es das vielleicht garnicht braucht. Dass dieselben Ergebnisse möglich sind mit älterer, langsamerer und günstigerer Technik (auch wenn Zweifel erhoben werden, ob sie wirklich nur das verfügbar hatten). Braucht es die hohen Milliardeninvestitionen in neue KI-Infrastruktur also vielleicht garnicht, die Microsoft oder Open AI oder Meta angekündigt haben? Mindestens die Frage steht seit Wochenbeginn im Raum.

Drittens mit Blick auf die Modell-Architektur: Den Deepseek-Mitarbeitern ist offenkundig eine geniale Ingenieursleistung gelungen. Vereinfacht beschrieben haben sie geschafft, eine Anfrage an ihre KI in mehrere Teilaspekte zu zerlegen. Das Programm ermittelt sozusagen zunächst, wie schwierig die Aufgabe ist und entscheidet dann, wie viel Zeit es dafür einsetzt – manche Fragen lassen sich blitzschnell beantworten, andere benötigen mehr Recherche. Insgesamt spart es Zeit und Aufwand, weil eben nicht immer quasi die ganze Maschinerie in Gang gesetzt werden muss. Die Idee verfolgen Forscher nicht nur in China und nicht erst seit gestern. Aber den Chinesen scheint nun erstmals gelungen, dass auch wirklich so umzusetzen, dass es in der Praxis breit funktioniert. Fachleute spekulieren aber noch über eine andere Frage: Haben die Chinesen bessere Daten verfügbar gehabt, haben sie die Daten besser auf- und vorbereitet, mit denen sie ihr Modell angelernt haben? Bessere Daten entscheiden mit darüber, wie leistungsfähig und kompetent solche KI-Systeme sind, es geht längst nicht mehr nur um die reine Masse.

Schließlich ist nun einmal mehr klargeworden, dass das Wettrennen um die beste Künstliche Intelligenz längst nicht entschieden ist. Die amerikanischen Tech-Konzerne sind sehr gut positioniert, aber die Chinesen augenscheinlich auch. Führende KI-Fachleute wie bespielsweise der Meta-Chefwissenschaftler Yann LeCun sind ohnehin schon länger der Ansicht, dass es noch ganz andere Ansätze braucht, um die Computer dem Gehirn anzunähern oder es in der Breite zu übertreffen – wieder andere glauben, dass auf dem Lernen basierende KI-Systeme mit solchen, die auf Logik und fest einprogrammierten Wissen fußen, verschmolzen werden müssten. Gute Nachrichten sind das übrigens auch für Deutschland und Europa, die hinter Amerika und China zurückliegen, wenn es um Massenanwendungen und Kommerzialisierung geht und nur in der Regulierung mehr als die anderen unternommen haben.

Eine gute Nachricht ist das aber auch für den Teil der Wirtschaft, der nicht KI entwickelt, der diese Systeme für mitunter hohe Summen entwickeln lässt und nutzt. Niedrigere Kosten bedeuten in der Folge auch niedrigere Preise, wenn der Wettbewerb stimmt. Olivier Blanchard, ehemaliger Chefvolkswirt des Internationalen Währungsfonds und einer der renommiertesten Ökonomen der Welt, kommentierte die Deepseek-Nachricht denn auch so: „Wahrscheinlich der größte positive Produktivitätsschock in der Geschichte.“ Hoffentlich hat er recht.

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Une brillante performance des développeurs d’IA chinois

Geniale Ingenieursleistung