Des géants de la technologie comme Alibaba et ByteDance, ainsi qu’une poignée de startups avec des investisseurs aux poches profondes, dominent l’espace chinois de l’IA, ce qui rend difficile la concurrence pour les petites et moyennes entreprises. Une entreprise comme DeepSeek, qui n’envisage pas de lever des fonds, est rare.
Zihan Wang, l’ancien employé de DeepSeek, a déclaré Revue technologique du MIT qu’il avait accès à d’abondantes ressources informatiques et qu’il avait la liberté d’expérimenter lorsqu’il travaillait chez DeepSeek, « un luxe que peu de nouveaux diplômés auraient dans une entreprise ».
Dans un entretien avec le média chinois 36Kr en juillet 2024 Liang a déclaré qu’un défi supplémentaire auquel les entreprises chinoises sont confrontées, en plus des sanctions liées aux puces, est que leurs techniques d’ingénierie en matière d’IA ont tendance à être moins efficaces. “Nous [most Chinese companies] Il faut consommer deux fois plus de puissance de calcul pour obtenir les mêmes résultats. Combiné aux lacunes en matière d’efficacité des données, cela pourrait nécessiter jusqu’à quatre fois plus de puissance de calcul. Notre objectif est de combler continuellement ces écarts », a-t-il déclaré.
Mais DeepSeek a trouvé des moyens de réduire l’utilisation de la mémoire et d’accélérer les calculs sans sacrifier considérablement la précision. « L’équipe adore transformer un défi matériel en une opportunité d’innovation », déclare Wang.
Liang lui-même reste profondément impliqué dans le processus de recherche de DeepSeek, menant des expériences aux côtés de son équipe. « Toute l’équipe partage une culture collaborative et un dévouement à la recherche approfondie », explique Wang.
En plus de donner la priorité à l’efficacité, les entreprises chinoises adoptent de plus en plus les principes de l’open source. Alibaba Cloud a publié plus de 100 nouveaux modèles d’IA open source, prenant en charge 29 langues et s’adressant à diverses applications, notamment le codage et les mathématiques. De même, des startups comme Minimax et 01.AI ont rendu leurs modèles open source.
Selon un livre blanc publié l’année dernière par l’Académie chinoise des technologies de l’information et des communications, un institut de recherche affilié à l’État, le nombre de grands modèles de langage d’IA dans le monde a atteint 1 328, dont 36 % proviennent de Chine. Cela positionne la Chine comme le deuxième contributeur à l’IA, derrière les États-Unis.
“Cette génération de jeunes chercheurs chinois s’identifie fortement à la culture open source car ils en bénéficient énormément”, déclare Thomas Qitong Cao, professeur adjoint de politique technologique à l’Université Tufts..