par Doug Finke
Il y a quelques semaines, l’organisation chinoise connue sous le nom de Deepseek a surpris la communauté de l’IA en libérant son premier libre Application Chatbot, basée sur le modèle Deepseek-R1 avec des capacités qui sont dans le même stade que celles de Chatgpt et d’autres chatbots avec un coût de formation qui était une fraction du coût qu’il a pris pour former d’autres modèles d’IA à 5,8 millions de dollars. L’équipe a utilisé des puces NVIDIA moins avancées que les autres modèles, mais a compensé cela en utilisant des techniques innovantes telles que l’utilisation de jetons 8 bits au lieu de 32 bits, une architecture de mélange d’Experts, des techniques d’apprentissage de renforcement et d’autres choses.
Jusqu’à cette époque, la sagesse conventionnelle a été que la meilleure façon d’améliorer les performances dans un modèle d’IA est de continuer à construire de plus en plus. En fait, la même semaine que Deepseek a été publiée, un nouveau partenariat s’est formé entre Openai, Oracle et SoftBank a annoncé le Projet Stargate Cela pourrait finalement coûter 500 milliards de dollars pour créer la plus grande infrastructure au monde pour la prochaine génération d’IA. Deepseek a été en mesure d’obtenir ses résultats jusqu’à présent grâce à une co-conception minutieuse du matériel, des logiciels, des algorithmes et de l’architecture.
Alors, quelle est la leçon pour la communauté quantique? C’est pour réaliser que Il ne faut jamais sous-estimer l’innovation des scientifiques et des ingénieurs travaillant sur quantum aujourd’hui et qu’il faut se méfier de ce qui est considéré comme une sagesse conventionnelle. Parfois, les innovations peuvent sortir du champ gauche, tout comme Deepseek a fait et obtenir des résultats auxquels les gens n’attendaient pas. Ces résultats inattendus pourraient être d’atteindre quelque chose que personne ne pensait possible ou d’atteindre le résultat à un moment beaucoup plus tôt que prévu ou de l’atteindre à un coût beaucoup plus faible que prévu.
Cela nous amène au sujet de l’avantage quantique et quand nous attendons-nous à en voir des signes. Beaucoup de gens croient que cela ne se produira pas avant qu’un ordinateur quantique corrigé de grande erreur ne soit disponible, ce qui pourrait ne pas se produire avant 2030 ou plus tard. Mais, juste cette semaine, deux commentaires notables ont fait surface dans les médias. Le premier était de Bill Gate qui a commenté un podcast qu’il y a la possibilité que cela puisse arriver dans les trois à cinq prochaines années. Et le second, provenait de Hartmut Neven de Google qui dit à Reuters Que Google prévoit d’avoir des applications de calcul quantique commerciales dans les cinq ans.
L’une des raisons pour lesquelles GQI est optimiste quant à la voir des applications quantiques est la pléthore de différentes technologies, approches, avancées et innovations que nous voyons chaque semaine. Au cours de la dernière semaine seulement, nous avons vu une annonce de l’Université d’Oxford sur la recherche sur l’informatique quantique distribuée, une autre de Quandela sur une nouvelle approche de tolérance aux défauts qui peut réduire le nombre de composants de 100 000 fois, et un tout nouveau type d’algorithme quantique de Google qui intègrent le traitement quantique analogique et numérique dans le même algorithme. GQI suit également les différentes modalités de qubit sur lesquelles les chercheurs travaillent et nous voyons plus de 8 approches fondamentales différentes que les gens utilisent pour créer des qubits. Nous voyons la force dans cette diversité et si certaines des approches ne fonctionnent pas, il y en aura d’autres qui pourraient progresser mieux que prévu.
Notre conseil est donc de ne pas être complaisant et de garder un œil de près sur tous les développements de quantum, qui semblent désormais se produire sur une base rapide et furieuse. Ne laissez rien vous surprendre. Pour nous, un élément clé de la mission de GQI est de s’assurer que cela n’arrive pas à nos clients.
8 février 2025
#Leçons #communauté #quantique #peut #apprendre #Deepseek