Alibaba Cloud a annoncé une réduction de prix de 85 % pour son modèle d’IA de raisonnement visuel, Qwen-VL-Max. Le se déplacer survient alors que les géants chinois de la technologie, dont ByteDance et Baidu, se battent pour la domination dans le secteur en croissance rapide de l’IA d’entreprise.
Les tarifs réduits, qui positionnent Qwen-VL-Max à 0,003 yuan (0,00041 $) pour mille jetons, reflète la stratégie agressive de ByteDance visant à réduire les coûts de son modèle d’IA de raisonnement visuel lancé plus tôt en décembre.
Série Qwen-VL d’Alibaba englobe plusieurs autres modèles avancés qui intègrent des données visuelles et textuelles pour des tâches telles que le sous-titrage d’images, la réponse visuelle aux questions et la génération de contenu multimodal. La gamme comprend Qwen-VL, Qwen-VL-Chat, Qwen2-VL et le QVQ-72B-Preview expérimental. Qwen2-VL, avec ses performances de pointe, a excellé dans des benchmarks tels que MathVista et DocVQA, surpassant souvent les principaux concurrents comme le GPT-4V d’OpenAI et le Gemini Ultra de Google.
Avec plus de 252 modèles d’IA générative approuvés en Chine cette année, son marché est devenu saturé, incitant les entreprises à adopter des stratégies innovantes en matière de prix et de technologie pour garantir des parts de marché.
Tarification stratégique comme modèle cohérent
L’annonce de décembre constitue le troisième ajustement majeur des prix de l’IA d’Alibaba en 2024, après une réduction de 55 % en février pour les produits cloud de base et une remise de 97 % en mai pour la suite Qwen AI. Ces évolutions reflètent une concentration constante sur l’abordabilité, visant à attirer les entreprises clientes qui explorent des outils d’IA avancés pour les processus commerciaux et l’analyse.
En réduisant les coûts, Alibaba cherche à positionner ses offres d’IA comme des outils indispensables pour les entreprises confrontées aux complexités de l’adoption de l’intelligence artificielle. La facturation basée sur des jetons, qui facture aux utilisateurs des interactions spécifiques avec l’IA, est devenue un élément central des stratégies de tarification, permettant un accès évolutif à des modèles puissants sans investissements initiaux prohibitifs.
Faire progresser l’IA multimodale avec QVQ-72B
Plus tôt cette semaine, Alibaba a présenté QVQ-72B, un modèle d’IA multimodal open source qui intègre des capacités de raisonnement visuel et textuel. Cette version s’appuie sur son prédécesseur, Qwen2-VL-72B, améliorant les fonctionnalités pour la recherche scientifique et l’analyse avancée.
Les benchmarks ont validé les capacités du QVQ-72B, le modèle obtenant un score de 70,3 au benchmark MMMU (un test conçu pour évaluer le raisonnement multimodal au niveau universitaire) et excellant dans MathVista et OlympiadBench. Ces résultats placent le QVQ-72B parmi les modèles open source les plus compétitifs du secteur.
QwQ-32B : un modèle de précision logique
En novembre, Alibaba a présenté QwQ-32B, un modèle conçu pour le raisonnement logique, le codage et les tâches mathématiques avancées. Sa fonction de calcul au moment du test alloue des ressources de calcul supplémentaires pendant l’exécution, améliorant ainsi la précision des problèmes complexes. Bien que cela ralentisse les temps de réponse, la précision offerte par QwQ-32B a été saluée dans les tests de performance et les applications d’entreprise.
La sortie de QwQ-32B sous la licence Apache 2.0 reflète l’engagement d’Alibaba à équilibrer la collaboration et le contrôle propriétaire. En se concentrant sur l’IA centrée sur le raisonnement, Alibaba est en concurrence directe avec des modèles tels que le modèle R1-Lite-Preview de DeepSeek et le modèle o1 d’OpenAI, qui donnent tous deux la priorité à la profondeur logique et à la résolution itérative des problèmes.
Le secteur chinois de l’IA générative a connu une prolifération rapide de modèles, avec plus de 250 offres approuvées pour un usage public rien qu’en 2024. Cette saturation a alimenté une concurrence intense entre les leaders du secteur et les start-ups, chacun rivalisant pour se différencier par ses prix et ses fonctionnalités technologiques uniques.
DeepSeek, par exemple, a mis l’accent sur la transparence avec son modèle R1-Lite-Preview, qui utilise un raisonnement en chaîne de pensée pour diviser les problèmes en étapes incrémentielles, permettant aux utilisateurs de suivre son processus de prise de décision. Pendant ce temps, ByteDance et Alibaba se concentrent sur l’abordabilité pour favoriser l’adoption sur un marché de plus en plus encombré.
#Alibaba #réduit #les #prix #des #modèles #langage #visuel #QwenVL