Les microservices NVIDIA NIM et les plans d’IA aident les développeurs et les passionnés à créer des agents d’IA et des flux de travail créatifs sur PC
CES—NVIDIA a annoncé aujourd’hui des modèles de base fonctionnant localement sur PC NVIDIA RTX™ IA qui dynamisent les humains numériques, la création de contenu, la productivité et le développement.
Ces modèles — proposés comme NVIDIA NIM™ microservices — sont accélérés par les nouveaux GPU GeForce RTX™ série 50, qui offrent jusqu’à 3 352 000 milliards d’opérations par seconde de performances d’IA et 32 Go de VRAM. Construits sur l’architecture NVIDIA Blackwell, les RTX 50 Series sont les premiers GPU grand public à ajouter la prise en charge du calcul FP4, multipliant par 2 les performances d’inférence de l’IA et permettant aux modèles d’IA génératifs de s’exécuter localement dans une empreinte mémoire plus petite, par rapport au matériel de la génération précédente.
GeForce™ est depuis longtemps une plateforme essentielle pour les développeurs d’IA. Le premier réseau d’apprentissage profond accéléré par GPU, AlexNet, a été formé sur la GeForce GTX™ 580 en 2012 – et l’année dernière, plus de 30 % des articles de recherche publiés sur l’IA ont cité l’utilisation de GeForce RTX.
Désormais, avec l’IA générative et les PC RTX AI, n’importe qui peut devenir développeur. Une nouvelle vague d’outils low-code et no-code, tels que AnythingLLM, ComfyUI, Langflow et LM Studio, permettent aux passionnés d’utiliser des modèles d’IA dans des flux de travail complexes via des interfaces utilisateur graphiques simples.
Les microservices NIM connectés à ces interfaces graphiques permettront d’accéder et de déployer sans effort les derniers modèles d’IA générative. Plans d’IA NVIDIAbasés sur les microservices NIM, fournissent des flux de travail de référence préconfigurés et faciles à utiliser pour les humains numériques, la création de contenu et bien plus encore.
Pour répondre à la demande croissante des développeurs et des passionnés d’IA, tous les grands fabricants de PC et constructeurs de systèmes lancent des PC RTX AI compatibles NIM avec des GPU GeForce RTX série 50.
« L’IA progresse à la vitesse de la lumière, de l’IA de perception à l’IA générative et désormais à l’IA agentique », a déclaré Jensen Huang, fondateur et PDG de NVIDIA. « Les microservices NIM et les AI Blueprints donnent aux développeurs et aux passionnés de PC les éléments de base nécessaires pour explorer la magie de l’IA. »
Rendre l’IA NIMble
Les modèles de base – des réseaux de neurones formés sur d’immenses quantités de données brutes – sont les éléments constitutifs de l’IA générative.
NVIDIA publiera un pipeline de microservices NIM pour les PC RTX AI provenant de développeurs de modèles de premier plan tels que Black Forest Labs, Meta, Mistral et Stability AI. Les cas d’utilisation couvrent les grands modèles de langage (LLM), les modèles de langage de vision, la génération d’images, la parole, les modèles d’intégration pour la génération augmentée par récupération (RAG), l’extraction de PDF et la vision par ordinateur.
« Les GPU GeForce RTX 50 Series avec calcul FP4 débloqueront une vaste gamme de modèles pouvant fonctionner sur PC, qui étaient auparavant limités aux grands centres de données », a déclaré Robin Rombach, PDG de Black Forest Labs. « Faire de FLUX un microservice NVIDIA NIM augmente la vitesse à laquelle l’IA peut être déployée et expérimentée par un plus grand nombre d’utilisateurs, tout en offrant des performances incroyables. »
NVIDIA a également annoncé aujourd’hui le Némotron de flamme famille de modèles ouverts qui offrent une grande précision sur un large éventail de tâches agents. Le modèle Llama Nemotron Nano sera proposé sous forme de microservice NIM pour les PC et postes de travail RTX AI, et excelle dans les tâches d’IA agentique telles que le suivi d’instructions, les appels de fonctions, le chat, le codage et les mathématiques.
Les microservices NIM incluent les composants clés pour exécuter l’IA sur les PC et sont optimisés pour le déploiement sur les GPU NVIDIA, que ce soit sur les PC et les postes de travail RTX ou dans le cloud.
Les développeurs et les passionnés pourront télécharger rapidementconfigurez et exécutez ces microservices NIM sur des PC Windows 11 avec le sous-système Windows pour Linux (WSL).
« L’IA stimule l’innovation des PC Windows 11 à un rythme rapide, et le sous-système Windows pour Linux (WSL) offre un excellent environnement multiplateforme pour le développement de l’IA sur Windows 11 aux côtés de Windows Copilot Runtime », a déclaré Pavan Davuluri, vice-président d’entreprise de Windows chez Windows 11. Microsoft. « Les microservices NVIDIA NIM, optimisés pour les PC Windows, offrent aux développeurs et aux passionnés des modèles d’IA prêts à intégrer pour leurs applications Windows, accélérant ainsi le déploiement des capacités d’IA auprès des utilisateurs Windows.
Les microservices NIM, exécutés sur les PC RTX AI, seront compatibles avec les meilleurs frameworks de développement et d’agents d’IA, notamment AI Toolkit for VSCode, AnythingLLM, ComfyUI, CrewAI, Flowise AI, LangChain, Langflow et LM Studio. Les développeurs peuvent connecter des applications et des flux de travail construits sur ces frameworks à des modèles d’IA exécutant des microservices NIM via des points de terminaison conformes aux normes de l’industrie, leur permettant d’utiliser les dernières technologies avec une interface unifiée dans le cloud, les centres de données, les postes de travail et les PC.
Les passionnés pourront également découvrir une gamme de microservices NIM grâce à une prochaine version du NVIDIA ChatRTX démo technique.
Donner un visage à l’IA agentique
Pour démontrer comment les passionnés et les développeurs peuvent utiliser NIM pour créer des agents et des assistants IA, NVIDIA a présenté aujourd’hui un aperçu du projet R2Xun avatar PC doté de la vision qui peut mettre des informations à portée de main d’un utilisateur, l’assister avec des applications de bureau et des appels de vidéoconférence, lire et résumer des documents, et bien plus encore.
L’avatar est rendu en utilisant Visages neuronaux NVIDIA RTXun nouvel algorithme d’IA générative qui augmente la rastérisation traditionnelle avec des pixels entièrement générés. Le visage est ensuite animé par une nouvelle animation basée sur la diffusion NVIDIA Audio2Face™-3D modèle qui améliore le mouvement des lèvres et de la langue. R2X peut être connecté à des services d’IA cloud tels que GPT4o d’OpenAI et Grok de xAI, ainsi qu’à des microservices NIM et à des plans d’IA, tels que des récupérateurs de PDF ou des LLM alternatifs, via des frameworks de développement tels que CrewAI, Flowise AI et Langflow. S’inscrire pour les mises à jour du projet R2X.
Les plans d’IA arrivent sur PC
Les microservices NIM sont également disponibles pour les utilisateurs de PC via AI Blueprints, des flux de travail d’IA de référence qui peuvent s’exécuter localement sur les PC RTX. Avec ces plans, les développeurs peuvent créer des podcasts à partir de documents PDF, générer des images époustouflantes guidées par des scènes 3D et bien plus encore.
Le modèle PDF to Podcast extrait le texte, les images et les tableaux d’un PDF pour créer un script de podcast pouvant être modifié par les utilisateurs. Il peut également générer un enregistrement audio complet à partir du script en utilisant les voix disponibles dans le plan ou en fonction de l’échantillon vocal d’un utilisateur. De plus, les utilisateurs peuvent avoir une conversation en temps réel avec l’hôte du podcast AI pour en savoir plus sur des sujets spécifiques.
Le plan utilise des microservices NIM tels que Mistral-Nemo-12B-Instruct pour le langage, NVIDIA Riva pour la synthèse vocale et la reconnaissance vocale automatique, ainsi que la collection de microservices NeMo Retriever pour l’extraction de PDF.
Le Plan d’IA pour l’IA générative guidée en 3D donne aux artistes un contrôle plus précis sur la génération d’images. Bien que l’IA puisse générer des images étonnantes à partir de simples invites textuelles, contrôler la composition des images en utilisant uniquement des mots peut s’avérer difficile. Avec ce plan, les créateurs peuvent utiliser des objets 3D simples disposés dans un moteur de rendu 3D comme Blender pour guider la génération d’images IA. L’artiste peut créer des ressources 3D à la main ou les générer à l’aide de l’IA, les placer dans la scène et régler la caméra de la fenêtre 3D. Ensuite, un flux de travail préemballé alimenté par le microservice FLUX NIM utilisera la composition actuelle pour générer des images de haute qualité correspondant à la scène 3D.
Les microservices NVIDIA NIM et AI Blueprints seront disponibles à partir de février avec une prise en charge matérielle initiale pour les GPU professionnels GeForce RTX 50 Series, GeForce RTX 4090 et 4080 et NVIDIA RTX 6000 et 5000. Des GPU supplémentaires seront pris en charge à l’avenir.
Les PC RTX AI compatibles NIM seront disponibles auprès d’Acer, ASUS, Dell, GIGABYTE, HP, Lenovo, MSI, Razer et Samsung, ainsi que auprès des constructeurs de systèmes locaux Corsair, Falcon Northwest, LDLC, Maingear, Mifcon, Origin PC, PCS et Scan. .
Découvrez comment les microservices NIM, les plans d’IA et les PC RTX AI compatibles NIM accélèrent l’IA générative en rejoignant NVIDIA au CES.