2024-03-21 09:00:00
Waabi, une start-up spécialisée dans la conduite autonome, souhaite utiliser un nouveau modèle d’IA pour prédire les prochains mouvements des autres usagers de la route. Non seulement l’apprentissage automatique sera utilisé, mais aussi l’IA générative – une nouveauté dans ce segment. Le système, appelé Copilot4D, a été formé sur la base des données des capteurs LIDAR, qui utilisent la lumière pour mesurer la distance aux objets. Si vous donnez une situation au modèle – par ex. Par exemple, si un conducteur entre imprudemment sur une autoroute à grande vitesse, il prédit comment les autres véhicules dans la zone se déplaceront. Le résultat est une représentation LIDAR qui regarde 5 à 10 secondes dans le futur, dans ce cas, par exemple, un carambolage.
Publicité
Une première version de Copilot4D est actuellement disponible. Selon la patronne Raquel Urtasun, Waabi travaille déjà sur des systèmes plus précis qui seront utilisés dans une flotte test de camions autonomes au Texas, dans lesquels le logiciel de conduite décide ensuite comment il doit réagir à certaines situations – un interprète intégré, pour ainsi dire. parler.
La conduite autonome s’appuie depuis longtemps sur l’apprentissage automatique pour planifier des itinéraires et reconnaître des objets. Les modèles d’IA générative qui utilisent les données de l’environnement et effectuent ensuite des prédictions constituent un nouveau niveau. Les optimistes espèrent que cela pourrait amener l’autonomie à un tout autre niveau. Wayve, un concurrent de Waabi, a déjà lancé l’année dernière un modèle comparable, formé à partir de vidéos de conduite collectées à partir de ses véhicules. Waabi fonctionne de manière similaire aux générateurs d’images ou de vidéos tels que DALL-E et Sora d’OpenAI, mais n’utilise pas de données de caméra : il prend des nuages de points provenant de capteurs LIDAR, qui visualisent une carte 3D de l’environnement du véhicule, et les décompose en parties, similaires aux générateurs d’images Divisez les photos en pixels. Sur la base de ses données d’entraînement, Copilot4D prédit ensuite comment le nuage de points se déplacera à partir des données LIDAR.
Waabi est l’une des rares entreprises de conduite autonome – y compris ses concurrents Wayve et Ghost – à décrire son approche comme « l’IA d’abord ». Pour Urtasun, cela signifie développer un système qui apprend à partir des données plutôt que de devoir apprendre à réagir à des situations spécifiques. Les start-up font le pari que leurs méthodes nécessitent moins d’heures d’essais sur route avec des voitures autonomes. Cela n’est pas sans controverse : il y a eu plusieurs accidents dans le passé, par exemple en octobre 2023, lorsqu’un robot-taxi de croisière a emporté un piéton à San Francisco.
LIDAR au lieu de caméra
Comme mentionné, Waabi se distingue de ses concurrents en ce sens qu’elle développe un modèle génératif pour la technologie radar LIDAR (« light détection and range ») et non pour les caméras. “Si vous souhaitez atteindre le niveau 4 d’autonomie, le LIDAR est indispensable”, explique Urtasun, ce qui désigne le niveau d’automatisation auquel la voiture ne devrait plus avoir besoin de l’attention d’un humain pour conduire en toute sécurité. Les caméras sont efficaces pour montrer ce que voit la voiture, mais elles ne sont pas assez efficaces pour mesurer les distances ou comprendre la géométrie de l’environnement de la voiture, dit-elle.
Bien que le modèle de Waabi puisse produire des vidéos montrant ce qu’une voiture voit grâce à ses capteurs LIDAR, ces vidéos ne sont pas utilisées pour la formation dans le simulateur de conduite de l’entreprise, qu’elle utilise pour développer et tester son modèle de conduite. Cela permet de garantir que les hallucinations qui peuvent encore survenir lors du Copilot4D ne soient pas transférées au fonctionnement du simulateur. La technologie sous-jacente n’est pas nouvelle, explique Bernard Adam Lange, étudiant diplômé à Stanford qui a créé et étudié des modèles similaires. Cependant, c’est la première fois qu’un modèle génératif LIDAR quitte le laboratoire et est en cours de préparation pour une utilisation commerciale.
Lange et d’autres espèrent qu’un tel modèle permettrait au « cerveau » d’un véhicule autonome de « penser » plus rapidement et avec plus de précision. «C’est une référence transformatrice», estime-t-il. “Nous espérons que ces modèles pourront être utilisés pour des tâches en aval telles que la détection d’objets et la prédiction de l’endroit où les personnes ou les objets se déplaceront ensuite.”
Open source ou pas ?
Jusqu’à présent, Copilot4D ne peut envisager l’avenir que dans une mesure limitée. De plus, les modèles de prédiction de mouvement se détériorent généralement à mesure qu’ils sont censés être étendus. Selon Urtasun, ce qui se passe dans 5 à 10 secondes est suffisant pour la plupart des décisions de conduite. Les tests de référence Waabi actuels sont basés sur des prédictions de 3 secondes. Chris Gerdes, codirecteur du Stanford Center for Automotive Research, estime que cette référence sera essentielle à l’utilité du modèle dans la prise de décision. “Si les prédictions sur 5 secondes sont solides, mais que celles sur 10 secondes sont à peine utilisables, il existe un certain nombre de situations dans lesquelles le modèle en place n’est pas suffisant”, dit-il.
Le nouveau modèle soulève également une question qui revient sans cesse dans le monde de l’IA générative : doit-elle être open source ? La sortie de Copilot4D permettrait aux chercheurs des universités qui ont du mal à accéder à de grands ensembles de données de regarder sous le capot, d’évaluer de manière indépendante la sécurité de ces systèmes et potentiellement de faire progresser le domaine. Il en va de même pour les concurrents de Waabi. Jusqu’à présent, il n’y a que des articles ici, mais ils n’approfondissent pas suffisamment le sujet, il n’est donc pas possible de le reproduire.
“Nous voulons que la science ait également son mot à dire sur l’avenir des voitures autonomes”, déclare Urtasun, ajoutant que les modèles open source sont plus fiables. “Mais nous devons aussi faire preuve d’un peu de prudence lorsque nous développons notre technologie afin de ne pas tout donner à nos concurrents.”
(jl)
#Conduite #autonome #lIA #générative #vise #prédire #trafic
1711005125