Home » Sciences et technologies » En utilisant l’IA, ces robots acquièrent des compétences compliquées avec une précision surprenante

En utilisant l’IA, ces robots acquièrent des compétences compliquées avec une précision surprenante

by Nouvelles

Des images du système robotique exécutant avec succès un «Whip Jenga», une compétence qu’elle a apprise en seulement 1,25 heures.

Avec l’aimable autorisation de l’IA robotique et du laboratoire d’apprentissage

À UC Berkeley, des chercheurs de Sergey Levine IA robotique et laboratoire d’apprentissage regarda une table où une tour de 39 blocs de Jenga se tenait parfaitement empilée. Ensuite, un robot blanc et noir, son seul membre a doublé comme une girafe courbée, zoomé vers la tour, brandissant un fouet en cuir noir. À travers ce qui aurait pu sembler à un spectateur occasionnel comme un miracle de physique, le fouet a frappé précisément le bon endroit pour envoyer un seul bloc volant de la pile tandis que le reste de la tour est resté structurellement sain.

Cette tâche, connue sous le nom de «Jenga Whiping», est un passe-temps poursuivi par des personnes atteintes de dextérité et de réflexes pour le retirer. Maintenant, il a été maîtrisé par les robots, grâce à une méthode de formation roman et alimentée par l’IA. En apprenant des démonstrations humaines et des commentaires, ainsi que ses propres tentatives réelles, ce protocole de formation enseigne aux robots comment effectuer des tâches compliquées comme Jenga fouetter avec un taux de réussite à 100%. De plus, les robots sont enseignés à une vitesse impressionnante, leur permettant d’apprendre dans une à deux heures comment assembler parfaitement une carte mère d’ordinateur, construire une étagère Et plus.

Alimenté par l’IA, le champ d’apprentissage du robot a cherché à relever le défi de la façon d’enseigner les activités de machines imprévisibles ou compliquées, par opposition à une seule action, comme ramasser à plusieurs reprises un objet à partir d’un endroit particulier sur un tapis roulant. Pour résoudre ce dilemme, Levine’s Lab a fait irruption sur ce qu’on appelle «l’apprentissage du renforcement». Le chercheur postdoctoral Jianlan Luo a expliqué que dans l’apprentissage du renforcement, un robot tente une tâche dans le monde réel et, en utilisant les commentaires des caméras, apprend de ses erreurs pour finalement maîtriser cette compétence. Quand l’équipe Annoncé pour la première fois Une nouvelle suite logicielle utilisant cette approche au début de 2024, Luo a déclaré qu’ils étaient encouragés que d’autres pouvaient rapidement reproduire leur succès en utilisant le logiciel open-source par eux-mêmes.

Cet automne, l’équipe de recherche de Levine, Luo, Charles Xu, Zheyuan Hu et Jeffrey Wu ont publié un rapport technique À propos de son système le plus récent, celui qui a accédé au fouet Jenga. Cette version nouvelle et améliorée a été ajoutée dans l’intervention humaine. Avec une souris spéciale qui contrôle le robot, un humain peut corriger le cours du robot et ces corrections peuvent être incorporées dans la banque de mémoire proverbiale du robot. En utilisant une méthode d’IA appelée apprentissage du renforcement, le robot analyse la somme de toutes ses tentatives – assistée et non assistée, réussie et infructueuse – pour mieux effectuer sa tâche. Luo a déclaré qu’un humain devait intervenir de moins en moins comme le robot l’a appris de l’expérience. “J’avais besoin de garder le robot pendant peut-être les 30% ou quelque chose, et ensuite progressivement, je pourrais réellement prêter moins d’attention”, a-t-il déclaré.

Le laboratoire a mis son système robotique à travers un gant de tâches compliquées au-delà du fouet de Jenga. Le robot a retourné un œuf dans une casserole; passé un objet d’un bras à un autre; et assemblé une carte mère, un tableau de bord de voiture et une courroie de distribution. Les chercheurs ont sélectionné ces défis parce qu’ils variaient et, selon les mots de Luo, représentaient «toutes sortes d’incertitude lors de l’exécution de tâches robotiques dans le monde réel complexe».

La tâche de ceinture de distribution s’est démarquée en termes de difficulté. Chaque fois que le robot interagissait avec la courroie de distribution – imaginez essayer de manipuler une chaîne de collier de disquette sur deux chevilles – il fallait anticiper et réagir à ce changement.

Le fouet de Jenga constitue un autre type de défi. Cela implique une physique difficile à modéliser, il est donc moins efficace de former un robot en utilisant les simulations seules; L’expérience du monde réel a été critique.

Les chercheurs ont également testé l’adaptabilité des robots en mettant en scène des accidents. Ils forceraient une pince à s’ouvrir afin qu’il ait laissé tomber un objet ou déplacer une carte mère alors que le robot tentait d’installer une micropuce, la formant pour réagir à une situation changeante qu’il pourrait rencontrer en dehors d’un environnement de laboratoire.

À la fin de la formation, le robot pourrait exécuter ces tâches correctement 100% du temps. Les chercheurs ont comparé leurs résultats à une méthode courante de «copier mon comportement» connu sous le nom de clonage comportemental qui a été formé sur la même quantité de données de démonstration; Leur nouveau système a rendu les robots plus rapidement et plus précis. Ces mesures sont cruciales, a déclaré Luo, car la barre des compétences du robot est très élevée. Les consommateurs et les industriels réguliers ne veulent pas acheter un robot incohérent. Luo a souligné que, en particulier, des processus de fabrication «fabriqués sur commande» comme ceux souvent utilisés pour l’électronique, les automobiles et les pièces aérospatiales pourraient bénéficier de robots qui peuvent apprendre de manière fiable et adaptablement une gamme de tâches.

Dans le sens des aiguilles d’une montre en haut à gauche, les chercheurs Zheyuan Hu, Jianlan Luo, Charles Xu et Jeffrey Wu.

Avec l’aimable autorisation de l’IA robotique et du laboratoire d’apprentissage.

La première fois que le robot a conquis le défi de fouet de Jenga, “cela m’a vraiment choqué”, a déclaré Luo. «La tâche Jenga est très difficile pour la plupart des humains. Je l’ai essayé avec un fouet dans ma main; J’avais un taux de réussite de 0%. » Et même lorsqu’il est empilé contre un adepte de jenga humain, a-t-il ajouté, le robot surpassera probablement l’humain car il n’a pas de muscles qui finiront par se fatiguer.

Le nouveau système d’apprentissage du Levine Lab fait partie d’une tendance plus large de l’innovation en robotique. Au cours des deux dernières années, le champ plus grand a évolué dans des sauts et des limites, propulsés par l’investissement de l’industrie et l’IA, qui donne aux ingénieurs des outils turbocompressés pour analyser les données de performance ou l’entrée d’image qu’un robot pourrait observer. Les professeurs et chercheurs de Berkeley font partie de cette amélioration de l’innovation; Diverses sociétés de robotique de pointe qui ont reçu un financement de capital-risque substantiel ou même devenues publiques ont des liens de campus.

La tête d'un homme dans des lunettes portant une chemise à col et un boucheSergey Levine, professeur agrégé de génie électrique et de sciences informatiques.

Avec l’aimable autorisation de l’IA robotique et du laboratoire d’apprentissage

Levine a cofondé la société de robotique Physical Intelligence (PI), qui est actuellement évaluée à 2 milliards de dollars pour ses progrès vers la création de logiciels qui peuvent fonctionner pour une variété de robots. Dans son dernier tour de financementPI a levé 400 millions de dollars auprès des investisseurs, dont Jeff Bezos et Openai. En 2018, le professeur Ken Goldberg et d’autres chercheurs de Berkeley se sont formés Ambi Roboticsqui a collecté quelque 67 millions de dollars; L’entreprise crée des robots qualifié via des simulations d’IA qui saisissent et trient des parcelles dans différents conteneurs, ce qui les rend indispensables aux entreprises de commerce électronique. Pieter Abbeel, directeur du Berkeley Artificial Intelligence Research Lab, a co-créé la startup de la robotique de l’IA Covariant, dont les modèles – et la confiance du cerveau – étaient Enrôlé par Amazon l’année dernière. Et Homayoon Kazerooni, professeur de génie mécanique, a fondé la société cotée en bibère EKSO Bionics, qui fabrique des «exosquelettes» robotiques pour les personnes à mobilité réduite.

Quant aux recherches de Luo, il est ravi de voir où son équipe et d’autres chercheurs peuvent la pousser. Une prochaine étape, a-t-il dit, serait de pré-entraîner le système avec des capacités de manipulation d’objets de base, éliminant la nécessité de les apprendre à partir de zéro et de progresser directement à l’acquisition de compétences plus complexes. Le laboratoire a également choisi de rendre ses recherches open source afin que d’autres chercheurs puissent l’utiliser et le construire.

“Un objectif clé de ce projet est de rendre la technologie aussi accessible et conviviale en tant qu’iPhone”, a déclaré Luo. «Je crois fermement que plus les personnes qui peuvent l’utiliser, plus nous pouvons avoir d’impact.»

#utilisant #lIA #ces #robots #acquièrent #des #compétences #compliquées #avec #une #précision #surprenante

You may also like

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.