2024-06-07 10:30:39
Quelque chose bouge dans l’ombre à quelques mètres, sur l’accotement, en direction de la route. En raison de la taille et de la forme de l’objet, il pourrait s’agir d’un piéton. « Alerte collision ! » annonce le système de voiture autonome, tout en activant le freinage d’urgence.
La vision par ordinateur peut effectuer des tâches extrêmement complexes grâce aux progrès de l’intelligence artificielle et de l’apprentissage profond. Sa grande précision lui a permis d’être utilisé dans des domaines aussi divers que la médecine, l’automobile ou la sécurité. À tel point qu’il est aujourd’hui possible d’imaginer un monde dans lequel les ordinateurs peuvent « voir » et interpréter l’environnement pratiquement comme les humains. Quels changements la vision par ordinateur apportera-t-elle à notre quotidien ?
La vision par ordinateur, une branche de l’IA
La vision par ordinateur est une branche de l’intelligence artificielle (IA) qui permet aux ordinateurs d’analyser des images et des vidéos. Son objectif ultime est de développer des systèmes capables de traiter et d’interpréter les informations visuelles d’une manière similaire à celle d’un humain, pour les appliquer à la prise de décision.
Les algorithmes de vision par ordinateur sont des techniques informatiques conçues pour permettre aux machines d’interpréter et de comprendre des images du monde réel. Ces algorithmes analysent et traitent les données visuelles capturées par les caméras et les capteurs. Les premières tentatives Ils datent du milieu du 20ème siècle, avec des méthodes basiques de traitement d’image.
Pour comprendre le fonctionnement de la vision par ordinateur, il est utile de considérer le système visuel humain comme une analogie. Un système de vision par ordinateur comporte deux composants principaux : un capteur qui imite la fonction de l’œil pour capturer des images et un algorithme puissant qui imite la fonction du cerveau pour comprendre et interpréter les données visuelles.
Pour chaque cas et chaque tâche spécifique, il est important de sélectionner le dispositif capteur le plus adapté. Il peut s’agir d’une caméra, d’un radar ou de quelque chose de plus spécifique comme un détecteur numérique de rayons X. Il est également possible d’utiliser une combinaison de dispositifs pour fournir une scène complète.
Réseaux convolutifs
La technique de vision par ordinateur la plus utilisée aujourd’hui est celle des réseaux convolutifs, dont origine remonte à 1998, même si son véritable explosion est arrivée en 2012. Deux étapes ont permis ce succès : la disponibilité de jeux de données à grande échelle, avec la montée en puissance des Big Dataet l’augmentation de la puissance de calcul, avec le développement de cartes graphiques (GPU) puissantes.
L’architecture d’un réseau convolutif est constituée d’une séquence de couches qui effectuent diverses opérations mathématiques. Les premières couches extraient les caractéristiques pertinentes des images. Les couches finales utilisent ces caractéristiques pour résoudre la tâche spécifique pour laquelle le réseau a été conçu.
Les réseaux convolutifs ont un large éventail d’applications dans notre vie quotidienne. Ils sont utilisés, par exemple, dans les systèmes de sécurité et de surveillance pour détecter et alerter sur les activités suspectes. Ils sont également présents sur les smartphones, avec un déverrouillage par reconnaissance faciale ou retouche photo.
Il s’agit d’une technologie cruciale qui transforme de multiples secteurs avec des applications plus spécialisées. En médecine, il est utilisé en imagerie diagnostique. Dans les véhicules autonomes, il permet de détecter les piétons, les panneaux et autres véhicules, et d’y réagir.
Implications éthiques de la vision par ordinateur
De l’autre côté de la médaille, l’utilisation de la vision par ordinateur soulève d’importantes questions éthiques et juridiques. Un problème crucial est celui de la confidentialité et du traitement des données sensibles. Les caméras de sécurité et les systèmes de reconnaissance faciale peuvent collecter de grandes quantités d’informations personnelles sans le consentement des individus.
Ces implications deviennent plus importantes dans les contextes où la prise de décision automatisée affecte les humains, posant des risques et des biais inhérents. Dans la identification des suspects dans les enquêtes criminelles peut conduire à une discrimination injuste. Dans le cas d diagnostics médicauxde mauvaises décisions peuvent avoir un impact négatif sur la vie des gens.
La Loi sur l’IA, récemment approuvé par l’Union européenne, introduit des obligations de transparence pour tous les modèles d’IA à usage général. Dans les domaines où les décisions sont à haut risque, comme c’est le cas de la vision par ordinateur appliquée aux personnes, la transparence n’est pas seulement une exigence éthique et juridique. Il s’agit également d’une nécessité pratique pour garantir la confiance et l’acceptation des technologies par leurs utilisateurs.
Lire la suite : Comment l’IA nous discrimine dans l’ombre et ce que proposent les nouvelles réglementations européennes pour l’éviter
La vision par ordinateur, une version améliorée de la vision humaine
Les modèles d’apprentissage profond, et en particulier les réseaux convolutifs, sont souvent décrits comme des « boîtes noires » car il est impossible de connaître le processus ou les étapes par lesquelles ils arrivent à un certain résultat. De plus, ils peuvent intégrer des préjugés involontaires dans les processus décisionnels. Pour relever ces défis, des techniques ont été développées qui permettent d’analyser les caractéristiques que le modèle prend en compte ou considère comme les plus importantes lors de la prise de décision.
Une autre possibilité est d’obtenir explications visuelles qui mettent en évidence, par exemple, les régions des images que le modèle a prises en compte pour prendre telle ou telle décision (comme le freinage d’urgence qui ouvre cet article, par exemple). À l’heure où l’on peut rêver que les ordinateurs soient capables de « voir » comme les humains, nous devons nous battre pour qu’ils n’héritent pas de nos préjugés et soient une version améliorée de nous-mêmes.
Cet article fait partie d’une collaboration avec Santander Open Academy, une initiative mondiale de Banco Santander qui offre à chacun l’accès à une formation pour améliorer ses compétences professionnelles et son employabilité. Il comprend des cours 100 % subventionnés, du contenu gratuit de qualité et des bourses auprès des principales universités et institutions du monde entier. Plus d’informations dans www.santanderopenacademy.com.
#Pouvezvous #voir #une #machine #vision #par #ordinateur #ses #applications
1717846856