Le gouvernement veut donc utiliser les réseaux sociaux pour traquer les fraudeurs fiscaux : voici comment fonctionne le data scraping

Le gouvernement veut donc utiliser les réseaux sociaux pour traquer les fraudeurs fiscaux : voici comment fonctionne le data scraping

2024-01-31 21:39:57

Internet est une source inépuisable d’informations. La même chose vaut pour les médias sociaux. Une quantité infinie de données accessibles à tous. Grâce à ces données, vous pouvez obtenir des informations détaillées sur la vie des gens. Informations financières, personnelles, informations sur les achats effectués ou simplement imaginés. Pour collecter ces informations, les organiser et les classer, diverses techniques ont évolué au fil des années. Le tout sous un seul nom. Un seul chapeau : grattage de données, grattage de données. Une collection numérique qui peut se dérouler de différentes manières. Plus ou moins invasif, plus ou moins efficace. Plus ou moins nuisible à la vie privée.

Data scraping pour les entrepreneurs et les professionnels

Nous comprenons donc la sensation suscitée par les propos du vice-ministre de l’Économie, Maurizio Leo : « Nous travaillons avec l’Agence des Revenus et Sogei, ce qu’il faut faire, c’est ce qu’on appelle le ‘data scraping’, c’est-à-dire, compte tenu de la données sur le niveau de vie que les professionnels et les entrepreneurs publient sur les réseaux sociaux”. Ce ne sont pas des mots nouveaux de la part de Leo, qui avait déjà émis l’hypothèse de l’utilisation de l’intelligence artificielle pour traquer les fraudeurs fiscaux et les 80 à 100 milliards d’impôts qu’ils volent au trésor. Ce qui a cependant suscité polémiques et prises de distance parmi les membres de la majorité gouvernementale eux-mêmes. Il n’y a aucun détail sur la manière dont le sous-ministre compte intervenir. Mais nous pouvons esquisser quelques principes généraux. Qu’est-ce que le grattage de données ? Comment ça marche?

Qu’est-ce que le grattage de données et comment ça marche

Dans un sens plus large et plus général, nous parlons de grattage de données lorsqu’un processus se produit par lequel une application Web extrait des informations d’un autre logiciel. Mais Leo dans ses déclarations faisait référence au data scraping, une technique qui implique l’utilisation d’un logiciel capable de récupérer des informations sur un site Web (y compris les réseaux sociaux) et de les classer en fonction de caractéristiques requises: toutes les personnes aux cheveux blonds, tous les propriétaires de voitures de sport, tous les cours de padel débutant par exemple. Une technique de classification automatique des informations.

Ce n’est pas toujours une activité légitime. En fait, il existe de nombreux cas où la récupération de données a été jugée illégale. Le cas le plus connu et le plus frappant est celui de Cambridge Analytica, la startup qui a découvert en 2018 qu’elle détenait des données sur la vie de 87 millions de personnes et les avait collectées pour en faire des cibles de propagande politique. Mais il y a eu des dizaines de cas similaires ces dernières années. Méta annoncée des mesures très sévères contre ceux qui font du data scraping sur ses plateformes. Elon Musk il a bloqué il y a un an afficher des tweets au-delà d’un certain nombre pour entraver la pratique.

Comment les informations sont collectées sur les sites et les réseaux sociaux

La collecte de ces données peut se faire de différentes manières. Fondamentalement, il y a l’automatisation des processus de collecte de données effectués par des robots ou des araignées (noms techniques qui indiquent un logiciel conçu à cet effet). Une automatisation qui entraîne souvent le risque de collecter des données de manière illicite et au mépris de la vie privée.

L’un des moyens les plus répandus consiste à collecter des données avec un logiciel qui simule la navigation en ligne effectuée par des utilisateurs réels, pour atteindre même là où des limitations ont été imposées à l’accès public (photos partagées uniquement avec ses amis ou informations reléguées à un cercle proche de personnes). . Les informations acquises peuvent ensuite être traitées, collectées dans une base de données, classées pour des investigations ultérieures. Un peu comme une archive. Comme un journal de données.

Les risques pour la vie privée (et le RGPD)

La loi européenne sur les données personnelles (RGPD) n’interdit cependant pas l’escarpement des données. Dans le cas du grattage de données appliqué par un État dans le but de lutter contre l’évasion fiscale, il y a des questions à résoudre : comprendre si le traitement des données viole les droits fondamentaux des citoyens, s’il n’y a pas d’introduction excessive dans la vie des gens. Mais il y a un fait. Sur Internet et sur les réseaux sociaux, les gens partagent souvent leur vie. Et ils le font publiquement, en essayant souvent de toucher le plus grand public possible, en parlant d’eux-mêmes, de leurs achats, de leurs vacances.

Une mine d’informations qui pourrait faire l’objet d’études et d’enquêtes de la part de l’Agence des Revenus. Du moins dans les intentions du sous-ministre Leo. Un projet dont la faisabilité reste à comprendre. Le technique avant tout. Celle qui concerne la protection de la vie privée, certainement. Mais le plus difficile à obtenir pour le moment semble être le feu vert politique.



#gouvernement #veut #donc #utiliser #les #réseaux #sociaux #pour #traquer #les #fraudeurs #fiscaux #voici #comment #fonctionne #data #scraping
1706731055

Facebook
Twitter
LinkedIn
Pinterest

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Vendu – Vendu

2024-09-17 10:00:30 Vendu – Vendu Tout d’abord : oui, les pères du leader Griffin Taylor et du