La recherche par intelligence artificielle de Google donne aux sites Web un choix difficile : partager des données ou mourir

Google affiche désormais des réponses pratiques basées sur l’intelligence artificielle en haut de ses pages de recherche, ce qui signifie que les utilisateurs ne cliqueront peut-être jamais sur les sites Web dont les données sont utilisées pour alimenter ces résultats. Mais de nombreux propriétaires de sites affirment qu’ils ne peuvent pas se permettre d’empêcher l’IA de Google de résumer leur contenu.

C’est parce que l’outil de Google qui passe au crible le contenu Web pour trouver ses réponses basées sur l’IA est le même que celui qui suit les pages Web pour les résultats de recherche, selon les éditeurs. Bloquer Google, comme les sites ont bloqué certains de ses concurrents basés sur l’IA, entraverait également la capacité d’un site à être découvert en ligne.

La domination de Google dans le domaine de la recherche — qu’un tribunal fédéral américain a jugé la semaine dernière comme un monopole illégal — lui donne un avantage décisif dans la guerre de l’IA qui se prépare, ce que les startups et les éditeurs de recherche considèrent comme injuste à mesure que l’industrie prend forme.

Le dilemme est particulièrement aigu pour les éditeurs, qui doivent choisir entre proposer leur contenu à des modèles d’IA susceptibles de rendre leurs sites obsolètes et disparaître de la recherche Google, une source majeure de trafic.

« Cela devient comme une crise existentielle pour ces entreprises », a déclaré Joe Ragazzo, éditeur du site d’information Notes sur les points de discussion« Ce sont deux mauvaises options. Soit vous abandonnez et vous mourez immédiatement, soit vous vous associez à eux et vous mourrez probablement lentement, car au final, ils n’auront plus besoin de vous non plus. »

Lire aussi  Aménager son domicile pour bien vieillir chez soi

Google a déclaré que les aperçus AI (les résumés affichés en haut de la recherche Google) font partie de son engagement de longue date à fournir des informations de meilleure qualité et à renforcer les opportunités pour les éditeurs et autres entreprises.

Depuis ses débuts, Google a déployé un logiciel appelé Googlebot pour visiter ou « explorer » des millions de sites Web, constituant ainsi un répertoire détaillé de l’Internet mondial. Cet index a constitué une barrière à l’entrée redoutable pour les entreprises qui ont cherché à créer des moteurs de recherche concurrents au fil des ans, même celles qui ont les moyens, comme Microsoft.

IA générative

L’essor de l’IA générative a déclenché une nouvelle vague de startups cherchant à proposer des produits de recherche dans lesquels les modèles d’IA fournissent des réponses succinctes aux questions des utilisateurs. Mais avant que ces startups puissent réellement menacer l’activité du géant de la recherche, elles doivent explorer le Web et ce n’est pas une mince affaire.

Les propriétaires de sites Internet doivent se soumettre à une analyse qui leur coûte de l’argent, de la puissance de calcul et de l’espace de stockage. C’est pourquoi de nombreux éditeurs incluent un fichier qui définit les règles à suivre par les robots visitant leurs sites. Les entreprises qui bénéficient de la plus grande latitude sont généralement Google et Bing de Microsoft, qui peuvent générer du trafic vers leurs sites via leurs moteurs de recherche.

Dans le contexte de l’essor de l’intelligence artificielle, de nombreux accords ont été conclus entre des entreprises de médias et des startups, mais Google s’est montré particulièrement réticent. À l’exception d’un accord de 60 millions de dollars avec Reddit, Google a fait savoir aux éditeurs, à huis clos, qu’il n’était pas intéressé par des négociations, selon deux personnes au courant du dossier, qui ont demandé à ne pas être identifiées car l’information est privée.

Lire aussi  Anno 1800 est disponible gratuitement

L’accord de Google avec Reddit offre à l’entreprise une mine d’informations pour les modèles d’IA. L’accord a coïncidé avec les changements apportés par Google qui ont renforcé la présence des résultats de forums comme Reddit dans les résultats de recherche, générant ainsi d’énormes gains de trafic vers le site de médias sociaux.

Les entreprises de médias n’ont que peu d’influence dans les conversations avec ces géants de la technologie. Plus tôt cette année, Google a déployé AI Overviews, dans lequel l’entreprise utilise l’IA pour donner des réponses succinctes à certaines questions des utilisateurs en haut de la page de recherche. Les éditeurs se sont immédiatement inquiétés de l’impact que ces réponses pourraient avoir sur leur trafic, mais n’avaient aucun moyen clair de répondre à ces craintes.

Google a déclaré que les éditeurs peuvent bloquer l’apparition de pages ou de parties de pages spécifiques dans les aperçus AI dans les résultats de recherche – mais cela empêcherait probablement également ces extraits d’apparaître dans toutes les autres fonctionnalités de recherche de Google, y compris les listes de liens Web.

De nombreux éditeurs, qui dépendent souvent des moteurs de recherche pour au moins la moitié de leur trafic, ne sont pas prêts à prendre le risque de minimiser leur portée.

La position de Google « sous-estime le risque important que cela représente pour les créateurs de contenu, en particulier ceux qui dépendent de la visibilité des recherches pour gagner leur vie », a déclaré Marc McCollum, responsable de l’innovation chez Raptive, qui représente les éditeurs et les influenceurs.

Lire aussi  L'iPhone 16 d'Apple bénéficiera d'une mise à niveau de fonctionnalités unique dans les semaines à venir

« En se désinscrivant, les créateurs risquent de réduire par inadvertance leur présence globale dans les moteurs de recherche, ce qui pourrait nuire à leur capacité à atteindre leur public et à générer des revenus. »

Kyle Wiens, directeur général d’iFixit, un site Web qui publie des guides de réparation en ligne gratuits pour l’électronique grand public, a déclaré que la relation du site avec Google est « beaucoup plus ténue » qu’avec d’autres sociétés d’IA.

« Je peux empêcher ClaudeBot de nous indexer sans nuire à notre activité », a écrit M. Wiens dans un courriel, faisant référence au bot de la start-up d’intelligence artificielle générative Anthropic. « Mais si je bloque Googlebot, nous perdons du trafic et des clients. »

Quel que soit le résultat de l’affaire antitrust contre le géant de la technologie, les changements en cours dans le paysage de la recherche soulignent l’importance pour les éditeurs de contrôler leur propre destin et de ne pas devenir trop dépendants d’une seule plateforme technologique – y compris Google, a déclaré M. Ragazzo.

« Nous pensons qu’il faut nouer de véritables relations avec les lecteurs », a déclaré M. Ragazzo, « et c’est ainsi que l’on construit une publication capable de résister à différentes époques. »

Bloomberg

2024-08-18 14:43:00
1723982551


#recherche #par #intelligence #artificielle #Google #donne #aux #sites #Web #choix #difficile #partager #des #données #mourir

Facebook
Twitter
LinkedIn
Pinterest

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.