Conflit de contenu et d'IA : les éditeurs face au scraping et aux fausses promesses
Par Rashi Shrivastava et Richard Nieva .Publié le
2025/03/06 13:14

Mars. 06, 2025
Malgré les grandes promesses des entreprises d'intelligence artificielle selon lesquelles leurs moteurs de recherche basés sur l'IA augmenteraient le trafic de référence vers les sites des éditeurs, de nouvelles données révèlent une réalité bien différente, plaçant l'avenir des éditeurs face à des défis sans précédent.
Une baisse de 96 % du trafic de référence
Selon un nouveau rapport de la plateforme de licences de contenu TollBit, partagé exclusivement avec Forbes, les moteurs de recherche basés sur l'IA envoient 96 % moins de trafic de référence vers les sites d'actualités et de blogs que les moteurs de recherche traditionnels comme Google. Parallèlement, le "scraping" (extraction automatisée) des sites web par les développeurs d'IA a plus que doublé ces derniers mois.
L'explosion du scraping
Le rapport révèle que des entreprises comme OpenAI, Perplexity et Meta ont crawlé les sites web en moyenne 2 millions de fois au quatrième trimestre de l'année dernière. L'analyse portait sur 160 sites, incluant des actualités nationales et locales, des blogs technologiques et des sites de shopping. Chaque page a été crawlé environ sept fois en moyenne.
Toshit Panigrahi, PDG de TollBit, a déclaré à Forbes : "Nous observons un afflux de robots qui bombardent ces sites chaque fois qu'un utilisateur pose une question. La demande pour le contenu des éditeurs est loin d'être négligeable."
Réactions des entreprises
OpenAI n'a pas commenté, et Meta n'a pas répondu à une demande de commentaire. Un porte-parole de Perplexity n'a pas directement répondu aux allégations du rapport, mais a affirmé que l'entreprise respecte les directives "robots.txt", qui indiquent aux robots d'exploration les parties d'un site auxquelles ils peuvent accéder.
L'impact de l'IA sur les revenus des éditeurs
En février dernier, le cabinet de recherche Gartner avait prédit que le trafic provenant des moteurs de recherche traditionnels chuterait de 25 % d'ici 2026, en grande partie à cause des chatbots IA et autres agents virtuels. Les entreprises dépendant du trafic de recherche commencent déjà à en ressentir les effets.
Par exemple, Chegg, une entreprise spécialisée dans l'éducation technologique, a intenté un procès contre Google, affirmant que les résumés générés par l'IA de Google incluaient du contenu de son site sans attribution, détournant ainsi les visiteurs et affectant ses revenus déjà en baisse. Le trafic de Chegg a chuté de 49 % en janvier par rapport à l'année précédente.
Actions en justice des éditeurs
Des sites de réservation de voyages comme Kayak et TripAdvisor ont exprimé leurs inquiétudes quant à l'impact des aperçus de recherche IA de Google sur leur trafic. Par ailleurs, des éditeurs de presse ont engagé des poursuites contre OpenAI et Perplexity pour violation présumée de leurs droits de propriété intellectuelle.
Les défis techniques
Les entreprises d'IA utilisent des "agents utilisateurs" pour crawler le web et collecter des données, mais beaucoup ne divulguent pas correctement leurs robots d'exploration, rendant difficile pour les propriétaires de sites de comprendre comment leur contenu est utilisé.
Olivia Joslin, cofondatrice de TollBit, a déclaré : "Il est très difficile pour les éditeurs de bloquer Google, car cela pourrait affecter leur référencement naturel (SEO)."
Perplexity : entre scraping et trafic de référence
Le rapport a révélé que Perplexity, une start-up de recherche IA valorisée à 9 milliards de dollars, continue d'envoyer du trafic de référence aux éditeurs même lorsqu'elle est bloquée, suggérant qu'elle crawle les sites de manière clandestine. Dans un exemple, Perplexity a crawlé un site d'éditeur 500 fois mais a envoyé plus de 10 000 références.
Coûts supplémentaires pour les éditeurs
Le scraping intensif ne se contente pas de réduire le trafic et les revenus des éditeurs, il augmente également les coûts de serveur. Avec le lancement d'agents de recherche IA autonomes par des entreprises comme OpenAI et Perplexity, le problème ne fera qu'empirer.
Solutions proposées
Une solution évidente consiste à licencier directement les articles. Par exemple, l'Associated Press, Axel Springer et le Financial Times ont conclu des accords de contenu avec OpenAI. De nouvelles entreprises comme TollBit émergent également pour aider les éditeurs à monétiser leur contenu à l'ère de l'IA.
Conclusion
À l'ère de l'intelligence artificielle, les éditeurs sont confrontés à des défis majeurs pour préserver leurs revenus et leur trafic. Alors que les entreprises d'IA font de grandes promesses, la réalité montre que ce sont les éditeurs qui en paient le prix, que ce soit par une baisse des revenus ou une augmentation des coûts.
Source : Forbes
Notez ce sujet