OpenAI : les sites web se révoltent contre ses robots voraces (GPTBot et ChatGPT)
OpenAI se heurte à la résistance des sites web qui bloquent ses robots GPTBot et ChatGPT, accusés de piller et de détourner leurs contenus. Un bras de fer juridique s’annonce entre les éditeurs et les géants de l’IA.

OpenAI propose aux éditeurs et aux opérateurs de sites web de leur permettre d’opter pour ne pas rendre leur contenu accessible gratuitement aux chatbots et aux modèles d’IA. Pour cela, ils doivent bloquer le robot d’OpenAI, nommé GPTBot, via le fichier robots.txt. GPTBot collecte du contenu pour améliorer les futurs modèles d’IA, selon OpenAI.
Or, de nombreux médias et fournisseurs de contenu en ligne ont décidé de bloquer GPTBot, craignant de perdre des revenus publicitaires ou des droits d’auteur. Selon une analyse d’Originality.ai, 9,2 % des 1000 sites web les plus populaires bloquaient GPTBot à la fin du mois d’août, avec un taux de croissance hebdomadaire de cinq pour cent.
Mais bloquer GPTBot ne suffit pas : il faudrait aussi bloquer l’agent ChatGPT, qui permet aux chatbots d’accéder aux pages web, d’en extraire du contenu et de le discuter dans le chat. Cela supprime le clic vers le site web et donc la monétisation. OpenAI se retire progressivement du domaine de la navigation par IA, officiellement à cause du contournement des paywalls, mais probablement aussi à cause de la situation juridique incertaine. Microsoft et Google continuent cependant à proposer des fonctionnalités similaires.
Aucune des grandes entreprises d’IA n’a encore présenté un plan pour préserver l’écosystème du contenu web face au succès des chatbots. La question devra sans doute être tranchée devant les tribunaux, entre les grands éditeurs et les grandes entreprises d’IA comme Google, Microsoft et OpenAI. Le New York Times se préparerait à poursuivre OpenAI en justice.