Anthropic a broyé des millions d’ouvrages pour nourrir Claude AI
Par Frank Landymore .Publié le
2026/02/01 16:09
Février. 01, 2026
L’entreprise Anthropic a passé au pilon des millions de livres physiques pour entraîner son modèle d’intelligence artificielle, Claude. De nouveaux documents judiciaires suggèrent que la start-up était parfaitement consciente du désastre médiatique qu’une telle révélation provoquerait auprès du grand public.
Baptisée Projet Panama, cette initiative secrète a été mise au jour l’été dernier lors d’un procès intenté par un collectif d’auteurs. En août, Anthropic a fini par accepter un accord à l’amiable s’levant à 1,5 milliard de dollars pour clore le litige.
L’envers du décor : Une stratégie de l’ombre
Depuis lors, les coulisses de l’affaire sont devenues plus claires. Suite à la décision d’un juge de district de lever le sceau de confidentialité sur certains documents, le Washington Post a révélé les détails d’une stratégie qui fait froid dans le dos des bibliophiles.
Une machine de guerre contre le papier
Pour la direction d’Anthropic, les livres sont jugés essentiels à l’apprentissage de l’IA. Selon l’un des cofondateurs, ils permettent d’enseigner aux bots l’art de bien écrire, loin du langage appauvri que l’on trouve sur internet.
Pour atteindre cet objectif à moindre coût, la firme a mis en place un processus industriel :
Acquisition : Achat massif de livres d’occasion.
Destruction : Utilisation d’une guillotine hydraulique pour découper proprement les reliures.
Numérisation : Passage des pages déliées dans des scanners de production à haute vitesse.
Recyclage : Envoi des restes éviscérés à une entreprise de retraitement des déchets.
Sur le plan juridique, Anthropic a exploité la doctrine de la première vente (First-sale doctrine), qui permet à l’acheteur d’un objet de disposer de sa propriété physique comme bon lui semble. En août dernier, un juge a estimé que cette transformation du papier en données numériques relevait de l’usage équitable (fair-use), épargnant ainsi à l’entreprise de rémunérer les auteurs pour leur travail original.
La peur du scandale éthique
Si la pratique frôle la légalité, elle est un cauchemar éthique. Anthropic semble avoir été hantée par l’image symbolique que cela renverrait : une industrie technologique dévorant littéralement les arts.
Un document de planification interne de 2024, cité par le Washington Post, est sans équivoque : Nous ne voulons pas que l’on sache que nous travaillons sur ce projet.
Avant de s’attaquer aux bibliothèques physiques, Anthropic s’était servie dans les bibliothèques de l’ombre (shadow libraries) comme LibGen, spécialisées dans le piratage. Bien que la destruction des livres physiques ait été jugée légale, l’usage de fichiers piratés a conduit à l’amende record de 1,5 milliard de dollars.
Un péché partagé dans la Silicon Valley
Anthropic n’est pas seule dans cette tourmente. Des documents issus d’un autre procès révèlent que Meta, la firme de Mark Zuckerberg, a également puisé massivement dans des bases de données illégales. En 2023, un ingénieur de Meta s’en amusait même de manière cynique dans une communication interne : Télécharger des torrents depuis un ordinateur de l’entreprise ne semble pas tout à fait correct.
Le constat est amer pour le monde des lettres : dans la course à la puissance de calcul, le livre n’est plus un objet de culture, mais un simple carburant que l’on brûle une fois consommé.
Notez ce sujet