IA et droit d’auteur : L’étude qui pourrait faire vaciller les géants de la Silicon Valley
Par Victor Tangermann .Publié le
2026/01/19 03:51
Janvier. 19, 2026
Depuis des années, les leaders de l’intelligence artificielle — Google, Meta, Anthropic et OpenAI en tête — martèlent le même argument : leurs modèles de langage ne stockent pas techniquement d’œuvres protégées. Selon eux, l’IA ne ferait qu’apprendre de ses données d’entraînement, à l’instar du cerveau humain.
Cette distinction sémantique, ciselée avec une précision d’orfèvre, constitue le pivot de leur stratégie de défense face à une offensive judiciaire sans précédent. Elle touche au cœur même de la propriété intellectuelle. Aux États-Unis, le Copyright Act de 1976 octroie aux auteurs le droit exclusif de reproduire, d’adapter et de diffuser leurs œuvres.
Pourtant, la doctrine de l’usage loyal (fair use) permet l’utilisation de contenus protégés à des fins de critique, de journalisme ou de recherche. C’est sur ce rempart juridique que s’appuie l’industrie. Sam Altman, PDG d’OpenAI, est même allé jusqu’à affirmer que l’avenir du secteur serait compromis si l’accès libre aux données protégées lui était refusé.
Apprentissage ou simple plagiat numérique ?
Face à ces arguments, les ayants droit dénoncent une exploitation massive d’œuvres piratées, monétisées sans aucune rémunération pour les auteurs. Si cette bataille dure depuis des années, une étude accablante vient aujourd’hui fragiliser la position des entreprises technologiques.
Des chercheurs des universités de Stanford et de Yale ont apporté des preuves troublantes : les modèles d’IA ne se contenteraient pas d’apprendre, ils copieraient les données. L’étude démontre que quatre modèles majeurs — GPT-4.1, Gemini 2.5 Pro, Grok 3 et Claude 3.7 Sonnet — sont capables de restituer de longs extraits d’œuvres protégées avec une exactitude stupéfiante.
Le modèle Claude a ainsi reproduit des ouvrages entiers quasiment au mot près, avec un taux de précision de 95,8 %. De son côté, Gemini a restitué Harry Potter à l'école des sorciers avec une fidélité de 76,8 %, tandis que Claude réitérait l’exploit avec 1984 de George Orwell, dépassant les 94 % de conformité avec le texte original.
Un séisme juridique à plusieurs milliards de dollars
Ces révélations pourraient avoir des conséquences sismiques. Comme le souligne Alex Reisner dans The Atlantic, ces résultats sapent l’argument selon lequel l’IA apprend comme un humain. Il s’agirait plutôt d’un système de stockage et de rappel, ce qui constituerait une violation flagrante du droit d’auteur et pourrait coûter des milliards de dollars en dommages et intérêts.
Le débat reste toutefois vif sur la qualification juridique de ce processus. Mark Lemley, professeur à Stanford, s’interroge : le modèle contient-il réellement une copie ou la génère-t-il à la volée en réponse à une requête ?
Pour les détracteurs du système, l’analogie de l’apprentissage humain est une idée séduisante mais trompeuse. Elle occulterait la dépendance totale de l’IA envers les œuvres créatives qu’elle s’approprie. Alors que l’industrie atteint des sommets de valorisation boursière, les créateurs, eux, peinent de plus en plus à vivre de leur art. Reste à savoir si les juges décideront de fermer cette porte dérobée ou de protéger les remparts de la création humaine.
Notez ce sujet