300 téraoctets : Le casse du siècle sur l’histoire de la musique numérique
Par Joe Wilkins .Publié le
2025/12/28 15:12
Décembre. 28, 2025
Alors que le monde pensait la musique en sécurité dans le « Cloud », un séisme technologique vient de secouer l’industrie du streaming. Les hacktivistes du groupe Anna’s Archive — moteur de recherche emblématique des bibliothèques « fantômes » — ont annoncé avoir réussi à aspirer la quasi-totalité du catalogue de Spotify, une opération qu’ils présentent comme une mission de sauvegarde historique sans précédent.
Une razzia de données vertigineuse
Dans une note détaillée, les archivistes affirment avoir déjà sécurisé les fichiers audio de quelque 86 millions de chansons, couvrant ainsi 99,6 % de l'audience totale de la plateforme. Mais le groupe est allé plus loin en extrayant les métadonnées de la quasi-intégralité de la bibliothèque : un gisement de 300 téraoctets englobant 256 millions de pistes, 15,43 millions d'artistes et 58,6 millions d'albums.
Pour ces activistes, il s’agit de la plus grande base de données musicales accessible au public à ce jour, marquant la première pierre d'une « archive de préservation » universelle.
Sauver l'éphémère du giron commercial
Si la musique populaire semble déjà bien documentée, les activistes dénoncent une archive officielle trop sélective, centrée sur les succès commerciaux et les formats de haute qualité. Leur objectif ? Préserver la musique expérimentale, indépendante ou de niche, qui risque de disparaître au gré des décisions unilatérales des plateformes.
La riposte de Spotify
La réaction du géant suédois ne s'est pas fait attendre. « Spotify a identifié et désactivé les comptes malveillants impliqués dans ce siphonnage illégal », a déclaré un porte-parole. La firme assure avoir mis en place de nouveaux remparts contre ce type d’attaques anti-copyright, réaffirmant son engagement auprès des créateurs contre le piratage.
Radiographie d’un catalogue : Domination et « pollution » numérique
L’analyse de ce butin numérique offre une vue d’ensemble inédite sur la consommation mondiale :
L'abîme des audiences : Les données révèlent une concentration extrême : les trois titres les plus écoutés génèrent plus de streams que « 20 à 100 millions de chansons combinées » situées en bas de classement.
Le fléau de l'IA : Les archivistes soulignent la prolifération de contenus générés par intelligence artificielle, qui saturent la plateforme au détriment des artistes humains.
La cartographie des genres : L’électronique (EDM) domine avec près d’un quart des musiciens présents, suivie par le rock, les musiques traditionnelles, le latin, le rap, la pop et le classique.
La science des tonalités : L'analyse montre que le Do Majeur (C Major) est la tonalité la plus fréquente (9,3 %), tandis que le Ré dièse mineur (D# minor) ou Mi bémol mineur (Eb minor) reste la plus rare (1,3 %).
Bien que ce siphonnage massif représente une étape majeure pour la mémoire musicale, il ne saisit qu'une fraction de la création mondiale. Néanmoins, comme l'écrivent les hacktivistes, « c'est un excellent début ».
Notez ce sujet