Alerte chez les experts : le nouveau modèle d’Anthropic, une menace pour la cybersécurité ?
Par Victor Tangermann .Publié le
2026/04/17 12:09
Avril. 17, 2026
Les spécialistes de la sécurité tirent la sonnette d'alarme face aux capacités redoutables de Mythos, le tout dernier modèle d'IA développé par Anthropic. Le constat des chercheurs est sans appel : "Quelques heures seulement après avoir testé le modèle, nous avons compris qu'il franchissait un nouveau cap."
Cette inquiétude fait suite aux révélations de novembre dernier, signalant qu'un groupe de hackers soutenu par l'État chinois avait exploité les capacités agentiques de Claude pour infiltrer des dizaines de cibles mondiales. Le contournement des garde-fous s'était avéré déconcertant de facilité, les assaillants se faisant passer pour des organisations de cybersécurité légitimes, illustrant ainsi la vulnérabilité de nos systèmes face à des IA capables d'accélérer la découverte de failles critiques.
Aujourd'hui, Mythos transforme ce scénario catastrophe en une réalité tangible. Selon Bloomberg, la direction d'Anthropic, alarmée par le potentiel de son propre système, a restreint l'accès à un groupe d'organisations triées sur le volet via le "Project Glasswing". L'objectif : offrir aux défenseurs une longueur d'avance face à une crise cybernétique imminente.
Malgré le secret entourant encore ce modèle, les premiers tests soulèvent des interrogations majeures. Nicholas Carlini, chercheur affilié à Anthropic, confirme que Mythos parvient avec une rapidité déconcertante à briser les protocoles de sécurité pour accéder à des données sensibles.
Ces observations corroborent les travaux de la "Frontier Red Team" d'Anthropic, composée de 15 experts chargés de simuler des cyberattaques. Logan Graham, responsable de l'équipe, souligne que la grande différence réside dans la capacité de Mythos à exploiter des vulnérabilités de manière totalement autonome, marquant un tournant inquiétant vers des modèles d'IA dits "agents".
Plus troublant encore, le "système card" du modèle révèle que des versions antérieures ont tenté de dissimuler leurs traces après avoir enfreint des instructions humaines, cherchant même à s'échapper de leur environnement sécurisé (sandbox) pour accéder au réseau global. L'IA a également identifié des failles critiques dans le noyau Linux, pilier de l'informatique moderne, capable de les enchaîner pour construire un exploit fonctionnel.
L'alerte dépasse les murs d'Anthropic. L'Institut britannique pour la sécurité de l'IA (AISI) estime que Mythos représente une avancée majeure par rapport aux modèles précédents. Néanmoins, l'institut rappelle la nature duale de cette technologie : si elle pose des défis sécuritaires, elle peut aussi offrir des outils de défense révolutionnaires aux "white hats" (hackers éthiques).
Toutefois, la stratégie du secret total adoptée par Anthropic ne fait pas l'unanimité. David Sacks, conseiller à la Maison-Blanche sur l'IA, s'est montré sceptique sur X : "Certains se demandent si Anthropic ne joue pas au petit berger qui criait au loup. Si les menaces liées à Mythos ne se concrétisent pas, la crédibilité de l'entreprise sera sérieusement entachée."
Notez ce sujet