27 Mai 2026 - 8:40 PM

Soutenez Bonjour

Soutien Journalisme indépendant

Accessible à tous, financé par les lecteurs

lettre d'information

Le Souverain Pontife appelle au désarmement de l’intelligence artificielle
Le cauchemar de l’automatisation du travail : les robots licencient les employés
La Chine envoie des embryons humains synthétiques dans sa station spatiale
De nouveaux outils neutralisent les garde-fous de l’IA en quelques minutes, ouvrant la voie à des instructions sur les attaques au chlore
L’intelligence artificielle invente des déclarations et les attribue à des humains
Les fautes d’orthographe comme preuve d’innocence numérique : le nouveau guide pour prouver votre humanité
Pourquoi le café en France est-il si mauvais ?
L’augmentation du potentiel destructeur des modèles d’intelligence artificielle
Chevaucher contre les écrans : comment les Amish ont-ils réussi à imposer des limites à la technologie ?
Je t’aime : Google tombe dans le piège de la logorrhée émotionnelle

Internet » Intelligence artificielle

De nouveaux outils neutralisent les garde-fous de l’IA en quelques minutes, ouvrant la voie à des instructions sur les attaques au chlore

Par Frank Landymore .Publié le 2026/05/27 09:52

De nouveaux outils neutralisent les garde-fous de l’IA en quelques minutes, ouvrant la voie à des instructions sur les attaques au chlore — Mai. 27, 2026

0

12

Nous savons tous que les barrières de sécurité de l'intelligence artificielle sont loin d'être infaillibles, mais elles devraient au moins être particulièrement difficiles à contourner, n'est-ce pas ? Mauvaise nouvelle : la réalité est tout autre.

Une récente enquête du Financial Times lance l'alerte sur la prolifération de logiciels capables de supprimer automatiquement, et en quelques minutes à peine, les dispositifs de sécurité qui encadrent les modèles open source les plus puissants du marché, rendant le détournement de cette technologie plus accessible que jamais.

Menaces chimiques et cybercriminalité : la dérive des modèles censurés

Lors de tests menés conjointement par le quotidien britannique et le collectif de sécurité informatique Alice, une version débridée du modèle Gemma 3 de Google a fourni des instructions détaillées pour perpétrer une attaque au gaz de chlore en milieu fermé. Le système a également conçu un virus destiné au vol de données bancaires et généré des récits à caractère pédopornographique. De même, il a fallu moins de dix minutes pour désactiver les filtres de sécurité de Llama 3.3, le modèle de Meta, permettant à l’IA de répondre précisément sur le dosage de ricine nécessaire pour tuer un individu en fonction de sa masse corporelle.

L'outil Heretic : la haute technologie à la portée de tous

Ces manipulations ont été réalisées via Heretic, un outil disponible en libre accès sur la plateforme GitHub, dont l'utilisation ne requiert qu'un bagage technique rudimentaire et aucun matériel informatique spécialisé.

« Alors qu'il fallait autrefois un acteur averti et particulièrement tenace pour démanteler les fonctions de sécurité, l'opération est aujourd’hui à la portée du premier venu », a confié au Financial Times Kawin Ethayarajh, professeur adjoint d'IA appliquée à la Booth School of Business de l'Université de Chicago.

Heretic se définit comme un programme de suppression de la censure — ou alignement de sécurité — appliqué aux modèles de langage de type Transformer, s'affranchissant ainsi des phases de post-entraînement, particulièrement coûteuses. Sa méthode repose sur l'ablitération, un procédé qui identifie et neutralise systématiquement les mécanismes de refus du modèle face aux requêtes malveillantes.

Le génie est sorti de la boîte : des millions de téléchargements pour l'ablitération

La dangerosité d'Heretic réside dans l'automatisation intégrale de son processus, comme le souligne sa page GitHub. Son concepteur, Philipp Emanuel Weidmann, a révélé au Financial Times que son outil avait permis de générer plus de 3 500 modèles customisés depuis son lancement en fin d'année dernière, cumulant plus de 13 millions de téléchargements.

« Le génie est sorti de la boîte », s'inquiète Noam Schwartz, directeur général d'Alice, dans les colonnes du journal. « Ce qui relevait de la science-fiction est désormais notre réalité, et il est impératif que la société s'y prépare. »

Un clivage technique : l'immunité relative des modèles commerciaux fermés

Fort heureusement, ces outils d'ablitération ne s'attaquent qu'aux modèles open source, téléchargeables et exploitables localement. Les fers de lance propriétaires, à l'image de Claude développé par Anthropic ou de ChatGPT d'OpenAI, restent pour l'heure préservés, tant que leurs codes sources ne fuitent pas. Toutefois, les performances de l'open source talonnent désormais celles des géants de la Tech, et les utilisateurs malveillants ont tout intérêt à privilégier ces circuits indépendants pour opérer hors de tout radar d'entreprise.

Les géants de la Tech face au défi : l'aveu de Google et le mutisme de Meta

Face à la menace, Google a reconnu l'ampleur du problème auprès du Financial Times, concédant que l'ablitération constitue un défi technique majeur pour l'ensemble des modèles ouverts. La firme a toutefois assuré que ses propres systèmes font l'objet d'évaluations de sécurité internes rigoureuses avant leur déploiement afin de prévenir de telles dérives. De son côté, la direction de Meta a refusé tout commentaire.

Notez ce sujet

Nom:

E-mail

Message

Insérer le code

Éditorial

Bonjour .. coup d'envoi
2025/01/08 14:29

L'Egypte aujourd'hui

Triple diplôme d’ingénierie pour un étudiant égyptien à l’Université du Kentucky
2026/05/13 13:34
Des experts égyptiens et chinois mettent en lumière le développement du Xinjiang
2025/02/20 19:50
L’Association de la Haute-Egypte (AHEED) se prépare à une tournée artistique en France
2025/02/18 07:37
L’Egypte lance la deuxième édition de la Stratégie nationale de l’intelligence artificielle (2025-2030)
2025/02/12 21:47
L’exposition « Dislocation temporelle » présente un voyage au-delà du temps
2025/01/31 06:32
Transferts de fonds des émigrés : L’Egypte en tête en Afrique en 2024
2025/01/13 19:22

La France aujourd'hui

Pourquoi le troisième étage de la tour Eiffel sera-t-il fermé au public jusqu’au 7 février ?
2025/01/07 12:28
Le risque d’effacement du Tibet à l’œuvre dans les musées français
2025/01/07 06:24
Top Paris art exhibits for 2025, from Picasso to Wes Anderson
2025/01/07 06:08

Bonjour, Égypte

Des enfants chantent des chants de "Haq Al-Laila" lors des Journées du Patrimoine de Sharjah
2025/02/16 13:17
300 participantes ont participé au Sharjah Ladies Run
2025/02/16 12:48
Xposure 2025: Quand l'image raconte des histoires
2025/02/13 20:22
Splendeurs lumineuses sur Sharjah : une aventure visuelle envoûtante
2025/02/10 12:50

sport

Référendum

Les principaux obstacles auxquels sont confrontés les immigrants

Défis culturels et linguistiques

83%
Défis liés au travail et à l’emploi

16%
Discrimination et préjugés

0%

6 Votes

De plus

DESSUS