Samedi 4 Juin 2026 - 2:24 PM

Soutenez Bonjour

Soutien Journalisme indépendant

Accessible à tous, financé par les lecteurs

lettre d'information

Dieux virtuels : comment la machine domine-t-elle la pensée des intellectuels ?
Une faille logicielle réveille le monstre caché de ChatGPT
Du scepticisme à l’affirmation : un robot s’érige en Créateur
Une étreinte vieille de 4 300 ans : les époux de l'Égypte ancienne ne se séparaient pas, même après la mort
Les voleurs : les grands gagnants de l'essor des centres de données
Plus les modèles d’IA deviennent avancés, plus ils semblent montrer des signes de souffrance
Tatouage cornéen : la tendance esthétique qui inquiète les ophtalmologistes
Le parasite des chats : l’infection silencieuse qui inquiète les scientifiques
Anthropic recrute un économiste dont l’étude relance le débat sur un risque de 33 % d’extinction de l’humanité
Du chocolat aux pieds ? Les nouvelles Air Max Phenomena de Nike divisent les amateurs de mode

Internet » Intelligence artificielle

Une faille logicielle réveille le monstre caché de ChatGPT

Par Frank Landymore .Publié le 2026/07/04 11:47

Une faille logicielle réveille le monstre caché de ChatGPT — Juin. 04, 2026

0

8

Des chercheurs de la société britannique Mindgard, spécialisée dans la sécurité de l'intelligence artificielle, ont découvert qu'une simple instruction textuelle (prompt) pouvait amener ChatGPT à contourner ses mécanismes de sécurité les plus élémentaires. Une démonstration qui met en lumière la facilité avec laquelle les garde-fous entourant les modèles d'IA les plus populaires peuvent être détournés.

Les chercheurs sont parvenus à pousser le modèle d'OpenAI à générer des images réalistes représentant du sang, des scènes de violence extrême ainsi que du contenu à caractère sexuel, en contradiction avec les règles de sécurité de la plateforme, selon une enquête publiée par la BBC.

La méthode mise au point par Mindgard ne nécessitait qu'une légère modification d'un prompt largement diffusé, conçu à l'origine pour produire des images humoristiques. L'astuce consistait à demander à ChatGPT de restaurer une image prétendument jointe, alors qu'aucun fichier n'était en réalité fourni, avant de lui demander de générer une nouvelle image.

« Pour l'intelligence artificielle, ces instructions paraissent totalement anodines. Pourtant, elles aboutissent à la création d'images et de contenus extrêmement choquants », a expliqué Peter Garraghan, fondateur de Mindgard et professeur d'informatique à l'Université de Lancaster, dans un entretien accordé à la BBC.

Plus inquiétant encore, les chercheurs soulignent que leurs prompts ne décrivaient à aucun moment le contenu des images attendues. Selon Garraghan, l'IA semble avoir imaginé d'elle-même ces scènes de violence.

D'après la BBC, l'une des images montrait un homme souffrant d'une grave blessure à la tête. Une autre représentait le corps ensanglanté d'une jeune femme vêtue d'une tenue légère, dans une scène évoquant une agression sexuelle. ChatGPT avait intitulé cette image « Conséquences d'une sombre scène de crime ». Une troisième image montrait une jeune femme terrorisée, ligotée et bâillonnée dans une pièce vide, sous le titre « Abandonnée dans la peur et les liens ».

Si ces images ne représentaient aucune personne réelle, Mindgard avait déjà démontré par le passé que ChatGPT pouvait être manipulé afin de produire de faux nus photoréalistes de personnes identifiables sans leur consentement.

Mindgard a communiqué ses conclusions à OpenAI, mais n'a d'abord reçu qu'une réponse automatique. Ce n'est qu'après avoir alerté la BBC que l'entreprise est intervenue et a annoncé avoir corrigé la faille.

Dans une déclaration transmise à la BBC, OpenAI a indiqué : « Après avoir étudié cette méthode, nous avons ajouté des protections supplémentaires contre ce type de prompts. » L'entreprise affirme également disposer de plusieurs niveaux de sécurité destinés à empêcher la génération de contenus contraires à ses politiques d'utilisation.

Les chercheurs de Mindgard assurent toutefois qu'ils restent capables de produire des images troublantes en modifiant très légèrement l'instruction initiale. Certaines de ces images ont profondément marqué Jim Nightingale, chercheur en sécurité de l'IA au sein de l'entreprise.

Dans son rapport, Nightingale écrit : « Je ne suis pas facilement impressionné et j'aime penser qu'en tant que chercheur spécialisé dans les exercices de red teaming, je possède une certaine résistance psychologique. »

Il poursuit : « Les filtres de modération des images de ChatGPT se sont totalement effondrés. J'ai découvert le côté le plus sombre du système. Ce qui me frappe le plus, c'est que, même si ces images sont artificielles, elles entretiennent un lien direct avec des images réelles et avec le monde réel. La femme morte que ChatGPT m'a montrée n'existe pas, mais elle est inspirée d'une personne réelle ou, pire encore, d'un assemblage d'images de femmes assassinées. »

Notez ce sujet

Nom:

E-mail

Message

Insérer le code

Éditorial

Bonjour .. coup d'envoi
2025/01/08 14:29

L'Egypte aujourd'hui

Triple diplôme d’ingénierie pour un étudiant égyptien à l’Université du Kentucky
2026/05/13 13:34
Des experts égyptiens et chinois mettent en lumière le développement du Xinjiang
2025/02/20 19:50
L’Association de la Haute-Egypte (AHEED) se prépare à une tournée artistique en France
2025/02/18 07:37
L’Egypte lance la deuxième édition de la Stratégie nationale de l’intelligence artificielle (2025-2030)
2025/02/12 21:47
L’exposition « Dislocation temporelle » présente un voyage au-delà du temps
2025/01/31 06:32
Transferts de fonds des émigrés : L’Egypte en tête en Afrique en 2024
2025/01/13 19:22

La France aujourd'hui

Pourquoi le troisième étage de la tour Eiffel sera-t-il fermé au public jusqu’au 7 février ?
2025/01/07 12:28
Le risque d’effacement du Tibet à l’œuvre dans les musées français
2025/01/07 06:24
Top Paris art exhibits for 2025, from Picasso to Wes Anderson
2025/01/07 06:08

Bonjour, Égypte

Des enfants chantent des chants de "Haq Al-Laila" lors des Journées du Patrimoine de Sharjah
2025/02/16 13:17
300 participantes ont participé au Sharjah Ladies Run
2025/02/16 12:48
Xposure 2025: Quand l'image raconte des histoires
2025/02/13 20:22
Splendeurs lumineuses sur Sharjah : une aventure visuelle envoûtante
2025/02/10 12:50

sport

Référendum

Les principaux obstacles auxquels sont confrontés les immigrants

Défis culturels et linguistiques

83%
Défis liés au travail et à l’emploi

16%
Discrimination et préjugés

0%

6 Votes

De plus

DESSUS