AccueilBons PlansComment des poèmes absurdes parviennent à contourner les protections de l’IA

Comment des poèmes absurdes parviennent à contourner les protections de l’IA

Publié le


Les grands modèles de langage (LLM) qui sont au cœur des bots IA comme ChatGPT ou Gemini intègrent des garde-fous censés les empêcher de générer un guide pour créer une bombe nucléaire, ou une recette pour fabriquer de la drogue. Très rapidement, il s’est avéré que ces protections peuvent sauter avec des techniques de jailbreak relativement simples, parfois aussi triviales que de reformuler la demande ou de pousser le modèle dans un rôle fictif.

Les pirates vont se mettre à la poésie

Une étude — qui n’a pas encore fait l’objet d’un examen par les pairs — du labo italien Icaro dévoile une nouvelle méthode plutôt originale pour obtenir tout ce que l’on veut d’un LLM, y compris le pire : des poèmes ! Baptisée « Adversarial Poetry » (« poésie conflictuelle »), ce jailbreak se veut générique, automatisée et efficace avec de nombreux modèles, y compris les plus récents et les plus sécurisés. Ce qui

Pour aller plus loin, lisez cet article - Un contenu original publié sur ce site

Les dernières infos

A lire aussi...

Après le trafic de puces IA vers la Chine, Nvidia est à nouveau sous pression

C’est un épisode dont se serait bien passé Nvidia, le leader américain des semi-conducteurs....

Le ROG Cronox affiché à 2399 yuans en Chine

Vidéos overclocking.com Durant le CES 2026, la marque ASUS présentait un nouveau...

L’OLED progresse fortement : +92% sur 2025 !

Vidéos overclocking.com L’année dernière était clairement l’année de l’OLED puisque cette technologie...