Le nouveau générateur d'images d'OpenAI maîtrise enfin l'art du texte
Par Futurism .Publié le
2025/03/26 23:34

Mars. 26, 2025
OpenAI opère une véritable révolution dans l'intelligence artificielle générative avec le déploiement de nouvelles fonctionnalités pour ChatGPT, parvenant pour la première fois à intégrer du texte dans les images avec une précision quasi parfaite.
Une avancée majeure
Ce nouveau système marque un bond en avant par rapport aux versions précédentes. Alors que ChatGPT s'appuyait auparavant sur le modèle DALL-E pour créer des images, la mise à jour introduit désormais une option "Images dans ChatGPT", propulsée par GPT-4o – le modèle phare d'OpenAI depuis près d'un an. Cette technologie sera également intégrée à Sora, l'outil de génération vidéo de l'entreprise, élargissant ainsi les horizons de la création numérique.
Fonctionnement du nouveau modèle
Gabriel Goh, responsable recherche chez OpenAI, décrit ce modèle comme un "changement radical" nécessitant "des mois d'optimisations progressives". Ses atouts clés :
Une précision textuelle inégalée
Les versions antérieures produisaient des textes illisibles ou truffés de fautes.
Désormais, le système génère des textes nets et cohérents, comme le démontrent des exemples officiels : tableaux blancs annotés ou bandes dessinées parfaitement lisibles.
Une mécanique innovante
GPT-4o utilise une approche autoregressive (contrairement au diffusion de DALL-E),
Créant les images de gauche à droite et de haut en bas, à la manière d'un texte manuscrit – expliquant sa maîtrise typographique.
Autres améliorations
Meilleure compréhension des instructions complexes,
Génération d'images hyperréalistes.
Limites persistantes
Malgré ces progrès, le modèle présente encore :
Un temps de génération rallongé,
Des difficultés avec les alphabets non-latins (coréen, chinois...),
Des risques d'"hallucinations" (détails inventés).
Sécurité et cadre d'utilisation
OpenAI renforce ses garde-fous :
Filtrage des contenus violents ou inappropriés,
Marquage C2PA des images (traçabilité IA).
Cependant : ces métadonnées s'effacent facilement – certaines plateformes les suppriment automatiquement.
Disponibilité
Réservé aux abonnés Pro (200$/mois), avant un déploiement progressif aux versions gratuites et Plus.
Conclusion : un tournant créatif
Cette innovation ouvre des perspectives immenses en marketing, éducation et divertissement. OpenAI souligne qu'il ne s'agit que d'une "première étape" vers des améliorations futures.
Source : Futurism
Notez ce sujet