• Vendredi 4 Avril 2025 - 2:23 AM

Soutenez Bonjour

Soutien Journalisme indépendant

Accessible à tous, financé par les lecteurs

Soutenez-nous

Le nouveau générateur d'images d'OpenAI maîtrise enfin l'art du texte


Par Futurism .Publié le 2025/03/26 23:34
 Le nouveau générateur d'images d'OpenAI maîtrise enfin l'art du texte
Mars. 26, 2025
  1. 0
  2. 13

OpenAI opère une véritable révolution dans l'intelligence artificielle générative avec le déploiement de nouvelles fonctionnalités pour ChatGPT, parvenant pour la première fois à intégrer du texte dans les images avec une précision quasi parfaite.

Une avancée majeure

Ce nouveau système marque un bond en avant par rapport aux versions précédentes. Alors que ChatGPT s'appuyait auparavant sur le modèle DALL-E pour créer des images, la mise à jour introduit désormais une option "Images dans ChatGPT", propulsée par GPT-4o – le modèle phare d'OpenAI depuis près d'un an. Cette technologie sera également intégrée à Sora, l'outil de génération vidéo de l'entreprise, élargissant ainsi les horizons de la création numérique.

Fonctionnement du nouveau modèle

Gabriel Goh, responsable recherche chez OpenAI, décrit ce modèle comme un "changement radical" nécessitant "des mois d'optimisations progressives". Ses atouts clés :

    Une précision textuelle inégalée

        Les versions antérieures produisaient des textes illisibles ou truffés de fautes.

        Désormais, le système génère des textes nets et cohérents, comme le démontrent des exemples officiels : tableaux blancs annotés ou bandes dessinées parfaitement lisibles.

    Une mécanique innovante

        GPT-4o utilise une approche autoregressive (contrairement au diffusion de DALL-E),

        Créant les images de gauche à droite et de haut en bas, à la manière d'un texte manuscrit – expliquant sa maîtrise typographique.

    Autres améliorations

        Meilleure compréhension des instructions complexes,

        Génération d'images hyperréalistes.

Limites persistantes

Malgré ces progrès, le modèle présente encore :

    Un temps de génération rallongé,

    Des difficultés avec les alphabets non-latins (coréen, chinois...),

    Des risques d'"hallucinations" (détails inventés).

Sécurité et cadre d'utilisation

OpenAI renforce ses garde-fous :

    Filtrage des contenus violents ou inappropriés,

    Marquage C2PA des images (traçabilité IA).
    Cependant : ces métadonnées s'effacent facilement – certaines plateformes les suppriment automatiquement.

Disponibilité

Réservé aux abonnés Pro (200$/mois), avant un déploiement progressif aux versions gratuites et Plus.


Conclusion : un tournant créatif

Cette innovation ouvre des perspectives immenses en marketing, éducation et divertissement. OpenAI souligne qu'il ne s'agit que d'une "première étape" vers des améliorations futures.

Source : Futurism

Notez ce sujet



sport

Référendum

Les principaux obstacles auxquels sont confrontés les immigrants

  1. 75%
  2. 25%
  3. 0%

4 Votes

DESSUS