SDXL Turbo génère des images IA en temps réel

par Houssen Moshinaly · Publié 30 novembre 2023 · Mis à jour 29 novembre 2023

Stability AI présente son nouveau modèle d’image IA avec SDXL Turbo. Ce modèle utilise une technique de distillation qui réduit le nombre d’étapes nécessaires pour créer des images de haute qualité, passant de 50 à une seule.

Suivez-nous sur notre page Facebook et notre canal Telegram

Stability AI vient de présenter son nouveau modèle de génération d’images à partir de texte : SDXL Turbo. Ce modèle utilise une nouvelle technique de distillation qui lui permet de produire des images de haute qualité en une seule étape, au lieu de 50 étapes pour son prédécesseur SDXL 1.0.

Si vous avez apprécié cet article, soutenez-moi sur Patreon ou Buy me a coffee Vous recevrez chaque semaine du contenu exclusif et des réponses à vos questions. Merci ! 😊

La technique de distillation utilisée par SDXL Turbo s’appelle Adversarial Diffusion Distillation (ADD). Elle consiste à utiliser un grand modèle de diffusion d’images pré-entraîné comme réseau enseignant, et à lui opposer un réseau élève plus petit et plus rapide. Le réseau élève apprend ainsi à imiter le réseau enseignant en minimisant la divergence entre les distributions de probabilité des deux modèles.

Grâce à cette technique, SDXL Turbo offre plusieurs avantages par rapport aux autres modèles de génération d’images à partir de texte, tels que StyleGAN-T++, OpenMUSE, IF-XL ou LCM-XL. Il peut produire des images en une seule étape, comme les réseaux antagonistes génératifs (GANs), tout en évitant les artefacts ou le flou souvent observés avec les autres méthodes de distillation. Il peut également fournir une qualité d’image supérieure à celle de SDXL 1.0 avec seulement quatre étapes, alors que ce dernier en nécessite 50.

Stability AI a comparé SDXL Turbo avec les autres modèles en utilisant le même texte comme entrée, et en demandant à des évaluateurs humains de choisir l’image qui correspond le mieux au texte, et celle qui a la meilleure qualité. Les résultats montrent que SDXL Turbo surpasse LCM-XL avec quatre étapes en une seule étape, et SDXL 1.0 avec 50 étapes en quatre étapes.

En plus de la qualité d’image, SDXL Turbo offre également une amélioration significative de la vitesse d’inférence. Sur une carte Nvidia A100, SDXL Turbo génère une image de 512×512 pixels en seulement 207 ms (encodage du texte + une seule étape de débruitage + décodage, fp16).

Si vous souhaitez tester une démo gratuite de SDXL Turbo, vous pouvez le faire sur Clipdrop. La démo n’est pas destinée à un usage commercial. Si vous êtes intéressé par un usage commercial, vous pouvez contacter Stability AI. C’est un peu dommage qu’il ne publie pas le modèle en Open Source, car c’est ce dernier, grâce à la communauté, qui a permis de faire de Stable Diffusion, la meilleure image IA actuellement sur le marché.

Si vous avez apprécié cet article, soutenez-moi sur Patreon ou Buy me a coffee Vous recevrez chaque semaine du contenu exclusif et des réponses à vos questions. Merci ! 😊


Le Basilic de Roko	Mon parcours de rédacteur web	Science corrompue et servile	Nous, Tueurs en série

SDXL Turbo génère des images IA en temps réel

Mes livres

Laisser un commentaire Annuler la réponse

Les autres actualités dans Technologie

Rejoignez-nous sur Telegram ou Facebook