Midjourney v5 : du réalisme et des mains parfaites


  • FrançaisFrançais

  • Midjourney v5 est disponible. Il utilise une architecture neuronale modifiée pour produire des images plus proches de la réalité. Nous comparons la v4 et la v5 et vous expliquons comment bien l’utiliser.


    Suivez-nous sur notre page Facebook et notre canal Telegram

    Midjourney v5 est disponible. Il utilise une architecture neuronale modifiée pour produire des images plus proches de la réalité. Nous comparons la v4 et la v5 et vous expliquons comment bien l'utiliser.

    Midjourney v5 est maintenant disponible. Le nouveau modèle peut générer des images beaucoup plus réalistes et détaillées, mais il nécessite également des instructions plus précises (prompts). Le nouveau modèle a été entraîné sur un “supercluster IA” dans le Google Cloud et a été en développement pendant environ cinq mois, selon Midjourney.

    Si vous avez apprécié cet article, soutenez-moi sur Patreon ou Buy me a coffee Vous recevrez chaque semaine du contenu exclusif et des réponses à vos questions. Merci ! 😊

    Il utilise une architecture neuronale significativement modifiée et de nouvelles techniques esthétiques. En particulier, le modèle peut produire des images plus réalistes et plus de détails qui sont plus susceptibles d’être corrects. Cela peut être vu dans les tests de comparaison : les mêmes instructions sans un style d’image explicite ont donné lieu à des images significativement plus réalistes avec plus de détails.

    Les portraits de personnes célèbres ont également l’air plus réalistes et ont moins d’erreurs d’image. Même si les IA, pour des raisons de protection juridique, seront toujours moins performantes pour les célébrités. Cela dépend des stars en question et de leur disponibilité picturale dans le domaine public.

    En plus du photoréalisme, Midjourney v5 apporte beaucoup d’améliorations au niveau des mains. Si autrefois, l’IA rêvait des mains humaines comme des monstres qui auraient mis les leurs dans un mixer, Midjourney version 5 est proche de la perfection dans la plupart des cas.

    Midjourney v5 comme “mode professionnel” pour des motifs plus réalistes

    Le fondateur de Midjourney David Holz qualifie V5 de “mode professionnel” car, contrairement à ses prédécesseurs, il est moins limité à des styles artistiques spécifiques et offre une plus grande variété de résultats d’image. En d’autres termes, il offre plus de latitude créative, mais cette latitude doit être maîtrisée. Selon Holz, cela peut nécessiter des instructions plus longues qui décrivent plus explicitement les détails dans l’image, comme l’éclairage et l’ambiance, pour obtenir le résultat souhaité.

    Le modèle actuel de V5 est encore une version alpha qui subira des “changements significatifs” avant la sortie finale, selon Holz. La version finale aura comme les modèles précédents un style par défaut plus adapté aux débutants. Les créatifs ne doivent donc pas compter sur le style actuel du V5 pour les travaux ultérieurs.

    Pour faire fonctionner V5 , vous devez changer Midjourney en “MJ V5” dans les paramètres Discord ou ajouter le paramètre “–v 5” à l’instruction. Notons que Midjourney accélère ses mises à jour pour rester au niveau de Stable Diffusion. Car pendant le live de présentation, les responsables ont laissé entendre que Midjourney v6 sera disponible dans les 2 prochains mois.

    Midjourney v5 VS Stable Diffusion

    Moi qui suis partisan de l’Open Source et que je connais la puissance actuelle de Stable Diffusion, je regarde ce Midjourney v5 avec un certain sourire. On peut avoir des images qui claquent du premier coup, mais d’une part, c’est payant et la version 5 ne sera pas disponible pour l’essai gratuit de la plateforme.

    En revanche, Stable Diffusion offre des possibilités illimitées grâce à ControlNet, pour le réalisme, on a plein de modèles disponibles gratuitement pour avoir le résultat le plus photoréaliste possible. Et pour les mains, vous avez des extensions qui sont disponibles qui nous permettent de corriger les mains dans un traitement a posteriori. Ci-dessous, la même prompt dans Midjourney V5 comparé à Stable Diffusion avec des modèles différents. La prompt était “Le PDG d’Apple Tim Cook portant un casque VR fermé avec un devant opaque et le logo Apple dessus, art numérique” (la prompt était en anglais bien sûr).

    Midjourney v5 est disponible. Il utilise une architecture neuronale modifiée pour produire des images plus proches de la réalité. Nous comparons la v4 et la v5 et vous expliquons comment bien l'utiliser.

    Midjourney v5

    Midjourney v5 est disponible. Il utilise une architecture neuronale modifiée pour produire des images plus proches de la réalité. Nous comparons la v4 et la v5 et vous expliquons comment bien l'utiliser.

    Stable Diffusion avec le modèle Deliberate 1.1

    Midjourney v5 est disponible. Il utilise une architecture neuronale modifiée pour produire des images plus proches de la réalité. Nous comparons la v4 et la v5 et vous expliquons comment bien l'utiliser.

    Stable Diffusion disponible avec le modèle Leonardo Diffusion (modèle non public, mais disponible sur Leonardo AI)

    Midjourney v5 est disponible. Il utilise une architecture neuronale modifiée pour produire des images plus proches de la réalité. Nous comparons la v4 et la v5 et vous expliquons comment bien l'utiliser.

    Stable Diffusion avec le modèle RPG 4.0

    En fait, si Stable Diffusion continue de parier sur l’Open Source, on aura la même guerre éternelle qu’on a eu entre Windows ou Linux ou Mac ou Linux. Midjourney ressemble à Apple, le produit est lisse, parfait et il fonctionne sans effort. Stable Diffusion est comme Linux, il faut batailler, rager, mais cela reste gratuit (sauf le prix d’entrée d’avoir un PC haut de gamme) et les possibilités sont infinies.

    Et je suis prêt à parier que sur le long terme, c’est l’Open Source qui va gagner.

    Si vous avez apprécié cet article, soutenez-moi sur Patreon ou Buy me a coffee Vous recevrez chaque semaine du contenu exclusif et des réponses à vos questions. Merci ! 😊

    Houssen Moshinaly

    Rédacteur en chef d'Actualité Houssenia Writing. Rédacteur web depuis 2009.

    Blogueur et essayiste, j'ai écrit 9 livres sur différents sujets comme la corruption en science, les singularités technologiques ou encore des fictions. Je propose aujourd'hui des analyses politiques et géopolitiques sur le nouveau monde qui arrive. J'ai une formation de rédaction web et une longue carrière de prolétaire.

    Pour me contacter personnellement :

    Laisser un commentaire

    Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *