Table des matières
- 1. Avril 2026 : DALL·E discrètement retiré — un changement de génération dans l'IA d'image
- 2. Les 8 outils majeurs en un coup d'œil
- 3. Triés par point fort — où viser
- 4. Modèles tarifaires — abonnement vs facturation à l'image
- 5. Par cas d'usage — le guide de décision « choisis celui-ci »
- 6. Pièges fréquents — usage commercial, droits d'auteur, rendu de texte
- Synthèse
- FAQ
Le 21 avril 2026, OpenAI a annoncé GPT Image 2. Le 12 mai, l'icône originelle, DALL·E 2 / DALL·E 3, a été officiellement retirée. Un mois plus tôt, le 17 mars, Midjourney a lancé V8, rendant la génération 5 fois plus rapide et imposant le 2K HD par défaut. Imagen 4 Ultra de Google a atteint le niveau où les sorties sont « impossibles à distinguer de vraies photographies ». FLUX 1.1 Pro Ultra de Black Forest Labs riposte au modèle mensuel de Midjourney avec 0,04–0,06 $ par image, en paiement à l'usage.
L'enseignement : en mai 2026, plus aucune IA d'image ne domine seule. Ce n'est plus 2024, où Midjourney trônait au sommet sans rival. Ni 2023, où SDXL régnait sur le tier gratuit. On choisit désormais en fonction de ce que l'on fabrique.
Mon avis sans détour : si vous ne pouvez vous abonner qu'à un seul outil, prenez Midjourney V8 (10 $/mois). Il reste en tête pour la qualité combinée art + visuel de marque. Pour le travail commercial nécessitant du texte intégré dans l'image, choisissez Ideogram V3 ou GPT Image 2. Pour les photographies, Imagen 4 Ultra ou FLUX 1.1 Pro Ultra. Si la sécurité commerciale est la priorité absolue, Adobe Firefly. Cet article passe en revue les 8 outils majeurs en mai 2026, organisés par point fort, tarif et adéquation aux cas d'usage, avec des chiffres réels.
8 outils, 5 axes de force — plus aucun « meilleur » unique
— Photo / Texte / Art / Sécurité commerciale / Design — chacun a son roi
2024 : Midjourney seul au sommet →
2026 : éclatement en 5 camps par cas d'usage.
Le bon mouvement aujourd'hui : combiner 2–3 outils selon l'objectif, pas en choisir un seul.
1. Avril 2026 : DALL·E discrètement retiré — un changement de génération dans l'IA d'image
Le 21 avril 2026, OpenAI a lancé GPT Image 2 (en interne, ChatGPT Images 2.0). La marque « DALL·E » a été officiellement retirée le 12 mai ; la génération d'image dans ChatGPT tourne désormais sur GPT Image 2. Environ quatre ans après DALL·E 2 en 2022, l'outil même qui a fait entrer « IA de génération d'image » dans le vocabulaire courant a passé le relais à son successeur.
Ce même mois d'avril, Google a rendu Imagen 4 Ultra généralement disponible sur Vertex AI. Des évaluateurs indépendants l'ont noté comme « texture de la peau, tissage des étoffes, reflets de l'eau et atmosphère, tous rendus à un degré régulièrement difficile à distinguer de vraies photographies », lui donnant la première place du classement de photoréalisme d'Artificial Analysis. Midjourney a lancé V8 un mois plus tôt, le 17 mars, rendant la génération 5 fois plus rapide et imposant le 2K HD par défaut.
Cette période est désormais surnommée « le mois des mises à jour des trois éditeurs ». Au-delà : FLUX 1.1 Pro Ultra de Black Forest Labs débarque sur l'API à 0,04–0,06 $ par image, Recraft V3 a pris la 1ʳᵉ place de l'arène text-to-image d'Artificial Analysis pour le travail de design commercial, Ideogram V3 s'est imposé sur le travail de logos et d'affiches avec une précision de texte de 90–95 %, et Adobe Firefly Image 5 occupe son propre couloir : sécurité commerciale + intégration Photoshop/Illustrator.
Le trio version 2024 « Midjourney, DALL·E et Stable Diffusion » ne tient donc plus. 2026 s'est éclaté en 5 camps par cas d'usage.
2. Les 8 outils majeurs en un coup d'œil
D'abord, la vue d'ensemble. Huit outils majeurs en mai 2026, avec leur version actuelle, leur tarif et leur point fort principal.
| Outil | Dernière version | Tarif (le plus bas) | Point fort principal |
|---|---|---|---|
| Midjourney | V8 (mars 2026) | 10 $/mois (200 générations) | Art, stylisation |
| GPT Image 2 | Avril 2026 (successeur de DALL·E) | Inclus avec ChatGPT Plus 20 $/mois | Précision texte 99 %, modèle de raisonnement |
| FLUX 1.1 Pro Ultra | 2026 (mises à jour continues) | 0,04–0,06 $/image (API) | Rapport qualité photo/prix, vitesse |
| Google Imagen 4 | 4 Ultra (avril 2026) | 0,02–0,06 $/image (Vertex AI) | Qualité photo de premier plan |
| Recraft V3 | V3 (continu depuis 2024) | 0,04 $/image (raster) | Sortie vectorielle, design systems |
| Ideogram | V3 (2026) | À partir de 7 $/mois | Rendu de texte dans l'image |
| Adobe Firefly | Image 5 (2026) | 9,99 $/mois (Standard) | Sécurité commerciale, intégration Adobe |
| Stable Diffusion | 3.5 / Cascade | Gratuit (votre propre GPU) | Poids ouverts, personnalisable |
Le tableau seul ne décidera pas pour vous. Vous devez d'abord mettre votre objectif en mots ; sinon aucune ligne de ce tableau ne paraîtra « la bonne ». La section suivante organise les 8 outils par axe de force.
3. Triés par point fort — où viser
Mêmes 8 outils, cette fois regroupés en 5 camps selon ce qu'ils font de mieux. C'est la carte de bataille pratique pour 2026.
Matrice de sélection par point fort
N'essayez pas de tout faire avec un seul outil. Abonnez-vous à 2–3 selon le cas d'usage — c'est la réponse 2026.
Le coût total tourne autour de 20–40 $/mois, facilement amorti par un seul projet.
Zoom : les rois du photoréalisme — Imagen 4 et FLUX
Google Imagen 4 Ultra, sorti en avril 2026, occupe la première place du benchmark de photoréalisme d'Artificial Analysis. La génération en 3–6 secondes en fait le plus rapide du tier premium, à 0,06 $/image via Vertex AI. Il produit des sorties de premier ordre pour le remplacement produit, les portraits et la photo culinaire.
De l'autre côté, FLUX 1.1 Pro Ultra (Black Forest Labs) coûte 0,04–0,06 $/image avec un photoréalisme comparable. Aucun abonnement mensuel requis — pur paiement à l'usage via API ; pour les cas « moins de 100 images par mois », FLUX revient nettement moins cher. Disponible via Replicate, fal.ai, Together, Freepik et autres grands hubs API.
Rendu de texte : le duopole Ideogram + GPT Image 2
Jusqu'en 2024, « mettre du texte dans une image » était la plus grande faiblesse de l'IA d'image. Midjourney V7 plafonnait à 30–40 % de précision texte — inutilisable pour des logos ou des affiches.
Ideogram V3 a changé la donne, atteignant 90–95 % de précision texte et prenant en charge raisonnablement les langues non anglophones. Puis GPT Image 2 en avril 2026 a poussé jusqu'à 99 %, avec un rendu natif en japonais, coréen, chinois, hindi, bengali, arabe et plus encore. Miniatures sociales, bannières publicitaires, infographies — ces deux-là règnent désormais sur ce terrain.
4. Modèles tarifaires — abonnement vs facturation à l'image
Après le point fort, le modèle tarifaire est la grande décision suivante. Les outils se partagent nettement entre forfait mensuel et facturation à l'image. Selon le volume, la facture mensuelle peut varier d'un facteur 10.
| Type de facturation | Outils représentatifs | Convient à |
|---|---|---|
| Forfait mensuel (illimité) | Midjourney Standard 30 $, Adobe Firefly Pro 19,99 $ | Utilisateurs quotidiens ; ceux qui veulent itérer sans compter |
| Forfait mensuel (à crédits) | Midjourney Basic 10 $ (200 images), Ideogram 7 $ | Utilisateurs légers, dans la plage 100–200 images/mois |
| À l'image (API) | FLUX dès 0,04 $, Imagen 4 0,02–0,06 $, Recraft 0,04 $, GPT Image 2 à base de tokens | Intégration applicative ; pics de volume irréguliers mais élevés |
| Gratuit (votre propre GPU) | Stable Diffusion 3.5 / Cascade | Compétence en déploiement local ; données qui ne peuvent pas sortir du réseau |
Calcul concret. Un particulier qui génère 100 images/mois :
- Midjourney Basic : 10 $/mois (quota de 200 images, marge confortable)
- FLUX 1.1 Pro Ultra : 0,05 $ × 100 = 5 $/mois
- Imagen 4 Standard : 0,04 $ × 100 = 4 $/mois
- Adobe Firefly Standard : 9,99 $/mois (quota de 2 000 crédits)
À 100/mois, le paiement à l'usage via API gagne. Au-delà de 500/mois, le forfait Midjourney écrase tout. Calculer « à partir de quel volume mensuel le forfait illimité devient rentable » est la culture tarifaire 2026 dont vous avez besoin.
5. Par cas d'usage — le guide de décision « choisis celui-ci »
Vous avez les points forts et les tarifs. Alors lequel correspond à votre travail ? Six schémas courants, avec des réponses directes.
Guide de décision « choisis celui-ci »
Ma meilleure pratique personnelle : Midjourney Basic + GPT Image 2 (inclus avec ChatGPT Plus), soit 30 $/mois au total.
Cela couvre ~80 % des besoins quotidiens. Les API uniquement pour les commandes commerciales ponctuelles nécessitant du texte ou des photos.
6. Pièges fréquents — usage commercial, droits d'auteur, rendu de texte
Vous avez choisi par point fort et par tarif. Trois pièges qui n'apparaissent qu'une fois l'outil en main :
Piège ① : les conditions d'usage commercial varient selon l'outil
« Image IA = libre pour usage commercial » est faux. Les conditions varient selon le plan. Midjourney exige le plan Pro ou supérieur pour le mode discret (afin que vos générations ne soient pas publiques). Adobe Firefly se vend sur la sécurité commerciale, mais Stable Diffusion dépend du modèle — les modèles de base sont OK pour le commercial tandis que certains LoRA spécifiques peuvent être interdits. Lisez la clause d'usage commercial avant de souscrire — c'est la règle d'or.
Piège ② : l'intensité du risque sur le droit d'auteur varie
Midjourney et OpenAI sont défendeurs dans des procès pour droits d'auteur déposés en 2024–2025. Le litige porte sur la présence d'œuvres protégées dans leurs jeux d'entraînement. Les jugements ne sont pas encore tombés, mais pour le travail d'entreprise, sachez qu'Adobe Firefly est le seul des grands à divulguer ses données d'entraînement. C'est précisément pour cela que les agences de pub et les éditeurs partent par défaut sur Firefly.
Piège ③ : « du texte dans l'image » n'a rien à voir entre l'anglais et le japonais
La fameuse « précision de 90–95 % » d'Ideogram V3 vaut surtout pour les caractères anglais/numériques. Pour le japonais, le chinois, l'arabe et autres écritures complexes, la précision chute fortement. Pour du japonais fiable dans l'image, GPT Image 2 est aujourd'hui le seul choix. Le travail multilingue de logos et d'affiches restreint vite le terrain.
Synthèse
Récapitulatif :
- Avril 2026 : DALL·E retiré ; GPT Image 2 prend la suite. Avec Midjourney V8, Imagen 4 Ultra et FLUX 1.1 Pro Ultra mis à jour eux aussi, cette période est devenue « le mois des mises à jour des trois éditeurs ».
- Les 8 outils majeurs se répartissent en 5 camps de force — photo / texte / art / sécurité commerciale / design system.
- Les tarifs se partagent entre forfait mensuel et facturation à l'image ; le seuil de bascule se situe autour de 100 images/mois pour les particuliers.
- Pour les particuliers, le tandem Midjourney Basic + GPT Image 2 (inclus avec ChatGPT Plus), 30 $/mois au total, couvre ~80 % des besoins quotidiens.
- Pour le travail commercial, Adobe Firefly reste unique grâce à sa position de données d'entraînement déclarées.
La question 2026 sur l'IA d'image n'est plus « quel est le meilleur ? » mais « lequel correspond à mon cas d'usage ? » Ne courez pas après le tout-en-un. Combinez 2–3 outils selon l'objectif — c'est la bonne réponse pour un marché qui s'est éclaté en 5 camps.
FAQ
Si vous payez déjà ChatGPT Plus, GPT Image 2 est gratuit à utiliser. Sinon, Midjourney Basic (10 $/mois). L'un ou l'autre vous donne le ressenti central de l'IA d'image dès le premier mois.
Stable Diffusion 3.5 si vous pouvez le faire tourner localement — gratuit. Nécessite une RTX 3060 ou mieux et un environnement Python. Pour des options gratuites hébergées dans le cloud, voir le guide des outils IA gratuits.
Adobe Firefly est actuellement le plus sûr. Données d'entraînement limitées aux images sous licence Adobe Stock. Pour le travail d'IA d'image en pub / édition / entreprise, commencez par évaluer Firefly. Midjourney et OpenAI sont OK pour le commercial mais font face à des poursuites en cours sur le droit d'auteur — les équipes d'entreprise pèseront ce risque au cas par cas.
Les conventions varient selon l'outil. Midjourney préfère « sujet, style, ambiance, composition » séparés par des virgules. GPT Image 2 / Imagen 4 fonctionnent mieux avec des descriptions longues, spécifiques, en langage naturel. Stable Diffusion exploite bien les prompts négatifs (ce qu'il faut exclure). Voir aussi les conseils généraux de prompt.
Cet article ne couvre que les outils d'image fixe. La génération vidéo suit une voie distincte — Sora 2 / Runway Gen-4 / Pika 2 / Kling 2 / Adobe Firefly Video sont les principaux noms. Adobe Firefly est singulier en faisant les deux. La vidéo évolue encore plus vite que l'IA d'image fixe ; attendez-vous à un paysage qui se redessine sur un cycle de six mois.