Am 21. April 2026 kündigte OpenAI GPT Image 2 an. Am 12. Mai wurde die ursprüngliche Ikone, DALL·E 2 / DALL·E 3, offiziell eingestellt. Einen Monat zuvor, am 17. März, lieferte Midjourney V8 aus — Generierung 5x schneller, 2K HD als Standard. Googles Imagen 4 Ultra erreichte das Niveau, auf dem Ergebnisse „nicht von echten Fotos zu unterscheiden" sind. FLUX 1.1 Pro Ultra von Black Forest Labs kontert Midjourneys Monatsmodell mit 0,04–0,06 USD pro Bild im Pay-as-you-go-Modus.

Die Quintessenz: Bis Mai 2026 dominiert keine einzelne Bild-KI mehr. Das ist nicht 2024, als Midjourney allein an der Spitze stand. Es ist nicht 2023, als SDXL die Free-Tier beherrschte. Heute wählt man nach dem, was man erstellen will.

Lassen Sie mich meine Position vorausschicken: Wenn Sie nur ein Tool abonnieren können, nehmen Sie Midjourney V8 (10 USD/Monat). Es führt nach wie vor in der kombinierten Qualität von Kunst und Markenvisuals. Für kommerzielle Arbeit, die Text im Bild benötigt, nehmen Sie Ideogram V3 oder GPT Image 2. Für Fotos Imagen 4 Ultra oder FLUX 1.1 Pro Ultra. Wenn kommerzielle Sicherheit oberste Priorität hat, Adobe Firefly. Dieser Artikel führt Sie durch die 8 wichtigsten Tools mit Stand Mai 2026, geordnet nach Stärke, Preis und Eignung pro Anwendungsfall — mit echten Zahlen.

BILD-KI · MAI 2026

8 Tools, 5 Stärke-Achsen — kein einzelnes „Bestes" mehr

— Foto / Text / Kunst / kommerziell sicher / Design — jede Kategorie hat ihren eigenen König

FOTO
Imagen 4 Ultra
FLUX 1.1 Pro
TEXT
Ideogram V3
GPT Image 2
KUNST
Midjourney V8
Stable Diffusion
SICHER
Adobe Firefly
Offene Daten
DESIGN
Recraft V3
Vektor-Output

2024: Midjourney allein an der Spitze → 2026: aufgeteilt in 5 Anwendungs-Lager.
Der richtige Schritt heute ist die Kombination von 2–3 Tools nach Zweck — nicht die Wahl eines einzigen.

1. April 2026: DALL·E still in den Ruhestand — ein Generationswechsel bei Bild-KI

Am 21. April 2026 brachte OpenAI GPT Image 2 auf den Markt (intern: ChatGPT Images 2.0). Die Marke „DALL·E" wurde am 12. Mai offiziell eingestellt; die Bildgenerierung in ChatGPT läuft jetzt über GPT Image 2. Etwa vier Jahre nach DALL·E 2 im Jahr 2022 hat genau das Werkzeug, das „Bildgenerierungs-KI" überhaupt erst in den Mainstream-Wortschatz brachte, an seinen Nachfolger übergeben.

Im selben April machte Google Imagen 4 Ultra auf Vertex AI allgemein verfügbar. Unabhängige Tester bescheinigten ihm: „Hauttexturen, Stoffwebung, Wasserspiegelungen und Atmosphäre werden so wiedergegeben, dass sie sich konsistent kaum von echten Fotografien unterscheiden lassen" — und gaben ihm den ersten Platz auf der Photorealismus-Bestenliste von Artificial Analysis. Midjourney veröffentlichte V8 einen Monat zuvor am 17. März und machte die Generierung 5x schneller bei 2K HD als Standard.

Diese Phase wird inzwischen als „der Drei-Anbieter-Update-Monat" bezeichnet. Darüber hinaus: FLUX 1.1 Pro Ultra von Black Forest Labs trifft die API mit 0,04–0,06 USD pro Bild, Recraft V3 sicherte sich Platz 1 in der Text-zu-Bild-Arena von Artificial Analysis für kommerzielle Designarbeit, Ideogram V3 hat sich in Logo- und Posterarbeiten mit 90–95 % Textgenauigkeit etabliert, und Adobe Firefly Image 5 besetzt seine eigene Spur aus kommerzieller Sicherheit + Photoshop-/Illustrator-Integration.

Das Trio von 2024 — „Midjourney, DALL·E und Stable Diffusion" — passt also nicht mehr. 2026 hat sich in 5 Anwendungs-Lager aufgespalten.

2. Die 8 wichtigsten Tools im Überblick

Zunächst der Überblick aus der Vogelperspektive. Acht Haupt-Tools mit Stand Mai 2026, mit aktuellen Versionen, Preisen und Kernstärken.

ToolAktuelle VersionPreis (Einstieg)Kernstärke
MidjourneyV8 (März 2026)10 USD/Mon. (200 Generierungen)Kunst, Stilisierung
GPT Image 2April 2026 (DALL·E-Nachfolger)Im ChatGPT Plus für 20 USD/Mon. enthalten99 % Textgenauigkeit, Reasoning-Modell
FLUX 1.1 Pro Ultra2026 (laufend aktualisiert)0,04–0,06 USD/Bild (API)Foto-Realismus, Kosteneffizienz, Geschwindigkeit
Google Imagen 44 Ultra (April 2026)0,02–0,06 USD/Bild (Vertex AI)Spitzen-Fotoqualität
Recraft V3V3 (kontinuierlich seit 2024)0,04 USD/Bild (Raster)Vektor-Output, Designsysteme
IdeogramV3 (2026)Ab 7 USD/Mon.Textwiedergabe im Bild
Adobe FireflyImage 5 (2026)9,99 USD/Mon. (Standard)Kommerzielle Sicherheit, Adobe-Integration
Stable Diffusion3.5 / CascadeKostenlos (eigene GPU)Open-Weight, anpassbar

Die Tabelle allein wird die Entscheidung nicht für Sie treffen. Sie müssen zuerst Ihr eigenes Ziel in Worte fassen — sonst sieht keine Zeile dieser Tabelle „richtig" aus. Der nächste Abschnitt ordnet die 8 Tools nach Stärke-Achse.

3. Sortiert nach Stärke — wo man hinzielen sollte

Dieselben 8 Tools, diesmal neu gruppiert in 5 Lager nach Kernstärke. Das ist die praktische Schlachtkarte für 2026.

5 Lager × 8 Tools

Auswahlmatrix nach Stärke

① FOTOREALISMUS
Imagen 4 Ultra / FLUX 1.1 Pro Ultra
Produktfotos, Personen, Landschaften, Food. Nicht von echten Aufnahmen zu unterscheiden. Imagen läuft in 3–6 Sekunden — am schnellsten in der Premium-Klasse.
② TYPOGRAFIE IM BILD
Ideogram V3 / GPT Image 2
Logos, Poster, Social-Thumbnails, Infografiken. Ideogram 90–95 % Genauigkeit; GPT Image 2 99 % (mit mehrsprachiger Unterstützung).
③ KÜNSTLERISCHE STILISIERUNG
Midjourney V8 / Stable Diffusion
Illustrationen, Concept Art, stimmungsbetonte Arbeiten. Midjourney deckt Bandbreite und Konsistenz ab; SD gewinnt bei Feintuning-Freiheit.
④ KOMMERZIELL SICHER
Adobe Firefly Image 5
Ausschließlich auf lizenzierten Adobe-Stock-Bildern trainiert. Die einzige realistische Option für Werbe-, Verlags- und Unternehmensarbeit, bei der IP-Risiko zählt.
⑤ VEKTOR / DESIGNSYSTEME
Recraft V3
SVG-Output, markenstilistische Konsistenz, Icon-Produktion in großem Maßstab. Hielt Platz 1 in der Text-zu-Bild-ELO-Bestenliste von Artificial Analysis.

Versuchen Sie nicht, alles mit einem Tool zu machen. Abonnieren Sie 2–3 nach Anwendungsfall — das ist die Antwort für 2026.
Die Gesamtkosten landen bei ca. 20–40 USD/Monat und sind über ein einziges Projekt leicht wieder hereingeholt.

Genauer Blick: die Fotorealismus-Könige — Imagen 4 und FLUX

Google Imagen 4 Ultra, veröffentlicht im April 2026, hält den Spitzenplatz im Fotorealismus-Benchmark von Artificial Analysis. Generierung in 3–6 Sekunden — am schnellsten in der Premium-Klasse, zum Preis von 0,06 USD/Bild über Vertex AI. Es liefert erstklassige Ergebnisse für Produkt-Replacements, Porträts und Food-Fotografie.

Auf der anderen Seite kostet FLUX 1.1 Pro Ultra (Black Forest Labs) 0,04–0,06 USD/Bild bei vergleichbarem Fotorealismus. Kein Monatsabo nötig — reines Pay-as-you-go via API, sodass FLUX bei „weniger als 100 Bildern pro Monat" deutlich günstiger ist. Verfügbar über Replicate, fal.ai, Together, Freepik und andere große API-Hubs.

Textwiedergabe: das Duopol Ideogram + GPT Image 2

Bis 2024 war „Text in Bilder einsetzen" die größte Schwäche von Bild-KI. Midjourney V7 erreichte bestenfalls 30–40 % Textgenauigkeit — unbrauchbar für Logos oder Poster.

Ideogram V3 hat das geändert: 90–95 % Textgenauigkeit und einigermaßen brauchbare Unterstützung für nicht-englischen Text. Dann hob GPT Image 2 im April 2026 das Niveau auf 99 %, mit nativer Wiedergabe von Japanisch, Koreanisch, Chinesisch, Hindi, Bengalisch, Arabisch und mehr. Social-Thumbnails, Werbebanner, Infografiken — diesen Bereich besitzen jetzt diese beiden.

4. Preismodelle — Abo vs. Pay-per-Image

Nach der Stärke ist die Preisstruktur die nächste große Entscheidung. Die Tools teilen sich klar in monatliche Pauschale und Pay-per-Image. Je nach Volumen können die Monatskosten um den Faktor 10 schwanken.

AbrechnungstypRepräsentative ToolsAm besten für
Monatspauschale (unbegrenzt)Midjourney Standard 30 USD, Adobe Firefly Pro 19,99 USDTagesnutzer; wer iterieren will, ohne zu zählen
Monatspauschale (Credit-basiert)Midjourney Basic 10 USD (200 Bilder), Ideogram 7 USDLight-User im Bereich 100–200 Bilder/Monat
Pay-per-Image (API)FLUX ab 0,04 USD, Imagen 4 0,02–0,06 USD, Recraft 0,04 USD, GPT Image 2 token-basiertApp-Integration; unregelmäßige, aber volumenstarke Schübe
Kostenlos (eigene GPU)Stable Diffusion 3.5 / CascadeLokale Bereitstellung; Daten, die das eigene Netzwerk nicht verlassen dürfen

Konkrete Rechnung. Eine Einzelperson, die 100 Bilder/Monat erzeugt:

  • Midjourney Basic: 10 USD/Monat (200-Bild-Kontingent, komfortabler Spielraum)
  • FLUX 1.1 Pro Ultra: 0,05 USD × 100 = 5 USD/Monat
  • Imagen 4 Standard: 0,04 USD × 100 = 4 USD/Monat
  • Adobe Firefly Standard: 9,99 USD/Monat (2.000-Credit-Kontingent)

Bei 100/Monat gewinnt API-Pay-as-you-go. Ab 500/Monat schlägt Midjourneys Pauschalplan alles. Auszurechnen, „ab welchem Monatsvolumen sich der Unlimited-Tarif lohnt", ist die Preis-Literacy, die man 2026 braucht.

Hinweis: GPT Image 2 ist im ChatGPT Plus (20 USD/Monat) enthalten. Wer ohnehin für ChatGPT zahlt, bekommt es ohne Aufpreis. Das ist möglicherweise die versteckte beste Preis-Leistung 2026.

5. Nach Anwendungsfall — die „Nimm dieses"-Entscheidungshilfe

Sie haben die Stärken und die Preise. Welches passt nun zu Ihrer Aufgabe? Sechs typische Muster, mit direkten Antworten.

Anwendungsfall × Empfehlung × 6

„Nimm dieses"-Entscheidungshilfe

① BLOG- / SOCIAL-ILLUSTRATIONEN
→ Midjourney V8 Basic (10 USD/Mon.)
200-Bild-Kontingent pro Monat reicht reichlich. Künstlerische und markenbezogene Konsistenz lässt sich gut halten. Für textlastige Thumbnails mit GPT Image 2 kombinieren.
② LOGOS / POSTER / BANNER
→ Ideogram V3 (7 USD/Mon.) oder GPT Image 2
Textgenauigkeit entscheidet. Ideogram 90–95 %, GPT Image 2 99 %. Für nicht-lateinische Schriften (Japanisch, Arabisch usw.) nur GPT Image 2.
③ E-COMMERCE-PRODUKTFOTOS
→ Imagen 4 Ultra oder FLUX 1.1 Pro Ultra
Fotorealismus-Fokus. Materialtexturen bleiben erhalten. FLUX als Pay-as-you-go für hunderte Bilder/Monat; Imagen über Vertex AI im Volumen-Tarif, sobald 1.000+/Monat überschritten werden.
④ WERBUNG / VERLAG / UNTERNEHMEN
→ Adobe Firefly Image 5 (ab 9,99 USD/Mon.)
Ausschließlich auf ordnungsgemäß lizenzierten Adobe-Stock-Bildern trainiert. Risiko von Urheberrechtsklagen praktisch null. Photoshop-/Illustrator-Integration ist ebenfalls ein großer Vorteil.
⑤ ICONS / SVG / SERIENDESIGN
→ Recraft V3 (0,04–0,08 USD/Bild)
Eines der wenigen KI-Modelle, die Vektoren ausgeben. Unersetzlich für App-Icon-Sets und für die Produktion markenrichtlinien-konformer Assets.
⑥ VERTRAULICHE / INTERNE DATEN
→ Stable Diffusion 3.5 (eigene GPU)
Die einzige Antwort, wenn Bilder das eigene Netzwerk nicht verlassen dürfen. Hardware der Klasse RTX 4090 läuft mit brauchbarer Geschwindigkeit. LoRA ermöglicht markenstilistisches Feintuning.

Meine persönliche Best Practice: Midjourney Basic + GPT Image 2 (im ChatGPT Plus enthalten), zusammen 30 USD/Monat.
Damit sind ca. 80 % des Tagesbedarfs abgedeckt. APIs nur für einmalige kommerzielle Aufträge, die Text oder Fotos brauchen.

6. Typische Stolperfallen — kommerzielle Nutzung, Urheberrecht, Textwiedergabe

Sie haben nach Stärke und Preis ausgewählt. Drei Fallen, die erst nach dem Start zutage treten:

Falle ①: Nutzungsbedingungen für kommerzielle Verwendung variieren je Tool

„KI-Bild = frei für kommerzielle Nutzung" stimmt nicht. Die Bedingungen variieren je Plan. Midjourney verlangt mindestens den Pro-Plan für den Stealth-Modus (damit Ihre Generierungen nicht öffentlich sind). Adobe Firefly bewirbt sich mit kommerzieller Sicherheit, aber bei Stable Diffusion hängt es vom Modell ab — Basismodelle sind kommerziell OK, bestimmte LoRAs können jedoch ausgeschlossen sein. Lesen Sie die Klausel zur kommerziellen Nutzung vor der Anmeldung — das ist die eiserne Regel.

Falle ②: Das Urheberrechtsrisiko ist unterschiedlich stark

Midjourney und OpenAI sind Beklagte in Urheberrechtsklagen aus den Jahren 2024–2025. Strittig ist, ob urheberrechtlich geschützte Werke in ihre Trainingsdaten gelangt sind. Urteile stehen noch aus, doch für Unternehmensarbeit sollten Sie wissen: Adobe Firefly ist der einzige große Anbieter, der seine Trainingsdaten offenlegt. Genau deshalb greifen Werbeagenturen und Verlage standardmäßig zu Firefly.

Falle ③: „Text im Bild" ist bei Englisch vs. Japanisch wie Tag und Nacht

Die viel gepriesene „90–95 % Genauigkeit" von Ideogram V3 gilt vor allem für englische und numerische Zeichen. Bei Japanisch, Chinesisch, Arabisch und anderen komplexen Schriften fällt die Genauigkeit deutlich. Für zuverlässigen japanischen Text im Bild ist GPT Image 2 derzeit die einzige Wahl. Mehrsprachige Logo- und Posterarbeit grenzt die Auswahl schnell ein.

Fazit

Zusammenfassung:

  • April 2026: DALL·E in Rente; GPT Image 2 übernimmt. Mit Updates von Midjourney V8, Imagen 4 Ultra und FLUX 1.1 Pro Ultra wurde dieser Zeitraum zum „Drei-Anbieter-Update-Monat".
  • Die 8 Haupt-Tools teilen sich in 5 Stärke-Lager auf — Foto / Text / Kunst / kommerziell sicher / Designsystem.
  • Die Preise teilen sich in monatliche Pauschale und Pay-per-Image; der Break-even liegt bei Einzelpersonen um 100 Bilder/Monat.
  • Für Einzelpersonen deckt die Kombination Midjourney Basic + GPT Image 2 (im ChatGPT Plus enthalten), zusammen 30 USD/Monat, ca. 80 % des Tagesbedarfs ab.
  • Für kommerzielle Arbeit bleibt Adobe Firefly mit seiner Position offengelegter Trainingsdaten einzigartig stark.

Die Bild-KI-Frage 2026 lautet nicht mehr „welches ist das beste?", sondern „welches passt zu meinem Anwendungsfall?". Jagen Sie nicht der eierlegenden Wollmilchsau hinterher. Kombinieren Sie 2–3 Tools nach Zweck — das ist die richtige Antwort für einen Markt, der sich in 5 Lager aufgespalten hat.

FAQ

Q1. Womit sollte ich anfangen?

Wenn Sie bereits für ChatGPT Plus zahlen, ist GPT Image 2 kostenlos nutzbar. Falls nicht, Midjourney Basic (10 USD/Monat). Beides bringt Ihnen im ersten Monat das Kerngefühl von Bild-KI näher.

Q2. Gibt es komplett kostenlose Optionen?

Stable Diffusion 3.5, wenn Sie es lokal betreiben können — kostenlos. Erfordert eine RTX 3060 oder besser und eine Python-Umgebung. Für cloudgehostete kostenlose Optionen siehe Leitfaden zu kostenlosen KI-Tools.

Q3. Was ist am sichersten für die kommerzielle Nutzung?

Adobe Firefly ist derzeit am sichersten. Trainingsdaten sind auf lizenzierte Adobe-Stock-Bilder beschränkt. Bei KI-Bildarbeit für Werbung / Verlag / Unternehmen sollte zuerst Firefly geprüft werden. Midjourney und OpenAI sind kommerziell zugelassen, haben aber laufende Urheberrechtsklagen — Unternehmensteams werden dieses Risiko individuell abwägen.

Q4. Was ist mit Tipps zum Prompting?

Konventionen variieren je Tool. Midjourney bevorzugt „Subjekt, Stil, Stimmung, Komposition" durch Kommas getrennt. GPT Image 2 / Imagen 4 funktionieren besser mit natürlich-sprachlichen, langen, spezifischen Beschreibungen. Stable Diffusion nutzt Negative Prompts (was ausgeschlossen werden soll) gut. Siehe auch allgemeine Prompt-Tipps.

Q5. Wie unterscheidet sich Video-Generierungs-KI?

Dieser Artikel behandelt nur Tools für Standbilder. Video-Generierung läuft auf einem eigenen Gleis — Sora 2 / Runway Gen-4 / Pika 2 / Kling 2 / Adobe Firefly Video sind die wichtigsten Namen. Adobe Firefly ist insofern ungewöhnlich, als es beides macht. Video entwickelt sich noch schneller als Standbild-KI; rechnen Sie mit einer Marktverschiebung im Sechsmonatsrhythmus.