Inhaltsverzeichnis
- 1. April 2026: DALL·E still in den Ruhestand — ein Generationswechsel bei Bild-KI
- 2. Die 8 wichtigsten Tools im Überblick
- 3. Sortiert nach Stärke — wo man hinzielen sollte
- 4. Preismodelle — Abo vs. Pay-per-Image
- 5. Nach Anwendungsfall — die „Nimm dieses"-Entscheidungshilfe
- 6. Typische Stolperfallen — kommerzielle Nutzung, Urheberrecht, Textwiedergabe
- Fazit
- FAQ
Am 21. April 2026 kündigte OpenAI GPT Image 2 an. Am 12. Mai wurde die ursprüngliche Ikone, DALL·E 2 / DALL·E 3, offiziell eingestellt. Einen Monat zuvor, am 17. März, lieferte Midjourney V8 aus — Generierung 5x schneller, 2K HD als Standard. Googles Imagen 4 Ultra erreichte das Niveau, auf dem Ergebnisse „nicht von echten Fotos zu unterscheiden" sind. FLUX 1.1 Pro Ultra von Black Forest Labs kontert Midjourneys Monatsmodell mit 0,04–0,06 USD pro Bild im Pay-as-you-go-Modus.
Die Quintessenz: Bis Mai 2026 dominiert keine einzelne Bild-KI mehr. Das ist nicht 2024, als Midjourney allein an der Spitze stand. Es ist nicht 2023, als SDXL die Free-Tier beherrschte. Heute wählt man nach dem, was man erstellen will.
Lassen Sie mich meine Position vorausschicken: Wenn Sie nur ein Tool abonnieren können, nehmen Sie Midjourney V8 (10 USD/Monat). Es führt nach wie vor in der kombinierten Qualität von Kunst und Markenvisuals. Für kommerzielle Arbeit, die Text im Bild benötigt, nehmen Sie Ideogram V3 oder GPT Image 2. Für Fotos Imagen 4 Ultra oder FLUX 1.1 Pro Ultra. Wenn kommerzielle Sicherheit oberste Priorität hat, Adobe Firefly. Dieser Artikel führt Sie durch die 8 wichtigsten Tools mit Stand Mai 2026, geordnet nach Stärke, Preis und Eignung pro Anwendungsfall — mit echten Zahlen.
8 Tools, 5 Stärke-Achsen — kein einzelnes „Bestes" mehr
— Foto / Text / Kunst / kommerziell sicher / Design — jede Kategorie hat ihren eigenen König
2024: Midjourney allein an der Spitze →
2026: aufgeteilt in 5 Anwendungs-Lager.
Der richtige Schritt heute ist die Kombination von 2–3 Tools nach Zweck — nicht die Wahl eines einzigen.
1. April 2026: DALL·E still in den Ruhestand — ein Generationswechsel bei Bild-KI
Am 21. April 2026 brachte OpenAI GPT Image 2 auf den Markt (intern: ChatGPT Images 2.0). Die Marke „DALL·E" wurde am 12. Mai offiziell eingestellt; die Bildgenerierung in ChatGPT läuft jetzt über GPT Image 2. Etwa vier Jahre nach DALL·E 2 im Jahr 2022 hat genau das Werkzeug, das „Bildgenerierungs-KI" überhaupt erst in den Mainstream-Wortschatz brachte, an seinen Nachfolger übergeben.
Im selben April machte Google Imagen 4 Ultra auf Vertex AI allgemein verfügbar. Unabhängige Tester bescheinigten ihm: „Hauttexturen, Stoffwebung, Wasserspiegelungen und Atmosphäre werden so wiedergegeben, dass sie sich konsistent kaum von echten Fotografien unterscheiden lassen" — und gaben ihm den ersten Platz auf der Photorealismus-Bestenliste von Artificial Analysis. Midjourney veröffentlichte V8 einen Monat zuvor am 17. März und machte die Generierung 5x schneller bei 2K HD als Standard.
Diese Phase wird inzwischen als „der Drei-Anbieter-Update-Monat" bezeichnet. Darüber hinaus: FLUX 1.1 Pro Ultra von Black Forest Labs trifft die API mit 0,04–0,06 USD pro Bild, Recraft V3 sicherte sich Platz 1 in der Text-zu-Bild-Arena von Artificial Analysis für kommerzielle Designarbeit, Ideogram V3 hat sich in Logo- und Posterarbeiten mit 90–95 % Textgenauigkeit etabliert, und Adobe Firefly Image 5 besetzt seine eigene Spur aus kommerzieller Sicherheit + Photoshop-/Illustrator-Integration.
Das Trio von 2024 — „Midjourney, DALL·E und Stable Diffusion" — passt also nicht mehr. 2026 hat sich in 5 Anwendungs-Lager aufgespalten.
2. Die 8 wichtigsten Tools im Überblick
Zunächst der Überblick aus der Vogelperspektive. Acht Haupt-Tools mit Stand Mai 2026, mit aktuellen Versionen, Preisen und Kernstärken.
| Tool | Aktuelle Version | Preis (Einstieg) | Kernstärke |
|---|---|---|---|
| Midjourney | V8 (März 2026) | 10 USD/Mon. (200 Generierungen) | Kunst, Stilisierung |
| GPT Image 2 | April 2026 (DALL·E-Nachfolger) | Im ChatGPT Plus für 20 USD/Mon. enthalten | 99 % Textgenauigkeit, Reasoning-Modell |
| FLUX 1.1 Pro Ultra | 2026 (laufend aktualisiert) | 0,04–0,06 USD/Bild (API) | Foto-Realismus, Kosteneffizienz, Geschwindigkeit |
| Google Imagen 4 | 4 Ultra (April 2026) | 0,02–0,06 USD/Bild (Vertex AI) | Spitzen-Fotoqualität |
| Recraft V3 | V3 (kontinuierlich seit 2024) | 0,04 USD/Bild (Raster) | Vektor-Output, Designsysteme |
| Ideogram | V3 (2026) | Ab 7 USD/Mon. | Textwiedergabe im Bild |
| Adobe Firefly | Image 5 (2026) | 9,99 USD/Mon. (Standard) | Kommerzielle Sicherheit, Adobe-Integration |
| Stable Diffusion | 3.5 / Cascade | Kostenlos (eigene GPU) | Open-Weight, anpassbar |
Die Tabelle allein wird die Entscheidung nicht für Sie treffen. Sie müssen zuerst Ihr eigenes Ziel in Worte fassen — sonst sieht keine Zeile dieser Tabelle „richtig" aus. Der nächste Abschnitt ordnet die 8 Tools nach Stärke-Achse.
3. Sortiert nach Stärke — wo man hinzielen sollte
Dieselben 8 Tools, diesmal neu gruppiert in 5 Lager nach Kernstärke. Das ist die praktische Schlachtkarte für 2026.
Auswahlmatrix nach Stärke
Versuchen Sie nicht, alles mit einem Tool zu machen. Abonnieren Sie 2–3 nach Anwendungsfall — das ist die Antwort für 2026.
Die Gesamtkosten landen bei ca. 20–40 USD/Monat und sind über ein einziges Projekt leicht wieder hereingeholt.
Genauer Blick: die Fotorealismus-Könige — Imagen 4 und FLUX
Google Imagen 4 Ultra, veröffentlicht im April 2026, hält den Spitzenplatz im Fotorealismus-Benchmark von Artificial Analysis. Generierung in 3–6 Sekunden — am schnellsten in der Premium-Klasse, zum Preis von 0,06 USD/Bild über Vertex AI. Es liefert erstklassige Ergebnisse für Produkt-Replacements, Porträts und Food-Fotografie.
Auf der anderen Seite kostet FLUX 1.1 Pro Ultra (Black Forest Labs) 0,04–0,06 USD/Bild bei vergleichbarem Fotorealismus. Kein Monatsabo nötig — reines Pay-as-you-go via API, sodass FLUX bei „weniger als 100 Bildern pro Monat" deutlich günstiger ist. Verfügbar über Replicate, fal.ai, Together, Freepik und andere große API-Hubs.
Textwiedergabe: das Duopol Ideogram + GPT Image 2
Bis 2024 war „Text in Bilder einsetzen" die größte Schwäche von Bild-KI. Midjourney V7 erreichte bestenfalls 30–40 % Textgenauigkeit — unbrauchbar für Logos oder Poster.
Ideogram V3 hat das geändert: 90–95 % Textgenauigkeit und einigermaßen brauchbare Unterstützung für nicht-englischen Text. Dann hob GPT Image 2 im April 2026 das Niveau auf 99 %, mit nativer Wiedergabe von Japanisch, Koreanisch, Chinesisch, Hindi, Bengalisch, Arabisch und mehr. Social-Thumbnails, Werbebanner, Infografiken — diesen Bereich besitzen jetzt diese beiden.
4. Preismodelle — Abo vs. Pay-per-Image
Nach der Stärke ist die Preisstruktur die nächste große Entscheidung. Die Tools teilen sich klar in monatliche Pauschale und Pay-per-Image. Je nach Volumen können die Monatskosten um den Faktor 10 schwanken.
| Abrechnungstyp | Repräsentative Tools | Am besten für |
|---|---|---|
| Monatspauschale (unbegrenzt) | Midjourney Standard 30 USD, Adobe Firefly Pro 19,99 USD | Tagesnutzer; wer iterieren will, ohne zu zählen |
| Monatspauschale (Credit-basiert) | Midjourney Basic 10 USD (200 Bilder), Ideogram 7 USD | Light-User im Bereich 100–200 Bilder/Monat |
| Pay-per-Image (API) | FLUX ab 0,04 USD, Imagen 4 0,02–0,06 USD, Recraft 0,04 USD, GPT Image 2 token-basiert | App-Integration; unregelmäßige, aber volumenstarke Schübe |
| Kostenlos (eigene GPU) | Stable Diffusion 3.5 / Cascade | Lokale Bereitstellung; Daten, die das eigene Netzwerk nicht verlassen dürfen |
Konkrete Rechnung. Eine Einzelperson, die 100 Bilder/Monat erzeugt:
- Midjourney Basic: 10 USD/Monat (200-Bild-Kontingent, komfortabler Spielraum)
- FLUX 1.1 Pro Ultra: 0,05 USD × 100 = 5 USD/Monat
- Imagen 4 Standard: 0,04 USD × 100 = 4 USD/Monat
- Adobe Firefly Standard: 9,99 USD/Monat (2.000-Credit-Kontingent)
Bei 100/Monat gewinnt API-Pay-as-you-go. Ab 500/Monat schlägt Midjourneys Pauschalplan alles. Auszurechnen, „ab welchem Monatsvolumen sich der Unlimited-Tarif lohnt", ist die Preis-Literacy, die man 2026 braucht.
5. Nach Anwendungsfall — die „Nimm dieses"-Entscheidungshilfe
Sie haben die Stärken und die Preise. Welches passt nun zu Ihrer Aufgabe? Sechs typische Muster, mit direkten Antworten.
„Nimm dieses"-Entscheidungshilfe
Meine persönliche Best Practice: Midjourney Basic + GPT Image 2 (im ChatGPT Plus enthalten), zusammen 30 USD/Monat.
Damit sind ca. 80 % des Tagesbedarfs abgedeckt. APIs nur für einmalige kommerzielle Aufträge, die Text oder Fotos brauchen.
6. Typische Stolperfallen — kommerzielle Nutzung, Urheberrecht, Textwiedergabe
Sie haben nach Stärke und Preis ausgewählt. Drei Fallen, die erst nach dem Start zutage treten:
Falle ①: Nutzungsbedingungen für kommerzielle Verwendung variieren je Tool
„KI-Bild = frei für kommerzielle Nutzung" stimmt nicht. Die Bedingungen variieren je Plan. Midjourney verlangt mindestens den Pro-Plan für den Stealth-Modus (damit Ihre Generierungen nicht öffentlich sind). Adobe Firefly bewirbt sich mit kommerzieller Sicherheit, aber bei Stable Diffusion hängt es vom Modell ab — Basismodelle sind kommerziell OK, bestimmte LoRAs können jedoch ausgeschlossen sein. Lesen Sie die Klausel zur kommerziellen Nutzung vor der Anmeldung — das ist die eiserne Regel.
Falle ②: Das Urheberrechtsrisiko ist unterschiedlich stark
Midjourney und OpenAI sind Beklagte in Urheberrechtsklagen aus den Jahren 2024–2025. Strittig ist, ob urheberrechtlich geschützte Werke in ihre Trainingsdaten gelangt sind. Urteile stehen noch aus, doch für Unternehmensarbeit sollten Sie wissen: Adobe Firefly ist der einzige große Anbieter, der seine Trainingsdaten offenlegt. Genau deshalb greifen Werbeagenturen und Verlage standardmäßig zu Firefly.
Falle ③: „Text im Bild" ist bei Englisch vs. Japanisch wie Tag und Nacht
Die viel gepriesene „90–95 % Genauigkeit" von Ideogram V3 gilt vor allem für englische und numerische Zeichen. Bei Japanisch, Chinesisch, Arabisch und anderen komplexen Schriften fällt die Genauigkeit deutlich. Für zuverlässigen japanischen Text im Bild ist GPT Image 2 derzeit die einzige Wahl. Mehrsprachige Logo- und Posterarbeit grenzt die Auswahl schnell ein.
Fazit
Zusammenfassung:
- April 2026: DALL·E in Rente; GPT Image 2 übernimmt. Mit Updates von Midjourney V8, Imagen 4 Ultra und FLUX 1.1 Pro Ultra wurde dieser Zeitraum zum „Drei-Anbieter-Update-Monat".
- Die 8 Haupt-Tools teilen sich in 5 Stärke-Lager auf — Foto / Text / Kunst / kommerziell sicher / Designsystem.
- Die Preise teilen sich in monatliche Pauschale und Pay-per-Image; der Break-even liegt bei Einzelpersonen um 100 Bilder/Monat.
- Für Einzelpersonen deckt die Kombination Midjourney Basic + GPT Image 2 (im ChatGPT Plus enthalten), zusammen 30 USD/Monat, ca. 80 % des Tagesbedarfs ab.
- Für kommerzielle Arbeit bleibt Adobe Firefly mit seiner Position offengelegter Trainingsdaten einzigartig stark.
Die Bild-KI-Frage 2026 lautet nicht mehr „welches ist das beste?", sondern „welches passt zu meinem Anwendungsfall?". Jagen Sie nicht der eierlegenden Wollmilchsau hinterher. Kombinieren Sie 2–3 Tools nach Zweck — das ist die richtige Antwort für einen Markt, der sich in 5 Lager aufgespalten hat.
FAQ
Wenn Sie bereits für ChatGPT Plus zahlen, ist GPT Image 2 kostenlos nutzbar. Falls nicht, Midjourney Basic (10 USD/Monat). Beides bringt Ihnen im ersten Monat das Kerngefühl von Bild-KI näher.
Stable Diffusion 3.5, wenn Sie es lokal betreiben können — kostenlos. Erfordert eine RTX 3060 oder besser und eine Python-Umgebung. Für cloudgehostete kostenlose Optionen siehe Leitfaden zu kostenlosen KI-Tools.
Adobe Firefly ist derzeit am sichersten. Trainingsdaten sind auf lizenzierte Adobe-Stock-Bilder beschränkt. Bei KI-Bildarbeit für Werbung / Verlag / Unternehmen sollte zuerst Firefly geprüft werden. Midjourney und OpenAI sind kommerziell zugelassen, haben aber laufende Urheberrechtsklagen — Unternehmensteams werden dieses Risiko individuell abwägen.
Konventionen variieren je Tool. Midjourney bevorzugt „Subjekt, Stil, Stimmung, Komposition" durch Kommas getrennt. GPT Image 2 / Imagen 4 funktionieren besser mit natürlich-sprachlichen, langen, spezifischen Beschreibungen. Stable Diffusion nutzt Negative Prompts (was ausgeschlossen werden soll) gut. Siehe auch allgemeine Prompt-Tipps.
Dieser Artikel behandelt nur Tools für Standbilder. Video-Generierung läuft auf einem eigenen Gleis — Sora 2 / Runway Gen-4 / Pika 2 / Kling 2 / Adobe Firefly Video sind die wichtigsten Namen. Adobe Firefly ist insofern ungewöhnlich, als es beides macht. Video entwickelt sich noch schneller als Standbild-KI; rechnen Sie mit einer Marktverschiebung im Sechsmonatsrhythmus.