Am 30. April 2026 erschien Midjourney V8.1 auf midjourney.com. Nur sechs Wochen nach V8 am 17. März wurde die Standardgenerierung 4–5× schneller, 2K HD (--hd) ist jetzt Standard und das Verständnis komplexer Multi-Subjekt-Prompts erreichte 95 %. „Derselbe Prompt produziert auf V7 vs. V8 etwas völlig anderes" ist nach der Nutzung der ehrliche Eindruck.

Gleichzeitig hat Midjourney seine Discord-only-Vergangenheit vollständig abgestreift. Jede Funktion läuft nun in der Web-App (midjourney.com), mit Ordnerverwaltung, Verlaufssuche, Moodboards (deine eigenen Stilprofile), alles drin. Dieses bizarre Einweihungsritual — einem Discord-Server beitreten, Befehle an einen Bot kleben — ist für neue Nutzer nicht mehr erforderlich.

Meine Haltung vorab. Für den Durchschnittsmenschen, der mit Bild-KI einsteigt, ist Midjourney V8 immer noch die erste Wahl. Stable Diffusion gewinnt bei der Freiheit, aber das Setup ist schwer; ChatGPT-/Gemini-Bildgenerierung ist für inline-Wegwerfnutzung; und Adobe Firefly ist kommerziell sicher, aber schwächer beim künstlerischen Look. „Hübsche Bilder, ab 10 USD/Monat, mit minimalen Schritten, ein festes Kontingent pro Monat" — diese Nachfrage trifft immer noch am saubersten auf MJ. Dieser Artikel behandelt Tarifauswahl, Prompt-Schreiben, Parameter, Referenzen und Stolperfallen, alles aktuell zu V8.1.

Midjourney V8.1 · Vollständiger Leitfaden

Vier Hebel, die Power-User unterscheiden

— Bleib nicht bei „einfach einen Prompt schreiben" stehen

(1) STRUKTURIERTER PROMPT
In fünf Schichten schreiben
Subjekt → Umgebung → Stil → Licht → Technik. V8 liest die Reihenfolge — das Verschieben von Begriffen ändert die Bedeutung
(2) PARAMETER
--ar / --stylize / --hd
Seitenverhältnis, Stilstärke und 2K HD — das absolute Minimum. Nur Prosa ist ein Anfängerzug
(3) REFERENZBILDER
--sref / --oref
Style Reference (Stimmung) vs. Omni Reference (das Subjekt selbst). Charakter-Konsistenz = --oref
(4) PERSONALIZATION
Moodboards + Personalization
Bewerte 200+ Bilder, um dein eigenes Profil aufzubauen. V8 glänzt, wenn du es darauf aufsetzt

Die Ära des Einzeilen-Prompts ist vorbei. „Struktur × Parameter × Referenzen × Personalization" ist der V8-Standard.

1. April 2026 — Midjourney hat das „Discord erforderlich" abgelegt

Seit der offenen Beta im Juli 2022 war Midjourneys Signaturablauf „einem Discord-Server beitreten und `/imagine` tippen". Das begann sich um 2024 in Richtung Web-App (midjourney.com) zu verschieben, und ab V8.1 ist jede Funktion vollständig im Web verfügbar. Der Discord-Bot sitzt jetzt in einer „noch da aus Gründen der Rückwärtskompatibilität"-Position.

Das andere, was sich in V8.1 geändert hat, ist die Geschwindigkeit. Fast-Modus-Standardjobs sind 4–5× schneller, die Genauigkeit komplexer Prompts erreichte 95 %, und der --hd-Parameter erzeugt native 2K-Auflösung (kein Upscaling nötig). Qualität und Geschwindigkeit gleichzeitig — endlich.

Die dritte große Verschiebung ist der Aufstieg von Personalization. Bewerte 200–500 Bilder (mögen/nicht mögen), und das System baut ein auf dich abgestimmtes Stilprofil — danach tendiert jede zukünftige Generierung von Anfang an zu deinem Geschmack. „Derselbe Prompt erzeugt für dich und mich unterschiedliche Bilder" ist jetzt die V8.1-Norm. Wir sind aus der Prompt-Ära in die Profil-Ära übergegangen, meiner Meinung nach.

2. Was Midjourney ist — in drei Zeilen

Aufschlüsselung in drei Zeilen:

(1) WAS ES TUT
Text-zu-Bild. Künstlerischer Look, Farbe und Kompositionsqualität gehören zu den besten der Branche. Video (V1) ist seit 2025 ebenfalls live
(2) WO MAN ES NUTZT
Web-App (midjourney.com) ist primär, Discord-Bot für Legacy. Funktioniert in mobilen Browsern. Es gibt keine API
(3) WAS ES KOSTET
Vier Tarife von 10 bis 120 USD/Monat. Keine Gratisstufe (früher gab es eine Testversion, eingestellt). Jahresrechnung spart 20 %

Midjourneys Stärke kommt auf eines hinaus: „Es sieht ohne viel Nachdenken großartig aus." Während Stable Diffusion Topqualität durch gestapeltes Parameter-Tuning, LoRA-Auswahl und ControlNet-Setups herauszieht, liefert MJ aus einem nackten Einzeilen-Prompt deutlich überdurchschnittliche Branchenergebnisse. Du bekommst Ergebnisse ohne die Setup-Hölle — dafür zahlst du 10 USD/Monat.

Seine Schwächen sind ebenso klar. Keine API (einzelne Entwickler können es nicht einbetten); kommerzielle Vereinbarungen über bezahlte Tarife geben dir das Recht, Ausgaben kommerziell zu nutzen, aber MJ behält die Lizenz; NSFW- und Gewaltinhalte sind auf der Safety-Ebene hart beschränkt. Vieles, was in SD trivial ist, steht in MJ schlicht nicht auf der Karte.

3. Preise — ein vierstufiges „GPU-Stunden"-Modell

MJ verkauft nicht „X Bilder pro Monat". Es verkauft Fast-GPU-Stunden (wie lange du im Fast-Modus generieren kannst). Jedes Bild verbraucht 10–60 Sekunden, also 3,3 Stunden ≈ 200–1.000 Bilder als grober Richtwert.

Tarif Monatlich (jährlich) Fast-Stunden Relax Für wen
Basic 10 USD (8 USD) ~3,3 Stunden Keine Hobby / lockeres Ausprobieren
Standard 30 USD (24 USD) 15 Stunden Unbegrenzt Freelancer / Blogger
Pro 60 USD (48 USD) 30 Stunden Unbegrenzt Profi / kleines Studio
Mega 120 USD (96 USD) 60 Stunden Unbegrenzt Agentur / Massenproduktion

Hinweis: Nach Verbrauch der Fast-Stunden kannst du weitere für 4 USD/Stunde kaufen. Kommerzielle Nutzungsrechte sind ab Basic identisch

Meine ehrliche Einschätzung: Anfänger sollten ohne zu zögern Standard (30 USD) wählen — bestes Preis-Leistungs-Verhältnis. Basic hat keinen Relax-Modus, sodass das Aufbrauchen von Fast den sofortigen Stopp bedeutet, und das ist ein ständiger Stress für jeden, der 50+ Bilder pro Monat macht. Standard gibt dir 15 Fast-Stunden plus unbegrenzten Relax, locker 500–2.000 Bilder pro Monat. Wechsle erst dann auf Pro/Mega, wenn du ernsthaft Video nutzt oder beruflich 100+ Bilder pro Tag erzeugst.

4. Fast vs. Relax — wann was zu nutzen ist

Dieses Konzept ist MJ-spezifisch und verwirrt Neulinge. Hier die Aufschlüsselung.

Fast-Modus
Dedizierte GPU, 15–60 Sek. pro Bild
Frisst Tarifkontingent. Für Ideenvalidierung und ernsthafte Endversionen
Relax-Modus
Freie GPU, Minuten bis Stunden pro Bild
Unbegrenzt, gilt als kostenlos. Für Trial-and-Error und Massenvariationen

Die Regel: Starte in Relax, um Komposition/Prompt zu erkunden, dann wechsle auf Fast zum Polieren. Nutze Fast für „einfach generieren", und du bist Mitte des Monats trocken

5. Prompt-Anatomie — die fünfschichtige Struktur, die funktioniert

In V8 ändert die Wortreihenfolge in deinem Prompt die Bedeutung. Frühere Begriffe haben mehr Gewicht. Empirisch ist die unten stehende fünfschichtige Struktur das, was funktioniert.

(1) SUBJEKT
Die Hauptfigur. „a samurai", „young woman", „red sports car". Sei konkret
(2) UMGEBUNG
Schauplatz. „in a bamboo forest", „on a rainy Tokyo street"
(3) STIL
Künstlerischer Stil. „cinematic photography", „watercolor illustration", „cyberpunk anime"
(4) LICHT
Lichtquelle. „golden hour", „neon backlight", „soft studio lighting"
(5) TECHNIK
Kamera, Objektiv, Parameter. „shot on Hasselblad H6D, 85mm, shallow depth of field --ar 16:9 --stylize 750"

Vollständiges Beispiel: a samurai, in a bamboo forest, cinematic photography, golden hour, shot on Hasselblad, shallow depth of field --ar 16:9 --stylize 750

Ein häufiger Anfängerfehler: mit Gefühlswörtern wie „a beautiful samurai" zu beginnen. MJ interpretiert „beautiful" als Merkmal des Subjekts, zieht das Ergebnis in Richtung „Schönheit", und die Komposition zerfällt. Ersetze Gefühlswörter durch konkrete Substantive oder Eigennamen (Hasselblad, golden hour, 85mm usw.), und V8 liest dich mit viel höherer Genauigkeit. Deshalb ist „Leute, die sich mit Fotografie auskennen, sind normalerweise besser in MJ" eine echte Sache.

6. Sieben unverzichtbare Parameter — --ar / --stylize / --chaos und Freunde

Parameter sind die `--xxx`-Flags, die du ans Ende eines Prompts heftest. Sieben, die du unbedingt kennen solltest, mit ihren Glanzpunkten.

Parameter Bereich Wirkung Wann nutzen
--ar 1:1 / 16:9 / 9:16 / 3:2 usw. Seitenverhältnis 16:9 für horizontale Social-Posts, 9:16 für Stories
--stylize (--s) 0–1000 (Standard 100) Stärke der künstlerischen Interpretation Niedrig (50–250) für Fotorealismus, hoch (750–1000) für Kunst
--chaos (--c) 0–100 (Standard 0) Varianz über das 4-Bild-Raster Hoch für divergente Ideen, niedrig für eine fixe Richtung
--hd Flag Native 2K-HD-Generierung Für Druck / große Displays (V8.1)
--raw Flag Entfernt MJs Signatur-Filter Wenn du fotografische, treue Ausgabe willst
--q (--quality) 1 / 2 / 4 Detail-Aufwand --q 4 für komplexe Szenen (neu in V8)
--no Wort Bestimmtes Element ausschließen z. B. `--no text`, um Buchstaben zu unterdrücken

Die zwei, die ich persönlich jedes Mal nutze: --ar und --stylize. Das Standard-1:1 ist selbst für Social-Posts unhandlich, und stylize 100 ist die Mitte von nichts. Mach es dir zur Gewohnheit, immer `--ar 16:9 --stylize 500` anzuhängen, und deine Baseline-Ausgabequalität steigt. Reserviere --chaos für Exploration und --hd für Endversionen — halte die Spuren getrennt.

7. Referenzfunktionen — --sref / --oref / Moodboards / Personalization

Hier zeigt sich in der V8-Ära die Lücke zwischen „Anfängern, die mit Prosa kämpfen" und „fortgeschrittenen Nutzern, die das Tool tatsächlich nutzen". Vier referenzbezogene Funktionen, aufgeschlüsselt.

--sref
Style Reference
Übernimmt nur Stimmung, Farbe und Pinselführung des Referenzbildes; das Subjekt wird neu generiert. „In diesem Aquarell-Stil…"
--oref
Omni Reference (V7+)
Platziert das tatsächliche Subjekt des Referenzbildes in deinem neuen Bild. Charaktere, Objekte, Fahrzeuge. Stärke per --ow 0–1000
Moodboards
Stilprofile
Bündele mehrere Bilder zu „deinem persönlichen Ästhetikprofil". Separate Boards pro Projekt
Personalization
Kontoweites Lernen
Bewerte 200–500 Bilder mit mögen/nicht mögen, und das Modell stimmt sich automatisch auf deinen Geschmack ab. Passt am besten mit --stylize 1000

Wie wählen: Derselbe Charakter über viele Bilder → --oref. Massenausgabe im Vibe eines bestimmten Künstlers → --sref. Kohärenter Look für ein ganzes Projekt → Moodboards. Deinen Gesamtgeschmack trainieren → Personalization

Die revolutionärste in meinem Buch ist --oref (Omni Reference, seit V7). „100 Bilder desselben Charakters generieren" erforderte früher LoRA-Training und bedeutete nur Stable Diffusion. Jetzt liefert MJ nahezu identische Charakter-Serien einfach durch Einfügen einer Bild-URL und Setzen einer Stärke. Das ist eine der Bastionen von SD, die fällt.

8. Drei häufige Stolperfallen

Stolperfalle (1): Text-Wiedergabe ist in V8 „besser", nicht „gut"

V8 machte große Fortschritte beim Text, erreicht aber immer noch nicht die Präzision von Ideogram V3 oder GPT Image 2. Wenn ein Job zuverlässigen Logo-/Plakat-/Beschilderungstext braucht, wird der Versuch, ihn allein in MJ fertigzustellen, scheitern. Der praktische Zug: MJ für Hintergrund + Komposition nutzen, dann Text in Photoshop / Figma überlagern — oder textkritische Jobs an Ideogram / GPT Image schicken. Erwarte nicht, dass „Logo with the text XYZ" allein von MJ funktioniert.

Stolperfalle (2): Kommerzielle Nutzung ist „ab Basic freigeschaltet", aber MJ hält das Urheberrecht

MJs Bedingungen sind subtil knifflig. Jeder bezahlte Tarif (ab Basic) erlaubt die kommerzielle Nutzung generierter Bilder. Aber „das Urheberrecht der Bilder bleibt bei MJ; du erhältst eine Nutzungslizenz" — strukturell anders als das Modell von Stability AI „der Nutzer besitzt alles". Unternehmen mit mehr als 1 Mio. USD Jahresumsatz müssen Pro oder höher nutzen, und das Kündigen deines Abonnements kann Rechte an Bildern, die in den letzten 30 Tagen erstellt wurden, ungültig machen. Wenn du MJ-Ausgaben in Werbeanzeigen verwendest, lass das von der Rechtsabteilung prüfen.

Stolperfalle (3): Keine API = keine App-Einbettung

SD, GPT Image und FLUX haben alle APIs und können in Apps und Workflows eingebettet werden. MJ hat keine offizielle API — nur Web-App und Discord-Bot. Wenn du MJ-Bildgenerierung in deinem eigenen Dienst willst, nutzt du entweder einen Drittanbieter-Wrapper (UseAPI usw.) oder wählst eine andere Bild-KI. Das ist MJs Haltung seit sechs Jahren und wird sich fast sicher nicht ändern. „Ein Werkzeug, das Künstler von Hand verwenden" ist eine Position, die sie nicht aufgeben wollen.

Zusammenfassung

Tarifwahl
Anfänger: Standard (30 USD/Mon.) wählen. Basic hat keinen Relax — Fast aufgebraucht heißt harter Stopp
Prompts
Fünfschichtige Struktur (Subjekt→Umgebung→Stil→Licht→Technik) plus konkrete Substantive
Parameter
Immer --ar und --stylize. --hd für Endversionen, --chaos für Exploration
Wo die Lücke sich zeigt
Personalization + --oref = „dein eigener Stil × konsistente Charaktere über eine Serie"

Midjourney ist eines der wenigen Tools, das seinen „König der Bildgenerierungs-KI"-Status seit 2022 gehalten hat. V8.1 hat Geschwindigkeit, Text und Referenzen noch eine Stufe angehoben, und vieles, was „nur Stable Diffusion" war, ist nun abgedeckt. Für die Nachfrage nach „hübschen Bildern, minimalen Schritten, festem Kontingent jeden Monat" ist MJ immer noch die richtige Antwort. Allerdings: Wenn du Textgenauigkeit, eine API, perfektes Charakter-Klonen oder echte Eigentümerschaft an der Ausgabe brauchst, gehst du immer noch zu SD oder anderswo. Kein Alleskönner-Tool, sondern ein auf künstlerischen Look fokussierter bezahlter Dienst — mit dieser Rahmung einzusteigen, ist das Geheimnis, langfristig bei MJ zu bleiben.

FAQ

Kann ich es kostenlos ausprobieren?

Heute keine Gratisstufe. Früher gab es eine etwa 25-Bilder-Gratistest (bis etwa 2023), aber Missbrauch hat ihn beendet. Mindesteinstieg ist der Basic-Tarif für 10 USD/Monat — 8 USD/Monat im Äquivalent mit Jahresrechnung.

Discord oder Web-App — was soll ich nutzen?

Die Web-App (midjourney.com) ist heute die einzig sinnvolle Wahl. Ordnerverwaltung, Verlaufssuche, Moodboards, Drag-and-Drop-Referenzbilder und die meisten neuen Funktionen sind webexklusiv. Der Discord-Bot ist auf den Funktionsstand von 2022 eingefroren; dort werden keine neuen Funktionen mehr hinzugefügt.

Stable Diffusion vs. Midjourney — was nehmen?

Unterschiedliche Jobs. „Hübsches Bild, einfach, 10 USD pauschal, keine Setup-Hölle" → Midjourney. „Denselben Charakter in Masse produzieren", „private Daten einmischen", „bis auf den Strom kostenlos", „über API einbetten" → Stable Diffusion. Viele Profis nutzen beide.

Kann ich es kommerziell nutzen?

Ja, auf jedem bezahlten Tarif (ab Basic) — Werbung, Verkauf, Kundenarbeit alles erlaubt. Aber MJ behält das Urheberrecht und gewährt dir eine Nutzungslizenz — strukturell anders als SDs „du besitzt es vollständig". Unternehmen mit mehr als 1 Mio. USD Jahresumsatz müssen Pro oder höher abonnieren.

Wie behalte ich denselben Charakter über mehrere Bilder?

--oref (Omni Reference, V7+) ist derzeit der beste Weg. Übergib deine Referenzbild-URL per `--oref [URL]` und stelle die Stärke mit `--ow 100–400` ein. Davor war „Stable Diffusion + ein trainiertes LoRA" die einzige Option, das ist also ein großer Gewinn. Wenn du Exact-Match-Treue brauchst, ist SD immer noch voraus; für den 95%-ähnlichen Fall, der die meisten Bedürfnisse abdeckt, schafft MJ das jetzt.

Was passiert, wenn die Fast-Stunden aufgebraucht sind?

Ab Standard fällst du automatisch in Relax (unbegrenzt, langsamer). Bei Basic stoppst du komplett — kaufe mehr Fast für 4 USD/Stunde oder warte bis zum nächsten Monat. „Kein Weg nach vorne, sobald Fast aufgebraucht ist" ist die größte Schwäche von Basic und der einzige beste Grund, auf Standard hochzustufen.