Du kommst in Claude Code endlich richtig in den Flow, und dann bremst dich das hier abrupt aus:

Claude usage limit reached.
Your limit will reset at 3pm (Europe/Berlin).

„Du hast aufgebraucht, was dein aktueller Tarif derzeit erlaubt." Das ist kein Fehler und kein Bug: So funktionieren die Nutzungslimits des Pro-/Max-Abos. Das Frustrierende ist, dass nicht offensichtlich ist, warum es so schnell aufgebraucht war, wann es zurückkommt und was du bis dahin tun kannst. Dieser Artikel erklärt die zweistufige Limitstruktur (5 Stunden + wöchentlich), was den Verbrauch treibt, was im Moment des Limits zu tun ist, wie du den Rest prüfst und welcher API-Notausgang bleibt — auf Basis offizieller Informationen.

Drei Erkenntnisse vorab. (1) Das Limit besteht aus zwei Schichten: einem „rollierenden 5-Stunden-Fenster" und einem „Wochenfenster" (Max hat zusätzlich ein separates Wochenlimit nur für Opus). (2) Der größte Verbraucher ist deine Modellwahl — Opus brennt das Kontingent weit schneller herunter als Sonnet. (3) Wenn du nicht warten kannst, sind die sauberen Schritte „auf Sonnet wechseln / Kontext kürzen / auf die nutzungsbasierte API umsteigen". Beachte: Die angezeigte Uhrzeit und die tarifabhängigen Mengen ändern sich je nach Version und im Lauf der Zeit, prüfe die Zahlen also immer in der offiziellen Live-Ansicht (/usage oder Settings → Usage).

CLAUDE CODE · USAGE LIMIT

Das Nutzungslimit ist zwei Stockwerke hoch

— schon eines davon zu treffen, stoppt dich

1) Rollierendes 5-Stunden-Fenster setzt ~5 Std. nach dem ersten Prompt zurück
100 % erreicht → reset at 3pm
2) Wochenfenster (alle Modelle) setzt alle 7 Tage zurück (fester Tag)
68 % verbraucht
3) Opus-Wochenlimit (nur Max) ein separater Pool, der zuerst leerläuft
88 % verbraucht (Vorsicht)

Claude Code und die Claude-Apps (Web/Desktop) teilen sich dasselbe Tarif-Kontingent.
Die Anzeigewerte sind beispielhaft. Prüfe dein tatsächliches Guthaben mit /usage und Settings → Usage.

1. Was diese Meldung dir sagt

Eine typische Meldung sieht so aus (der Wortlaut variiert je nach Version, betrachte sie also als Schema): „Claude usage limit reached. Your limit will reset at [Uhrzeit] ([Zeitzone])." Die Bedeutung ist einfach: „Du hast aufgebraucht, was dein Tarif für diesen Zeitraum erlaubt. Es erholt sich um [Uhrzeit]." Die Zeitzone ist deine lokale Einstellung.

Der entscheidende Punkt: Das ist so vorgesehen, keine Fehlfunktion. Die Pro-/Max-Tarife von Claude sind nicht „unbegrenzt" — es gibt eine Obergrenze pro Zeitfenster und pro Woche. Und Claude Code (CLI) und die Claude-Apps (Web/Desktop) teilen sich dasselbe Tarif-Kontingent — die offizielle Hilfe stellt klar, dass „alle Aktivitäten in beiden Tools auf dieselben Nutzungslimits angerechnet werden". Es ist also völlig normal, dass „ich habe gechattet UND Claude Code laufen lassen, und zusammen war es schneller leer."

Noch etwas, das du wissen solltest: Es gibt zwei Arten von Limit — „5 Stunden" und „wöchentlich". Liegt das angezeigte reset at nur ein paar Stunden entfernt, hast du das 5-Stunden-Fenster getroffen; liegt es Tage entfernt, hast du das Wochenfenster getroffen. Welches du triffst, ändert sowohl deine Wartezeit als auch deine Optionen. Der nächste Abschnitt behandelt die Struktur.

2. Das zweistufige Limit — 5 Stunden + wöchentlich (+ Opus-Limit)

Im August 2025 ergänzte Anthropic Pro / Max um wöchentliche Nutzungslimits zusätzlich zum bestehenden 5-Stunden-Fenster (ausgelöst durch Heavy-User, die es ununterbrochen laufen ließen). Dadurch ist das heutige Abo-Limit zwei Stockwerke hoch.

2-TIER LIMITS

Die beiden Fenster wirken unabhängig

1) Rollierendes 5-Stunden-Fenster
Dein erster Prompt öffnet das Fenster; die nächsten ~5 Stunden schöpfen daraus. Es setzt ~5 Stunden später zurück, und dein nächster erster Prompt öffnet ein frisches. Keine feste Uhrzeit, nicht täglich — es ist rollierend.
2) Wochenfenster (alle Modelle)
Eine wöchentliche Gesamtobergrenze, die alle 7 Tage zurücksetzt. Der Reset-Tag ist pro Konto fest (meist an deinen Verlängerungstag gekoppelt). Prüfe dein nächstes Reset-Datum unter Settings → Usage.
3) Opus-Wochenlimit (Max-Tarife)
Bei Max gibt es über das „Wochenfenster für alle Modelle" hinaus ein separates Wochenlimit nur für Opus. Weil Opus so viel verbraucht, läuft dieser Pool zuerst leer. Selbst wenn das Opus-Limit aufgebraucht ist, kannst du in der Regel mit Sonnet weitermachen.

Die Tarife unterscheiden sich durch einen „Multiplikator" auf derselben Struktur: Pro < Max 5x < Max 20x.
Die genauen Wochenstunden werden im Lauf der Zeit überarbeitet. Merke dir keine festen Zahlen — lies die Live-Werte unter Settings → Usage.

Als ursprüngliche Orientierung (August 2025) nannte Anthropic grobe Schätzungen wie „Pro: ~40-80 Stunden Sonnet pro Woche" und „Max 20x: ~240-480 Stunden Sonnet + ~24-40 Stunden Opus pro Woche". Allerdings hat Anthropic seitdem weitgehend aufgehört, feste Stundenangaben zu veröffentlichen, und die Limits wurden mehrfach überarbeitet (selbst 2026 wurde von Erhöhungen des 5-Stunden-Fensters berichtet). Betrachte diese Zahlen daher als „Schätzungen von damals" und prüfe dein aktuelles Kontingent immer in der offiziellen Nutzungsansicht. Dieser Artikel verzichtet bewusst darauf, konkrete aktuelle Werte zu behaupten.

3. Was dein Kontingent aufbraucht

„Es war schneller leer als erwartet" lässt sich fast immer auf diese vier Punkte zurückführen, geordnet nach Auswirkung.

TreiberWarum es das Kontingent aufbrauchtWas hilft
1) Modellwahl (größter Faktor)Opus verbraucht weit mehr als Sonnet/Haiku. Die Docs sagen klar, dass Opus „deutlich mehr Kontingent verbraucht". Bei Max hat es sogar ein eigenes WochenlimitNutze /model, um Routinearbeit auf Sonnet/Haiku zu erledigen; halte Opus für harte Probleme zurück
2) KontextgrößeJeder Zug verarbeitet die gesamte Konversation + angehängte Dateien + Tool-Definitionen + Verlauf erneut. Größer = mehr pro Zug/compact, /clear, weniger Dateien anhängen, kleinere CLAUDE.md
3) Lange, durchgehende SitzungenDauerbetrieb, endlose Schleifen. Das Wochenlimit zielt gezielt auf dieses MusterArbeit mit /clear aufteilen; unnötige Auto-Schleifen stoppen
4) Subagenten / MCPParalleles Fan-out und MCP-Server fügen Tool-Definitionen und Tool-Call-Traffic hinzuAktive MCP-Server reduzieren. /usage zeigt eine Aufschlüsselung pro MCP/Subagent

Kurz: Je schwerer das Modell, je größer der Kontext, je länger und paralleler der Lauf, desto schneller schmilzt das Kontingent. Umgekehrt lässt das bewusste Absenken dieser vier denselben Tarif spürbar länger reichen. Zur Gesamtoptimierung siehe Kostenoptimierung beim KI-Coding, und für konkrete Tipps zum Token-Sparen siehe Claude Code Token sparen.

4. Fünf Wege, um jetzt weiterzuarbeiten

Fünf Schritte für den Moment, in dem du das Limit triffst, nach Situation. Welchen du wählst, hängt davon ab: „Kannst du warten?" und „Welches Fenster hast du getroffen?"

5 OPTIONS

Wenn du das Limit triffst

A · Modell absenken
/model auf Sonnet/Haiku. Ist nur das Opus-Limit aufgebraucht, kannst du so oft sofort weitermachen.
B · Kontext kürzen
/compact / /clear, um pro Zug weniger zu verbrauchen und den kleinen Rest zu strecken.
C · Auf Reset warten
Ein 5-Stunden-Fenster erholt sich in Stunden. Lies das reset at und erledige in der Zwischenzeit anderes.
D · Auf API umsteigen
Ist selbst das Wochenlimit weg und du kannst nicht warten, mach mit einem API-Schlüssel (nutzungsbasiert) weiter — keine wöchentliche Sperre.
E · Mehr Kontingent
Nutzungs-Credits kaufen (zu Standard-API-Preisen abgerechnet) oder upgraden (Pro auf Max), um das Limit anzuheben.
Unsicher? A → B → C.
Termin im Nacken? D.

Ein 5-Stunden-Fenster kommt zurück, wenn du wartest, also überbrücke es mit A/B/C. Ist auch das Wochenlimit weg, sind D (API) oder E die realistische Antwort.

Den API-Wechsel (D) als „Notausgang" zu kennen, ist mächtig. Anders als die Zeitfenster-Sperre des Abos hat die API Durchsatzlimits pro Minute, aber sie „sperrt dich nie für eine Woche aus" (du zahlst, was du nutzt). Siehe Was ist eine KI-API. Beachte: Pro-/Max-Nutzer können außerdem „Nutzungs-Credits aktivieren", um über das enthaltene Kontingent hinaus zu Standard-API-Preisen weiterzuarbeiten (ausdrückliche Zustimmung erforderlich).

5. So siehst du, was übrig ist

Wenn du sehen kannst, „wie viel übrig ist", kannst du das Limit ganz vermeiden. Drei Wege zur Prüfung.

1) Claude Codes /usage: zeigt den aktuellen Verbrauch des 5-Stunden-Fensters und den Status des Wochenfensters pro Modell. Ein Update von 2026 ergänzte eine Aufschlüsselung nach Skill / Subagent / Plugin / MCP-Server. /status zeigt ebenfalls deine Zuteilung an. 2) Web-/Desktop-App: Settings → Usage zeigt deinen Tarif, die verbleibende Nutzung und das wöchentliche Reset-Datum. 3) API-Nutzer: die Console-Seiten Usage / Limits und die Response-Header anthropic-ratelimit-*. /cost (für API-Schlüssel-Nutzer) und /context verfolgen Ausgaben und Kontextgröße.

Eine Gewohnheit, die sich auszahlt

Führe /usage einmal vor schwerer Arbeit aus, um dein Guthaben und Reset-Datum zu kennen. In einer Woche, in der dein Wochenlimit zur Neige geht, baue von Anfang an um Sonnet herum, damit du Opus-Spielraum für die wirklich wichtigen Momente behältst.

6. Abo-Limits vs. API-Limits

Sie sind leicht zu verwechseln, doch die Abo-Limits (Pro/Max) und die API-Limits sind völlig unterschiedliche Systeme. Den Unterschied zu kennen, macht die Wechselentscheidung schnell, wenn es darauf ankommt.

AspektAbo (Pro / Max)API (nutzungsbasiert)
Limit-EinheitGesamtmenge pro Zeitfenster (5 Stunden + wöchentlich)Durchsatz pro Minute (RPM / Eingabe- + Ausgabe-Tokens pro Minute)
Wenn du es triffstBis zum Reset gesperrtGibt 429 zurück; warte die retry-after-Sekunden und mach weiter (keine wöchentliche Sperre)
Wie du es anhebstTarif upgraden, Credits kaufenTier 1-4 schalten sich automatisch durch kumulierte Ausgaben frei
Am besten fürPersönlicher Chat, alltägliches CodingAutomatisierung, die du nicht stoppen kannst, große Batches

Der Punkt: Das Abo sperrt dich zeitlich aus, während die API nur den Fluss pro Minute drosselt und keine wöchentliche Sperre hat. Für Termin-Arbeit, die du wirklich nicht stoppen kannst, ist der Wechsel auf einen API-Schlüssel daher der Standardweg. Die Details zu den API-Rate-Limits (429, retry-after, Tiers) verdienen einen eigenen Beitrag, aber merke dir das als realistischen Notausgang, wenn das Abo leer ist.

7. Checkliste zur Vorbeugung

Eine Betriebs-Checkliste, um „leer im falschen Moment" zu verhindern.

(1) Standardmäßig Sonnet und nur für die harten Stellen mit /model auf Opus wechseln (das Opus-Wochenlimit schonen). (2) Den Kontext mit häufigem /compact / /clear leicht halten. (3) Guthaben und Reset-Datum mit /usage vor schwerer Arbeit prüfen. (4) Unnötiges MCP und Auto-Schleifen reduzieren; nur die nötigen Dateien anhängen. (5) An Termintagen die nutzungsbasierte API bereithalten (damit du nicht stockst, wenn das Abo leer ist). (6) Wenn es chronisch knapp ist, erwäge ein Tarif-Upgrade oder die Verlagerung dieser Last auf die API.

Zusammenfassung

Claude Codes „Claude usage limit reached" ist kein Fehler — so funktionieren die Nutzungslimits des Pro-/Max-Abos. Das Limit ist zwei Stockwerke hoch: ein „rollierendes 5-Stunden-Fenster" + ein „Wochenfenster", und Max hat zusätzlich ein separates Wochenlimit für Opus. Weil sich Claude Code und die Claude-Apps dasselbe Tarif-Kontingent teilen, können sie zusammen schneller leer sein. Liegt das reset at Stunden entfernt, ist es das 5-Stunden-Fenster; Tage entfernt, das Wochenfenster.

Der größte Verbraucher ist die Modellwahl (Opus ist der größte), dann Kontextgröße, lange durchgehende Läufe und Subagenten/MCP. Wenn du das Limit triffst: A: Modell absenken -> B: Kontext kürzen -> C: auf Reset warten, und wenn du nicht warten kannst, D: auf nutzungsbasierte API umsteigen / E: mehr Kontingent oder upgraden. Sieh dein Guthaben mit /usage und Settings -> Usage. Und da sich die genauen Zahlen im Lauf der Zeit ändern, merke sie dir nicht — prüfe sie in der offiziellen Live-Ansicht. Verwandt: Token sparen und Zusatzkosten, Opus/Sonnet/Haiku-Preise, Claude-Code-Fehlerübersicht.

FAQ

Q. Ist „usage limit reached" ein Bug? Ich bezahle doch dafür.
A. Es ist so vorgesehen, kein Bug. Pro / Max sind nicht „unbegrenzt" — es gibt Nutzungsobergrenzen pro 5-Stunden-Fenster und pro Woche. Auch als zahlender Nutzer wirst du vorübergehend pausiert, sobald du überschreitest, was dieses Fenster erlaubt; es erholt sich zur angezeigten reset at-Zeit. Beachte: Claude Code und die Claude-Apps teilen sich dasselbe Kontingent, beides zu nutzen, leert es also schneller.

Q. Wann setzt es zurück? Es hieß „reset at 3pm".
A. Das ist die Reset-Zeit für das 5-Stunden-Fenster (deine lokale Zeit); ein paar Stunden, und es erholt sich. Steht stattdessen „Tage entfernt", hast du das Wochenfenster getroffen, und das nächste wöchentliche Reset-Datum findest du unter Settings → Usage. Ist selbst das Wochenlimit weg, bleiben dir warten, auf die nutzungsbasierte API wechseln oder upgraden.

Q. Warum erreiche ich das Limit so schnell?
A. Der größte Faktor ist die Modellwahl. Opus brennt das Kontingent weit schneller herunter als Sonnet, und bei Max hat es ein separates Wochenlimit, das zuerst leerläuft. Hinzu kommt: großer Kontext, lange durchgehende Läufe und intensive Nutzung von Subagenten oder MCP treiben den Verbrauch hoch. Allein Routinearbeit mit /model auf Sonnet abzusenken und den Kontext mit /compact zu kürzen, macht einen großen Unterschied.

Q. Wie arbeite ich jetzt sofort weiter, ohne zu warten?
A. (1) /model, um auf Sonnet/Haiku abzusenken (funktioniert, wenn nur das Opus-Limit aufgebraucht ist), (2) auf einen nutzungsbasierten API-Schlüssel wechseln (keine wöchentliche Sperre), (3) Nutzungs-Credits aktivieren (über das enthaltene Kontingent hinaus zu Standard-API-Preisen weiterarbeiten), (4) deinen Tarif upgraden (Pro auf Max). Für Termin-Arbeit ist es die sichere Wahl, die nutzungsbasierte API vorab bereitzuhalten.

Q. Kann ich prüfen, wie viel mir noch bleibt?
A. Ja. In Claude Code nutze /usage (zeigt das 5-Stunden- und das Wochenfenster pro Modell, plus eine Aufschlüsselung pro MCP/Subagent) und /status. In der Web-/Desktop-App zeigt Settings → Usage deinen Tarif, die verbleibende Nutzung und das wöchentliche Reset-Datum. Einmal vor schwerer Arbeit zu prüfen, lässt dich das Limit vermeiden.