Zum Inhalt springen
Themen

KI-Entwicklung & Programmierung

Entwickeln Sie smarter mit KI. Anleitungen zu Code-Generierung, App-Erstellung, Debugging und Automatisierung.

63 Artikel

Sortieren Sie Artikel, um das Gewünschte zu finden

Was ist ein Embedding (Vektor)? Wie Bedeutung zu Zahlen wird, Anwendungen und Modellauswahl

Was ist ein Embedding (Vektor)? Wie Bedeutung zu Zahlen wird, Anwendungen und Modellauswahl

RAG, semantische Suche und Empfehlungen beruhen alle auf einem unbesungenen Arbeitspferd: dem Embedding (Vektor). Ein Embedding ist die in eine Zahlenfolge — einen Vektor — umgewandelte Bedeutung von Text (oder eines Bildes). Das Wort „Hund" wird zu einer Liste aus Hunderten bis Tausenden von Zahlen, die als „Koordinaten der Bedeutung" wirken, sodass Wörter mit naher Bedeutung nah beieinander liegen („Hund" und „Welpe" sind nah; „Hund" und „Auto" sind fern), und die Nähe wird mit Maßen wie der Kosinus-Ähnlichkeit quantifiziert. Berühmtes Beispiel: „König − Mann + Frau ≈ Königin." Dadurch kann eine Maschine beurteilen, ob die Bedeutung nah ist, selbst wenn die Zeichen nicht übereinstimmen. Dieser Einsteiger-Leitfaden behandelt, was ein Embedding ist (eine „Landkarte der Bedeutung"), warum Nähe Bedeutung misst (Dimensionen und Kosinus-Ähnlichkeit), wofür es verwendet wird (RAG, semantische Suche, Klassifikation und Deduplizierung, Empfehlungen sowie multimodal), wie man ein Embedding-Modell auswählt (API-Typ wie OpenAI text-embedding-3, Cohere, Gemini, Voyage; Open-Source wie BGE-M3, Nomic, Qwen3; plus Matryoshka, das 3.072 Dimensionen auf 1.024 senken kann und dabei etwa 95 % der Qualität bei rund einem Drittel der Kosten erhält) sowie Vektordatenbanken (Pinecone, Weaviate, Qdrant, Chroma, pgvector) mit einem Drei-Schritte-Start (ein Modell wählen, Dokumente vektorisieren und speichern, die Frage vektorisieren und suchen). Embeddings sind das Fundament der RAG-Implementierung.

Was sind AI Evals (und LLM-as-Judge)? Funktionsweise, Verzerrungen und Tools – ein Einsteigerleitfaden

Was sind AI Evals (und LLM-as-Judge)? Funktionsweise, Verzerrungen und Tools – ein Einsteigerleitfaden

Sie haben Ihre Prompts verfeinert, mit RAG Wissen ergänzt und vielleicht Fine-Tuning betrieben – aber wie bestätigen Sie, dass es wirklich besser geworden ist? Hier rücken AI Evals in den Mittelpunkt, und bis 2026 ist Evaluierung so unverzichtbar, dass man sie als „Infrastruktur" bezeichnet. AI Evals bedeuten, die Qualität der Ausgaben eines LLM systematisch zu messen (Korrektheit, Halluzinationen, Formattreue, Ton) anhand eines festen Maßstabs statt nach Bauchgefühl; ohne sie ist Verbesserung nur eine Vermutung. Es gibt zwei Methoden: code-basierte Evaluierung für mechanisch messbare Punkte (exakte Übereinstimmung, Format, geforderte/verbotene Wörter – schnell, günstig, stabil) und LLM-as-Judge für subjektive (ein leistungsstarkes LLM als Schiedsrichter, der Ausgaben über Pairwise-Vergleich oder Einzelausgabe-Bewertung benotet). Das Prinzip: Messen Sie mit Code alles, was Code messen kann. LLM-as-Judge hat Wortfülle-, Positions- und Selbstbevorzugungs-Verzerrungen; die Lösungen sind ein anderes Bewerter-Modell, Reihenfolge tauschen und zweimal benoten, Prägnanz ins Raster aufnehmen und an menschlichem Urteil kalibrieren. Grobe Skalen (pass/fail oder 1–3) schlagen feinkörnige 1–10. In der Praxis laufen drei Stufen – sofortige Code-Checks bei jeder Änderung, nächtliche LLM-as-Judge-Regressionstests und kontinuierliche Produktionsüberwachung – mit Tools wie DeepEval, Promptfoo und RAGAS für CI sowie Braintrust, LangSmith und Arize für die Überwachung. Beginnen Sie damit, 10 gute und 10 schlechte Ausgaben zu sammeln und zu bewerten.

Was ist Fine-Tuning? Fine-Tuning vs. RAG, LoRA/QLoRA und wann man es einsetzt — ein Einsteigerleitfaden

Was ist Fine-Tuning? Fine-Tuning vs. RAG, LoRA/QLoRA und wann man es einsetzt — ein Einsteigerleitfaden

Wenn du die KI für dein eigenes Unternehmen anpassen willst, ist Fine-Tuning eine der Optionen — doch steigst du unbedacht ein, ist es teuer und leicht falsch zu machen. Dieser Einsteigerleitfaden erklärt Fine-Tuning: ein bereits trainiertes Basismodell zu nehmen, es mit auf den eigenen Zweck zugeschnittenen Daten weiter zu trainieren und in ein spezialisiertes Modell umzuformen, das „Verhalten" (Hausstil, Ausgabeformat, Fachsprache) in das Modell selbst einbrennt, indem es dessen Gewichte umschreibt. Fine-Tuning ist gut darin, Verhalten zu ändern, aber schlecht darin, aktuelles Wissen zu merken — daher die Regel: „Fakten und Wissen → RAG, Persönlichkeit und Schablone → Fine-Tuning, Prompts zuerst." Wie Fachleute anmerken, lassen sich rund 80 % der Fälle von „wir brauchen Fine-Tuning" durch besseres Retrieval (RAG) oder Prompting lösen, also zählt die Reihenfolge. Der Artikel behandelt, was Fine-Tuning ist (mit einer Analogie zur Einarbeitung neuer Mitarbeiter), wofür es taugt und wofür nicht, eine Vergleichstabelle Fine-Tuning vs. RAG vs. Prompting, die wichtigsten Methoden (Full Fine-Tuning, LoRA und QLoRA — 4-Bit-Quantisierung, leicht genug für Einsteiger), was du brauchst (500+ hochwertige Beispiele als Richtwert, wobei der Aufbau der Daten die eigentliche Arbeit ist; Kosten von $5.000 bis über $50.000, OpenAI-Fine-Tuning bei rund $25–$100 pro Million Trainings-Tokens; Werkzeuge wie OpenAI, Unsloth, Axolotl und Hugging Face) und in welcher Reihenfolge man beginnt. Fine-Tuning ist das letzte Mittel.

Was ist Spec-Driven Development (SDD)? Die vier Schritte, Tools und der Unterschied zum Vibe Coding

Was ist Spec-Driven Development (SDD)? Die vier Schritte, Tools und der Unterschied zum Vibe Coding

In einer Zeit, in der die KI den Code schreibt, verschiebt sich die wertvollere Fähigkeit vom „Code schreiben" zum „die Spezifikation schreiben" — und die Praxis, die das auf den Punkt bringt, ist Spec-Driven Development (SDD). SDD stellt die Spezifikation als maßgebliche Quelle in den Mittelpunkt des Projekts, und ein KI-Agent leitet daraus Design, Aufteilung und Implementierung ab, statt sofort zu programmieren. Entscheidend ist, dass jeder Schritt ein Dokument (oft Markdown) hinterlässt, das der nächste Schritt liest. Dieser einsteigerfreundliche Leitfaden erklärt, was SDD ist (die Spezifikation ist maßgeblich, der Code ein Derivat), warum es jetzt zählt (es verhindert die „Drei-Monats-Mauer" aus technischen Schulden und Anforderungsdrift des Vibe Coding schon in der Entwurfsphase — GitHub berichtet von rund einer Größenordnung weniger „von Grund auf neu generieren"-Zyklen), die grundlegenden vier Schritte (Specify → Plan → Tasks → Implement), die wichtigsten Tools (GitHub Spec Kit mit über 90.000 Sternen und mehr als 30 unterstützten Agenten, AWS Kiro mit seinem Requirements → Design → Tasks-Ablauf und Auto-Router sowie BMAD, OpenSpec, Tessl, Google Antigravity und Cursor), wann man es im Vergleich zum Vibe Coding einsetzt (ein Hybrid: Vibe zum Erkunden, spezifikationsgetrieben zum Ausliefern, mit verpflichtendem menschlichem Review) und wie Sie es noch heute ausprobieren. Im KI-Zeitalter steigen jene auf, die präzise definieren können, was gebaut werden soll — nicht jene, die am schnellsten Code schreiben.

Was ist Context Engineering? Die nächste Fähigkeit nach Prompts und wie man „Context Rot" besiegt

Was ist Context Engineering? Die nächste Fähigkeit nach Prompts und wie man „Context Rot" besiegt

Der Schwerpunkt der Arbeit mit KI verschiebt sich vom Prompt Engineering zum Context Engineering. In Anthropics Worten ist Context Engineering „die Gesamtheit der Strategien, um den optimalen Satz an Tokens (Informationen) zu kuratieren und zu pflegen, den man dem Modell während der Inferenz übergibt" — und umfasst nicht nur den Prompt, sondern alles im Kontextfenster: den System-Prompt, Tools, den Gesprächsverlauf und externe Daten. Es zählt wegen „Context Rot": Je mehr Tokens Sie hinzufügen, desto stärker sinkt tatsächlich die Genauigkeit. Chromas Studie von 2025 testete 18 führende Modelle (GPT, Claude, Gemini und weitere), und jedes verschlechterte sich, je länger die Eingabe wurde, wobei Informationen in der Mitte langer Kontexte besonders leicht übersehen werden („lost in the middle"). Dieser einsteigerfreundliche Leitfaden erklärt, was Context Engineering ist und wie es zum Prompt Engineering steht, warum Context Rot entsteht (Aufmerksamkeit ist ein begrenztes Budget), was tatsächlich im Kontext steckt, sechs zentrale Techniken (Anweisungen auf der richtigen Flughöhe, Tool-Kuratierung, Just-in-time-Abruf, Compaction/Verdichtung durch Zusammenfassung, Notizen als externes Gedächtnis und Isolation per Sub-Agent), das Verhältnis zu RAG und Claude Skills sowie Gewohnheiten für heute, etwa eine neue Sitzung zu starten, wenn das Thema wechselt, und nur die Kernpunkte einzufügen. Der Kerngedanke: nur die kleinste, signalstärkste Menge an Tokens behalten.

Claude Fable 5 fürs Coding: Benchmarks, wann statt Opus 4.8 und die Kostenrealität

Claude Fable 5 fürs Coding: Benchmarks, wann statt Opus 4.8 und die Kostenrealität

Claude Fable 5, am 9. Juni 2026 als Anthropics erstes öffentlich verfügbares Modell der Mythos-Klasse veröffentlicht, wird hier ausschließlich fürs Coding betrachtet (der vollständige Release steht in einem eigenen Artikel). Kurzfassung: Fable 5 setzt sich umso deutlicher ab, je schwerer das Coding wird. Es erreicht 95,0 % auf SWE-bench Verified und 80,3 % auf dem härteren SWE-bench Pro (gegenüber Opus 4.8 69,2 % und GPT-5.5 58,6 %) sowie 29,3 % auf dem schwersten FrontierCode Diamond (gegenüber Opus 13,4 % und GPT-5.5 5,7 %, ~5x GPT), während Terminal-Bench 2.1 mit 84,3 % ein enges Rennen ist (GPT-5.5 bleibt über die Codex CLI konkurrenzfähig). Der Artikel liefert eine Drei-Punkte-Entwicklerzusammenfassung (am stärksten bei schweren Problemen / fertig in weniger Durchläufen / aber teuer und läuft weiter), eine vergleichende Benchmark-Tabelle samt Lesehilfe (je härter der Benchmark, desto größer der Abstand; Terminal-Arbeit ist eng), die effort-Skalierung (low 11,5 % bis max 30,9 %, während GPT-5.5 bei 5-6 % stagniert; je länger und komplexer die Aufgabe, desto größer der Vorsprung; fünf parallele Agenten erreichten Berichten zufolge eine Bestehensquote von 60 % bei verdeckten Tests 3,2x schneller als ein einzelner), worin es wirklich gut ist (große Refactorings über viele Dateien, lange autonome Agent-Läufe, Frontend aus einem Screenshot, API-Design plus Tests plus Doku; Simon Willison bewertete das Ergebnis als mehrere Tage Arbeit und nannte es zugleich langsam und teuer mit über 110 $ in 5,5 Stunden), Schwächen (~2x der Preis von Opus 4.8 bei $10/$50, komplexe Sessions mit 500k-1M tokens, verschätzt sich beim Anhalten und läuft weiter, Code-Review-Genauigkeit hinter Opus, Sicherheitsklassifizierer fallen bei rund 20 % der Terminal-Bench-Versuche auf Opus 4.8 zurück, und eine Tendenz, getestet zu melden ohne auszuführen), Routing-Empfehlungen (standardmäßig Opus 4.8, die schwersten 10-20 % an Fable 5 eskalieren, Terminal-Arbeit an GPT-5.5, per Modell-ID umschaltbar) sowie wo es nutzbar ist (Claude Code, GitHub Copilot, AWS Bedrock, Azure Foundry, Databricks, Anthropic API) mit Preisen, einem 1M-token-Kontext, 128k maximaler Ausgabe und dem kostenlosen Zeitfenster vom 9.-22. Juni. Fable 5 für den schweren Einzelfall, Opus 4.8 für den Großteil der täglichen Arbeit. Die Werte sind aus Anthropic- und Drittberichten zitiert und Richtungswerte, scaffold-abhängig.

Was ist der Claude-Code-Befehl /loop? Nutzung, Polling und Scheduling im Vergleich

Was ist der Claude-Code-Befehl /loop? Nutzung, Polling und Scheduling im Vergleich

„Sag mir, wenn der Build fertig ist." „Wenn CI rot wird, behebe es." „Beobachte das Deployment alle 5 Minuten." Diese fesselnden Routinearbeiten vollständig an die KI abzugeben, ermöglicht der Befehl /loop, der Claude Code 2026 hinzugefügt wurde. Dieser Einsteiger-Leitfaden erklärt, dass /loop ein sitzungsgebundener Scheduler ist, der einen Prompt oder Slash-Befehl wiederholt in einem von dir (oder der KI) festgelegten Intervall ausführt, und behandelt dann die vier Anwendungsweisen (① /loop 5m X = festes cron-Intervall ② /loop X = Self-Pacing, bei dem die KI das Intervall beurteilt ③ /loop 15m = der integrierte Wartungs-Prompt ④ /loop = Auto-Wartung), wie man Intervalle schreibt (Zahl + Einheit s/m/h/d, Minimum 1 Minute, natürliche Sprache wie „every 2 hours", und du kannst einen Slash-Befehl in einer Schleife laufen lassen: /loop 20m /review-pr 1234), die Stärke des Self-Pacing (kürzere Wartezeiten bei Aktivität, längere bei Ruhe, zwischen 1 Minute und 1 Stunde, und — anders als schlichtes cron — beendet es die Schleife automatisch, sobald es die Aufgabe als erledigt beurteilt), praktische Rezepte (CI/Deployment beobachten, PR betreuen, lange Builds prüfen, Erinnerungen, Branch-Auto-Wartung), wie man es stoppt und die Vorsichtsmaßnahmen (Esc zum Stoppen, sitzungsgebunden, sodass eine neue Konversation es löscht, das Schließen des Terminals stoppt es, feste Intervalle dauern bis zu 7 Tage, max. 50 Aufgaben pro Sitzung, feuert zwischen Turns mit Jitter, lokale Zeitzone), wie man unter drei Scheduling-Funktionen wählt (/loop für In-Session-Überwachung, Desktop scheduled tasks für residente lokale Arbeit, Routines für unbeaufsichtigten Cloud-Betrieb) sowie loop.md-Anpassung plus Deaktivierung über CLAUDE_CODE_DISABLE_CRON=1 — alles basierend auf der offiziellen Dokumentation (Stand 2026). Was /loop verändert, ist die Zeitachse der Arbeit, die du an die KI abgeben kannst.

Spitzen-KI-Ingenieur werden (AI-native Developer): Fähigkeiten & Roadmap

Spitzen-KI-Ingenieur werden (AI-native Developer): Fähigkeiten & Roadmap

Stehst du auf der Seite, der die KI den Job wegnimmt, oder auf der Seite, die die KI nutzt, um die Arbeit von zehn Leuten zu erledigen? 2026 ist das die Weggabelung für Entwickler. Dieser Artikel rahmt das Werden eines „AI-native Developers" (Apps mit LLMs, Agenten, RAG bauen — zu unterscheiden vom Erforschen der Modelle) als baubaren Fähigkeits-Stapel, nicht als Doktortitel, in drei Ebenen: ① das unveränderliche Fundament (Python als Hauptsprache der KI-Entwicklung, Git, Kommandozeile, HTTP/REST/JSON — Grundlagen braucht man auch im Zeitalter KI-geschriebenen Codes); ② die 5 zentralen AI-native Fähigkeiten (Prompt-/Kontext-Design, RAG als Rückgrat von Enterprise-Agenten, Agenten bauen, MCP als De-facto-Standard der Tool-Anbindung und Eval-Design — plus Kostenoptimierung, Guardrails, Beobachtbarkeit); ③ der Vorsprung, den die meisten übersehen — Eval-Design und Context Engineering (Evals schreiben zu können ist das stärkste Signal für „wirklich mit LLMs gebaut", und eine AGENTS.md/CLAUDE.md plus ein kleines Eval-Set ist der Sprung von „unterstützt" zu „native"). Hinzu kommen eine 8–12-Monats-Roadmap (Fundament → LLM-API/Prompting → RAG ohne Frameworks bauen → Agenten + MCP → Evals + Deployment + Veröffentlichung), eine Portfolio-Strategie, bei der deployte Arbeit ein Diplom schlägt, Fallstricke (Tutorial-Sumpf, Tool-Sammelwut, vernachlässigte Grundlagen) und Markt-/Nachfragezahlen (US-basiert, große regionale Variation). Die Grenze ist, ob du die KI als System nutzt.

Der komplette Leitfaden zur Kostenoptimierung beim KI-Coding: Senken Sie Ihre Rechnung um 70–85 %

Der komplette Leitfaden zur Kostenoptimierung beim KI-Coding: Senken Sie Ihre Rechnung um 70–85 %

„Die API-Rechnung vom letzten Monat … 1.800 $?" 2026 wurde berichtet, dass der ernsthafte Betrieb von Claude Code als Agent 500–2.000 $ im Monat erreicht. Doch allein indem Sie ändern, wie Sie es nutzen, können Sie die Kosten um 70–85 % senken, ohne die Ausgabequalität zu mindern (mehrere Praxisberichte konvergieren hier). Dieser Leitfaden entschlüsselt zuerst das wahre Gesicht hoher Kosten (teures Modell, langer Kontext, verschwendete Aufrufe; wie die Token-Abrechnung funktioniert; Agenten, die etwa das 7-Fache einer einzelnen Session verbrauchen), dann den Break-even von Abo vs. API (die API gewinnt grob nur unter 50 Sessions im Monat; eine Schätzung beziffert Abos auf bis zu 36x günstiger bei täglicher Nutzung), einen Preisüberblick (Copilot Pro 10 $ / Cursor Pro 20 $, bei intensiver Nutzung 60–100 $ / Claude Pro 20 $, Max 100 $; Copilot wechselte am 1. Juni 2026 zu nutzungsbasierten AI Credits), sechs Hebel zur Kostensenkung (① Modell-Routing für 40–70 % weniger ② Prompt-Caching mit etwa 90 % Rabatt bei 60–80 % Trefferquote ③ Kontext-Management ④ Wahl von Abo vs. API ⑤ Prüfung doppelter Abos ⑥ Memory-Funktionen), eine Spar-Checkliste für heute und Fallstricke — falsche Sparsamkeit, versteckte Arbeitskosten, doppelte Abrechnung, Zähler-Schock, übermäßiges Vertrauen in den Cache — plus empfohlene Setups nach Typ. Optimierung ist kein Geizen; sie ist die Gestaltung, für das Richtige den richtigen Betrag zu zahlen.

Vektor-DB / RAG-Implementierungsleitfaden — von naivem RAG zum Produktivbetrieb

Vektor-DB / RAG-Implementierungsleitfaden — von naivem RAG zum Produktivbetrieb

Sie wissen, „was RAG ist", doch beim Bauen kommt die Antwort schief heraus — weil es noch naives RAG ist: achtlos zerstückeln und eine einfache Vektorsuche durchführen. Als Implementierungs-Fortsetzung zu Artikel 030 erklärt dieser Beitrag die praxistaugliche RAG-Pipeline von 2026 (intelligentes Chunking, Embedding, Vektor-DB, hybride Suche, Reranking) Stufe für Stufe: Chunking-Strategien (recursive 512 als Standard, semantic/structural/parent-child, Contextual Retrieval senkt Retrieval-Fehler Berichten zufolge um bis zu 67%), Auswahl eines Embedding-Modells (text-embedding-3-large usw.), ein Vergleich von sechs Vektor-DBs (Chroma fürs Prototyping, pgvector mit Postgres, niedrig-latentes Qdrant, vollständig verwaltetes Pinecone, Hybrid-Champion Weaviate, großskaliges Milvus), hybride Suche, die BM25 + dichte Vektoren mit RRF verschmilzt, retrieve-then-rerank mit bi-encoder und dann cross-encoder (Cohere/Voyage/BGE/Jina), die Aufteilung LlamaIndex (Retrieval) vs. LangChain/LangGraph (Steuerung), warum ein 1M-Token-Fenster RAG nicht ersetzt (lost in the middle, Ablenkung) und Hinweise für den Produktivbetrieb wie zuerst eine Evaluations-Menge aufzubauen.

Wie man einen KI-Agenten baut — ein Anfänger-Guide (No-Code und Code)

Wie man einen KI-Agenten baut — ein Anfänger-Guide (No-Code und Code)

Du weißt, „was ein KI-Agent ist“ — aber wie baust du selbst einen? 2026 lässt dich No-Code per Drag-and-drop an einem Nachmittag einen funktionierenden Agenten zum Laufen bringen, und moderne SDKs lassen dich einen praktischen in unter 100 Zeilen zusammenbauen. Als praktische Ergänzung zu „was ein KI-Agent ist“ behandelt dieser Artikel die Anatomie (Gehirn-LLM + Anweisungen + Tools + Gedächtnis + autonome Schleife), die zwei Wege (No-Code vs. Code), das universelle 5-Schritte-Bau-Framework (Problem eingrenzen, Basis wählen, Anweisungen schreiben, Tools anbinden, klein testen), einen No-Code-Tool-Vergleich (Dify als komplette Plattform, n8n für Geschäftsintegration, Flowise fürs Prototyping und die einfachsten Custom GPT/Gemini Gems/Claude Projects), einen Code-Framework-Vergleich (solides Claude Agent SDK/OpenAI Agents SDK, komplex steuerndes LangGraph, rollenkoordinierendes CrewAI), ein konkretes durchgerechnetes Beispiel (Support-E-Mail zusammenfassen und dann in Slack benachrichtigen), Kosten (~$10-$50/Monat Plattform plus Modellnutzung) und Zeitrahmen sowie Stolpersteine (den Umfang nicht überdehnen, Berechtigungen und Kontrolle über Ausreißer, Vorsicht vor „nur PoC“). Für die meisten Menschen ist es der richtige Schritt, zuerst einen mit No-Code zu bauen.

Häufige Claude-Code-Fehler und ihre Lösungen — Die vollständige Referenz

Häufige Claude-Code-Fehler und ihre Lösungen — Die vollständige Referenz

Claude Code bricht plötzlich ab mit „melde dich neu an", „Rate-Limit", „Prompt ist zu lang", „MCP verbindet sich nicht" — und jeden Fehler einzeln zu googeln wird mühsam. Dies ist eine praxisnahe Referenz, die die häufigen Fehler katalogisiert, jeweils mit Ursache und dem auszuführenden Befehl. Sie beginnt mit den drei Diagnosebefehlen, die man zuerst ausführt (claude doctor für die Volldiagnose, /status für die aktive Authentifizierung, /context für die Kontext-Aufschlüsselung), und konzentriert sich dann auf die vier häufigen Familien (Nutzung/Rate-Limits, Kontext-Überlauf, abgelaufene Authentifizierung, MCP-Verbindungsfehler) mit Symptom→Ursache→Lösungsbefehl-Tabellen zu Authentifizierung und Login, Nutzung/Rate-Limits (Claude Code verbraucht das 10- bis 100-Fache der Tokens eines Chats), Kontext und Tokens (Prompt zu lang, Compaction-Thrashing), Server und Modell (500/529/Timeout/model not found), Installation/PATH/Update, Netzwerk und Proxy (ECONNREFUSED, TLS), MCP, Berechtigungen (Deny schlägt Bypass) und Sonstiges (thinking blocks 400, Bild/PDF, IDE). Sie endet mit einem Spickzettel Fehler→Lösung und einer FAQ. Basierend auf der offiziellen Claude-Code-Doku (Stand 2026): bei Problemen die drei Diagnosebefehle ausführen, und wenn es nicht behoben ist, claude update ausführen.