Multi-Agent-System bauen: Leitfaden in 5 Schritten

Wie man ein Multi-Agent-System baut: Praxisleitfaden zum supervisor-Muster

Inhalt

1. Vor dem Bau: Braucht es wirklich Multi?
2. Die Grundform: supervisor (der Standard 2026)
3. In 5 Schritten bauen
4. Minimales Codebeispiel (Pseudocode)
5. Häufige Fallstricke und Lösungen
Fazit
FAQ

Sobald Sie das Konzept der „Koordination mehrerer KIs“ in Was ist ein Multi-Agent-System? verstanden haben, lautet die nächste Frage: Wie baut man so etwas konkret. Dieser Artikel führt anhand des De-facto-Standards von 2026 – des supervisor-Musters – Anfänger durch einen praxisorientierten 5-Schritte-Prozess.

Bevor wir über Frameworks reden, hier das wichtigste Prinzip: „Baue zuerst mit einem einzelnen Agenten und füge erst dann – minimal – weitere hinzu, wenn du an eine Grenze stößt.“ Von Anfang an auf Multi zu setzen ist meist Over-Engineering. Der Code wird als framework-unabhängiger Pseudocode gezeigt, gilt also egal ob Sie MCP oder ein beliebiges SDK verwenden.

MULTI-AGENT BAUEN · 5 SCHRITTE

Klein bauen, messen, dann erweitern

— Das supervisor-Muster, aus einem minimalen Setup

1Die Aufgabe zerlegen

2Worker definieren (bis zu 3-5)

3Den supervisor entwerfen

4Handoff und Kontextteilung festlegen

5Messen und mit Obergrenzen betreiben

* Schritte und Zahlen in diesem Artikel stammen aus öffentlichen Materialien, Praxisleitfäden und Forschungsberichten (Stand Juni 2026). Der Code ist konzeptioneller Pseudocode; die tatsächliche API entnehmen Sie der offiziellen Dokumentation des jeweiligen Frameworks.

1. Vor dem Bau: Braucht es wirklich Multi?

Die erste Hürde ist nicht technischer Natur – sie ist eine Entscheidung. Multi-Agent ist mächtig, aber für rund 80% der Anwendungsfälle reicht ein einzelner Agent. Trifft keiner der folgenden Punkte zu, bauen Sie zuerst mit einem einzelnen Agenten.

3 Anzeichen, dass Sie auf Multi setzen sollten

Aufteilung nach Fachgebieten: Das Wissen passt nicht in einen einzigen Prompt (Domänen erstrecken sich über Recherche, Recht, Code usw.)
Parallelität: Mehrere Aufgaben gleichzeitig zu erledigen ist klar schneller
Trennung von Entscheidungen: Die Qualität steigt, wenn man „Ausführenden“ und „Prüfer“ trennt

Umgekehrt gilt: Multi für einen einfachen, linearen Ablauf zu nutzen – wie beim letzten Mal beschrieben – treibt die Kosten um das 3-10-Fache in die Höhe und senkt bei sequenziellen Aufgaben sogar die Genauigkeit (Google-Forschung berichtet -39-70% gegenüber Single). Gehen Sie von der Prämisse aus: „Mehr Agenten bedeutet nicht klüger.“

2. Die Grundform: supervisor (der Standard 2026)

Wenn Sie unsicher sind, welches Muster Sie bauen sollen, nehmen Sie das supervisor-Muster, Punkt. Claude Code subagents, LangGraph Supervisor, OpenAI Agents SDK handoffs – die wichtigsten Implementierungen sind allesamt auf diese Form konvergiert. Die Gründe liegen klar auf der Hand.

Breiteste Framework-Unterstützung

Native Unterstützung in allen wichtigen Frameworks. Reichlich Referenzimplementierungen.

Bekannter Fehlermodus

Der Hauptfehler ist „Über-Delegation“, begrenzt durch eine Iterations-Obergrenze.

Leicht auditierbar

„Wer hat was getan“ ist klar, was das Debuggen erleichtert.

Die Mechanik ist einfach. Der supervisor empfängt die Gesamtaufgabe, zerlegt sie in Teilaufgaben, delegiert sie an spezialisierte worker und fasst die Ergebnisse zusammen. Der supervisor muss nicht wissen, wie ein worker seine Arbeit erledigt – nur welchen worker er aufruft und in welchem Ausgabeformat. Das Fachwissen sitzt in den workern.

3. In 5 Schritten bauen

Stellen Sie ein minimales supervisor-Setup in fünf Schritten zusammen. Die Faustregel: Beginnen Sie mit 2-3 workern und fügen Sie nur dann weitere hinzu, wenn die Messung es rechtfertigt.

SCHRITT 1. Die Aufgabe zerlegen

Schreiben Sie das „Endziel“ und die benötigten „Fachrollen“ auf. Beispiel: für einen Marktforschungsbericht „1) Infos sammeln → 2) analysieren → 3) schreiben → 4) Fakten prüfen“. Zerlegen Sie vorab klar – Unschärfe an dieser Stelle bringt das Ganze zum Einsturz.

SCHRITT 2. Worker definieren (bis zu 3-5)

Geben Sie jedem worker eine Rolle, die nötigen Tools und ein Ausgabeformat. Seien Sie am Anfang nicht gierig – höchstens 3-5. Jeder worker ist unabhängig und hält nur seine eigenen Tools (Suche, Codeausführung usw.).

SCHRITT 3. Den supervisor entwerfen

Listen Sie im Prompt des supervisor die Namen der worker, die er aufrufen darf, explizit auf (eine harte Obergrenze). Der Trick: Verwenden Sie mehr Zeit auf den supervisor als auf einen einzelnen worker. Das bestimmt die Gesamtqualität.

SCHRITT 4. Handoff und Kontextteilung festlegen

Definieren Sie, was zwischen workern übergeben wird und in welchem Format. Den vollständigen Kontext an alle weiterzugeben bläht die Tokens auf, also geben Sie nur die nötigen Informationen weiter. Das Standardprotokoll für die Koordination zwischen Agenten ist A2A.

SCHRITT 5. Messen und mit Obergrenzen betreiben

Instrumentieren Sie jeden Handoff, bevor Sie Agenten hinzufügen (Beobachtbarkeit ist nicht optional). Setzen Sie Obergrenzen für Iterationen, Tokens und Kosten. Richten Sie zugleich evals und Guardrails ein.

4. Minimales Codebeispiel (Pseudocode)

Der Kern des supervisor-Musters ist überraschend kurz. Hier ein framework-unabhängiger Pseudocode, der die Schleife zeigt, in der der supervisor einen worker auswählt und ausführt (die tatsächliche API entnehmen Sie der offiziellen Dokumentation des jeweiligen SDK).

# Worker definieren: eine Rolle + dedizierte Tools
workers = {
  "researcher": Agent(tools=[web_search]),
  "writer":     Agent(tools=[]),
  "factcheck":  Agent(tools=[web_search]),
}

# Supervisor: harte Obergrenze fuer die aufrufbaren Worker-Namen
supervisor = Agent(
  instructions="Decompose the goal and pick one worker to call next. "
               "Return 'DONE' when finished.",
  allowed_workers=["researcher", "writer", "factcheck"],
)

# Ausfuehrungsschleife (eine Iterations-Obergrenze verhindert Ueber-Delegation)
state = {"goal": "Write an AI market report", "history": []}
for step in range(MAX_STEPS):          # <- eine Obergrenze ist unverzichtbar
  next_worker = supervisor.decide(state)
  if next_worker == "DONE":
    break
  result = workers[next_worker].run(state)
  state["history"].append({next_worker: result})   # nur noetigen Kontext teilen
  log_handoff(next_worker, result)     # <- jeden Handoff instrumentieren

Drei Erkenntnisse: 1) jeder worker ist eine Rolle + dedizierte Tools, 2) die aufrufbare Menge des supervisor ist begrenzt, 3) die Schleife hat immer eine Iterations-Obergrenze. Ergänzen Sie dieses Grundgerüst um Messung, Guardrails und evals, nähern Sie sich Produktionsqualität. Claude Agent SDK und Claude Code subagents folgen derselben Idee.

5. Häufige Fallstricke und Lösungen

Die Stellen, an denen man bei der Multi-Agent-Entwicklung stolpert, sind ziemlich vorhersehbar. Kommen Sie ihnen zuvor.

Fallstrick	Lösung
Über-Delegation (supervisor läuft endlos)	Iterations-Obergrenze + aufrufbare worker begrenzen
Token-Aufblähung (Kosten 3-10x)	Vollkontext-Teilung beenden; nur Nötiges weitergeben + Cache
Instabiles, nicht-deterministisches Verhalten	worker gering halten (3-5) + Ausgabeformate fixieren
Genauigkeitsverlust bei sequenziellen Aufgaben (-39-70%)	Bei linearer Arbeit zum einzelnen Agenten zurückkehren
Unklar, wo es fehlschlug	Jeden Handoff vor dem Skalieren instrumentieren (Beobachtbarkeit)

Die gemeinsame Lektion: „Prompts, Tool-Design und das eval-Harness entscheiden mehr über den Erfolg als das Framework.“ Statt einer auffälligen Architektur ist am Ende die Disziplin am schnellsten, klein zu bauen, zu messen und nur dann zu erweitern, wenn es sich lohnt.

Fazit

Ein Multi-Agent-System zu bauen ist nicht beängstigend, wenn Sie mit dem supervisor-Muster aus einem minimalen Setup beginnen. Fassen wir zusammen.

Die wichtigsten Erkenntnisse

🚦 Zuerst Single. Fügen Sie Agenten erst hinzu, wenn Anzeichen für Spezialisierung / Parallelität / Entscheidungstrennung auftreten.
🧠 Die Grundform ist der supervisor (Standard 2026). Verwenden Sie die meiste Zeit auf den Entwurf des supervisor.
🔢 5 Schritte: zerlegen → worker definieren (3-5) → supervisor entwerfen → Handoff → messen.
⚠️ Fallstricke: Über-Delegation, Token-Aufblähung, Instabilität. Lösen mit Obergrenzen, Teilung nur des Nötigen und Messung.
📏 Disziplin: Prompts, Tools und evals entscheiden mehr über den Erfolg als das Framework.

„Klein bauen, messen, dann erweitern.“ Halten Sie diese Disziplin ein, und ein Multi-Agent-System wird zu einem leistungsstarken Partner für komplexe Arbeit. Zum Konzept siehe Was ist ein Multi-Agent-System?; zum Bau eines einzelnen Wie man einen KI-Agenten baut.

FAQ

F. Welches Muster sollte ich zuerst bauen?

A. Das supervisor-Muster, ohne Frage. Die wichtigsten Frameworks unterstützen es, sein Fehlermodus ist bekannt und Referenzimplementierungen sind am reichlichsten vorhanden. Erkunden Sie andere Muster, sobald Sie sich sicher fühlen.

F. Mit wie vielen workern sollte ich beginnen?

A. Beginnen Sie mit 2-3 und halten Sie es bei höchstens 3-5. Je mehr Sie hinzufügen, desto instabiler wird es und desto stärker explodieren die Tokens. Die Norm ist, erst dann weitere hinzuzufügen, wenn die Messung den Bedarf belegt.

F. Ist ein Framework erforderlich?

A. Nicht erforderlich. Wie der Pseudocode zeigt, lässt sich mit einer Schleife plus Prompts ein minimales Setup bauen. Wenn Sie aber in der Produktion Zustandspersistenz, Beobachtbarkeit und Wiederherstellung benötigen, ist ein unterstützendes Framework eine Abkürzung.

F. Wie verhindere ich Kostenexplosionen?

A. Drei Dinge helfen: 1) die Iterationszahl begrenzen, 2) nur den nötigen Kontext statt des vollständigen teilen und 3) Prompt-Caching nutzen. Multi kann das 3-10-Fache eines einzelnen Agenten kosten, daher sind Obergrenzen vom ersten Tag an unverzichtbar.

Wie man ein Multi-Agent-System baut: Praxisleitfaden zum supervisor-Muster

Klein bauen, messen, dann erweitern

1. Vor dem Bau: Braucht es wirklich Multi?

2. Die Grundform: supervisor (der Standard 2026)

3. In 5 Schritten bauen

4. Minimales Codebeispiel (Pseudocode)

5. Häufige Fallstricke und Lösungen

Fazit

FAQ

Ähnliche Artikel

Die 20 besten generativen KI-Tools für die Spieleentwicklung — Kunst, Musik & Coding komplett abgedeckt

Was ist das Claude Agent SDK? Komplettanleitung zur KI-Agenten-Entwicklung

Welche Frameworks sind am freundlichsten für generative KI? App-Entwicklung im Vergleich

Claude Code vs Codex: Welches Tool passt zu dir? Preise, Leistung und Einsatzgebiete im Vergleich

Kommentare

Kommentar hinterlassen