Wie weit kann KI Browser-Aufgaben automatisieren? Die Realität von Formularen, Buchungen und Recherche
"Ich habe eine KI gefragt, und sie hat den Browser geöffnet, Dinge nachgeschlagen und sogar ein Formular ausgefüllt." 2026 ist das keine inszenierte Demo mehr: Agentische Browser (ChatGPT Atlas, Claude for Chrome, Gemini/Chrome, Perplexity Comet) kamen auf einen Schlag. Doch wie weit reicht die Automatisierung wirklich? Die Realität teilt sich sauber in drei Stufen. (1) Recherche = praxisreif: Auf WebVoyager (echte Sites) erreichen Spitzen-Agenten 89-98%, nahe der Sättigung, und da ein Fehler kaum etwas kostet, sollten Sie hier mit dem Delegieren beginnen. (2) Formulare = machbar, aber prüfen: Die Eingabe selbst wird unterstützt, doch Agenten können Felder falsch zuordnen oder den falschen Absenden-Button treffen, daher ist "die KI entwirft, ein Mensch sendet ab" sicher, und viele Produkte wie Atlas bitten vor wichtigen Aktionen um Bestätigung. (3) Buchen/Bezahlen = selbst erledigen: Agenten stolpern über CAPTCHAs, komplexe JavaScript-Checkouts, Zwei-Faktor-Auth und Sitzungsverwaltung, und auf WebArena (komplexe mehrstufige Aufgaben) erreichen selbst die Besten nur ~47-68% gegenüber einer menschlichen Basislinie von ~78%; der eigentliche Grund, warum OpenAI das eigenständige Operator einstellte (2025/8/31), war die Unzuverlässigkeit des Checkouts. Der Artikel rahmt zunächst die zwei Ansätze (Verbraucher-Browser/Erweiterung vs. Entwickler-API/OSS), kartiert dann die Anbieter 2026 (Atlas als eigenständiger Browser, der per Design keinen Code ausführt und keine Passwörter liest; Claude for Chrome als Erweiterungs-Seitenleiste; Googles Project Mariner endete 2026/5/4 und ging in Gemini/Chrome auf; Operator wanderte in ChatGPT Agent und das Agents SDK; OSS browser-use mit über 78k Sternen). Er erklärt die vier Hürden, an denen Buchungen scheitern (Bot-Abwehr, komplexer Checkout, 2FA, die Kosten des Rückgängigmachens), und vertieft dann die größte Falle: die indirekte Prompt Injection (Perplexity Comet erwies sich als anfällig für Zero-Click-Diebstahl von Zugangsdaten und behob dies im Februar 2026; ein Angriffserfolg von 23.6% vor Abwehr sinkt auf ~11% mit grundlegender und ~1% mit der stärksten, bleibt aber nicht null). Er schließt mit fünf Sicherheitsgrundsätzen (mit Nur-Lesen beginnen, ein Mensch gibt Sendungen/Zahlungen frei, niemals Passwörter übergeben, nicht auf nicht vertrauenswürdigen Sites laufen lassen, geringste Rechte in einem dedizierten Profil). Ein hervorragender Recherchepartner; die geldbewegenden Aktionen erledigen Sie selbst. Die Zahlen stammen als Richtwerte aus öffentlichen Materialien und Ankündigungen.