Jusqu'où l'IA peut-elle automatiser le navigateur ? La réalité des formulaires, réservations et recherches
« J'ai demandé à une IA et elle a ouvert le navigateur, fait des recherches, et même rempli un formulaire. » En 2026, ce n'est plus une démo mise en scène : les navigateurs agentiques (ChatGPT Atlas, Claude for Chrome, Gemini/Chrome, Perplexity Comet) sont arrivés d'un seul coup. Alors jusqu'où peuvent-ils réellement automatiser ? La réalité se découpe nettement en trois paliers. (1) Recherche = prête pour la production : sur WebVoyager (vrais sites), les meilleurs agents atteignent 89-98 %, proche de la saturation, et comme une mauvaise action coûte peu, c'est par là qu'il faut commencer à déléguer. (2) Remplissage de formulaires = faisable mais à vérifier : la saisie elle-même est prise en charge, mais les agents peuvent mal étiqueter des champs ou cliquer sur le mauvais bouton, si bien que « l'IA rédige, un humain envoie » est sûr, et beaucoup de produits comme Atlas demandent confirmation avant les actions importantes. (3) Réservation/paiement = à faire encore soi-même : les agents trébuchent sur les CAPTCHA, les paiements JavaScript complexes, l'authentification à deux facteurs et la gestion de session, et sur WebArena (tâches complexes multi-étapes) même les meilleurs tournent à ~47-68 % contre une barre humaine d'environ 78 % ; la raison même pour laquelle OpenAI a fermé l'Operator autonome (2025/8/31) était le manque de fiabilité du paiement. L'article cadre d'abord les deux approches (navigateur/extension grand public vs API/OSS développeur), puis cartographie les acteurs 2026 (Atlas, navigateur dédié qui ne peut ni exécuter de code ni lire de mots de passe par conception ; Claude for Chrome, panneau latéral en extension ; le Project Mariner de Google a pris fin le 2026/5/4 et a été intégré à Gemini/Chrome ; Operator a migré dans ChatGPT Agent et l'Agents SDK ; l'OSS browser-use à plus de 78k étoiles). Il explique les quatre obstacles qui font échouer la réservation (protections anti-bot, paiement complexe, 2FA, coût de l'annulation), puis creuse le plus grand piège : l'injection de prompt indirecte (Perplexity Comet s'est montré vulnérable au vol d'identifiants zéro clic et l'a corrigé en février 2026 ; la réussite des attaques de 23,6 % avant défenses tombe à ~11 % avec des défenses de base et ~1 % avec les plus fortes, toujours non nul). Il se clôt sur cinq principes de sécurité (commencer en lecture seule, un humain valide envois/paiements, ne jamais confier de mots de passe, ne pas lancer sur des sites non fiables, moindre privilège dans un profil dédié). Un excellent partenaire de recherche ; faites vous-même les actions qui font bouger l'argent. Les chiffres sont cités de sources publiques et d'annonces à titre indicatif.