¿Hasta dónde puede automatizar la IA las tareas del navegador? La realidad de formularios, reservas e investigación
"Le pedí algo a una IA y abrió el navegador, lo buscó por su cuenta e incluso rellenó un formulario por mí." En 2026 esto ya no es una demo preparada: los navegadores agénticos (ChatGPT Atlas, Claude for Chrome, Gemini/Chrome, Perplexity Comet) llegaron todos a la vez. Así que, ¿hasta dónde pueden automatizar realmente? La realidad se divide con nitidez en tres niveles. (1) Investigación = lista para producción: en WebVoyager (sitios reales) los mejores agentes alcanzan el 89-98%, casi saturando el benchmark, y como una acción errónea cuesta poco, es por aquí por donde empezar a delegar. (2) Rellenar formularios = factible pero verifica: la introducción de datos está soportada, pero los agentes pueden etiquetar mal los campos o pulsar el envío equivocado, así que "la IA redacta, una persona envía" es lo seguro, y muchos productos como Atlas piden confirmación antes de acciones importantes. (3) Reserva/pago = mejor hazlo tú: los agentes tropiezan con CAPTCHA, checkouts complejos de JavaScript, autenticación de dos factores y gestión de sesiones, y en WebArena (tareas complejas de varios pasos) hasta los mejores rondan el ~47-68% frente al ~78% de referencia humana; la verdadera razón por la que OpenAI cerró el Operator independiente (2025/8/31) fue la falta de fiabilidad del checkout. El artículo primero plantea los dos enfoques (navegador/extensión de consumidor frente a API/OSS de desarrollador), luego mapea los protagonistas de 2026 (Atlas como navegador dedicado que no puede ejecutar código ni leer contraseñas por diseño; Claude for Chrome como panel lateral de extensión; el Project Mariner de Google terminó el 2026/5/4 e integrado en Gemini/Chrome; Operator pasó a ChatGPT Agent y al Agents SDK; el OSS browser-use con más de 78k estrellas). Explica los cuatro muros que hacen fallar la reserva (defensas antibots, checkout complejo, 2FA, el coste de deshacer), y profundiza en la mayor trampa: la inyección indirecta de prompts (se demostró que Perplexity Comet era vulnerable al robo de credenciales zero-click y lo corrigió en febrero de 2026; el éxito del ataque del 23.6% antes de las defensas baja al ~11% con defensas básicas y al ~1% con las más fuertes, sin llegar nunca a cero). Cierra con cinco principios de seguridad (empezar en solo lectura, que una persona apruebe envíos/pagos, no entregar contraseñas, no ejecutar en sitios no confiables, mínimo privilegio en un perfil dedicado). Un excelente compañero de investigación; las acciones que mueven dinero, hazlas tú mismo. Las cifras se citan de materiales públicos y anuncios como referencias orientativas.