Contenido
Ejecutar un agente en producción significa levantar el bucle del agente, la ejecución de herramientas, un sandbox y la persistencia de estado, todo por tu cuenta. Claude Managed Agents te quita toda esa carga de encima: Anthropic lo ejecuta por ti. Lanzado como beta pública el 8 de abril de 2026, es un conjunto de APIs componibles para crear y desplegar agentes alojados en la nube a gran escala.
Este artículo cubre, con base en información oficial, qué es Managed Agents, en qué se diferencia del Agent SDK autoalojado, la memoria persistente y el "dreaming", la evaluación basada en resultados y el multiagente, y los precios. Los puntos clave, por adelantado. ① En lugar de "construir tu propio bucle de agente", obtienes un entorno totalmente gestionado donde Claude puede leer archivos, ejecutar comandos, navegar por la web y ejecutar código de forma segura. ② Tiene memoria persistente con alcance de workspace (montada en /mnt/memory), que un "dream" puede reorganizar y consolidar. ③ El precio es tokens + $0.08 por hora de sesión.
Anthropic se encarga de todo el "lado de ejecución"
— bucle, sandbox, estado y memoria sobre infraestructura gestionada
/mnt/memoryTú te centras en definir el agente. El precio es tokens + $0.08 por hora de sesión (solo mientras se ejecuta, medido al milisegundo).
1. ¿Qué son los Managed Agents?
En palabras de Anthropic, Managed Agents es "un conjunto de APIs componibles para crear y desplegar agentes alojados en la nube a gran escala", y la documentación lo describe como un "harness de agente preconstruido y configurable que se ejecuta en infraestructura gestionada". La esencia: "En lugar de construir tu propio bucle de agente, ejecución de herramientas y runtime, obtienes un entorno totalmente gestionado donde Claude puede leer archivos, ejecutar comandos, navegar por la web y ejecutar código de forma segura." El prompt caching, la compactación de contexto, el sandboxing y la persistencia de estado vienen integrados desde el principio.
Se organiza en torno a cuatro conceptos: Agent (la definición) / Environment (dónde se ejecuta) / Session / Events. El Environment puede ser un sandbox en la nube gestionado por Anthropic o un sandbox autoalojado en tu propia infraestructura.
2. Frente al Agent SDK (autoalojado vs. gestionado)
Lo fácil de confundir es la diferencia con el Claude Agent SDK. Ambos forman una pareja a lo largo del eje "lo ejecutas tú" vs. "lo ejecuta Anthropic".
- Tu propio harness en Python / TypeScript
- Tú operas el bucle, las herramientas y el runtime
- La infraestructura y la escala son tu responsabilidad
- Control total sobre los detalles
- El bucle, el sandbox y el estado están del lado gestionado
- La memoria persistente y el dreaming vienen integrados
- Se factura por tiempo de ejecución ($0.08/hora)
- Te centras en la definición y delegas la operación
En resumen: "¿quieres construir tu propio motor? Agent SDK. ¿Quieres alquilar el motor y centrarte en el contenido? Managed Agents." No son competidores, sino una elección sobre cuánto de la operación retienes tú mismo. Para el concepto de agentes, consulta qué es multiagente; para construir uno, cómo construir un sistema multiagente.
3. Memoria persistente y "dreaming"
Una característica distintiva de Managed Agents es la memoria persistente (un memory store). Es "una colección de documentos de texto con alcance de workspace", montada como un directorio (/mnt/memory/) dentro del sandbox de la sesión. El agente la lee y escribe con operaciones de archivo normales, y su contenido persiste entre sesiones. Cada cambio crea una versión de memoria inmutable para auditoría (retención de 30 días). Límites: 100 kB por memoria, 2.000 memorias por store, 8 stores por sesión.
Más inusual es el "dreaming". Según la descripción oficial: "Un dream lee un memory store existente junto con transcripciones de sesiones anteriores y luego produce un memory store nuevo y reorganizado: duplicados fusionados, entradas obsoletas o contradichas reemplazadas por el valor más reciente, y nuevas observaciones puestas de relieve." Es un trabajo asíncrono (de 1 a 100 sesiones de entrada, con instrucciones opcionales) que requiere un encabezado beta dedicado.
⚠️ Nota de precisión: el dreaming es una vista previa de investigación (research preview) que requiere solicitud de acceso. Algunos artículos lo llaman "proceso programado", pero la documentación oficial lo describe como un trabajo asíncrono bajo demanda que tú creas y consultas (poll). Es correcto pensarlo como "un proceso de consolidación que puedes ejecutar de forma programada", y este artículo no afirma que "Anthropic lo ejecute automáticamente".
4. Evaluación por resultados y multiagente
Una función más reciente es la evaluación basada en resultados (outcomes-based grading). Según Anthropic: "Tú escribes una rúbrica que describe cómo se ve el éxito y el agente trabaja hacia ella. Un evaluador (grader) independiente evalúa la salida frente a tus criterios en su propia ventana de contexto." Anthropic informa que "mejoró el éxito en las tareas hasta en 10 puntos respecto a un bucle de prompting estándar" (+8,4 % para docx, +10,1 % para pptx, cifras publicadas por Anthropic). Beta pública.
La orquestación multiagente también viene integrada: "Un agente líder divide el trabajo en partes y delega cada una a un especialista con su propio modelo, prompt y herramientas", ejecutándose en paralelo sobre un sistema de archivos compartido. La filosofía de diseño de orquestar agentes se hace eco de cómo construir un sistema multiagente.
5. Precios y disponibilidad
El precio tiene dos dimensiones: ① tokens (tarifas estándar del modelo, con prompt caching aplicado) + ② tiempo de ejecución de la sesión a $0.08 por hora de sesión. El tiempo de ejecución se mide al milisegundo y se factura solo mientras el estado es running (estar inactivo o reprogramando es gratis). El ejemplo trabajado de Anthropic: una sesión de Opus 4.8 de 1 hora cuesta alrededor de $0.705.
| Elemento | Detalles |
|---|---|
| Lanzamiento | 8 de abril de 2026 · beta pública (activada por defecto para todas las cuentas de API) |
| Acceso | Vía Claude Console / Platform CLI / Claude Code |
| Precio | Tokens + $0.08 / hora de sesión (solo mientras se ejecuta, medido al ms) |
| Advertencia | Con estado por diseño, por lo que no es elegible para Zero Data Retention (ZDR) ni para un HIPAA BAA |
| Memoria / dream | el dreaming es una vista previa de investigación (requiere solicitud de acceso) |
Resumen
Claude Managed Agents es un entorno totalmente gestionado donde Anthropic opera por ti el bucle del agente, la ejecución de herramientas, el sandbox y la persistencia de estado. Mientras que el Agent SDK autoalojado significa "tú ejecutas el motor", Managed Agents significa "lo ejecuta Anthropic y tú te centras en la definición": una elección emparejada que difiere en dónde recae la responsabilidad operativa.
Sus señas de identidad son la memoria persistente con alcance de workspace (montada en /mnt/memory, que persiste entre sesiones) y el "dreaming" (vista previa de investigación) para reorganizarla y consolidarla, además de la evaluación basada en resultados y la orquestación multiagente. El precio es tokens + $0.08 por hora de sesión, disponible para todas las cuentas de API como beta pública de abril de 2026 (con estado, por lo que no es elegible para ZDR / HIPAA BAA). Relacionados: guía del Agent SDK, qué es multiagente, cómo construir un sistema multiagente.
Preguntas frecuentes
Q. ¿Qué son los Managed Agents?
A. El conjunto de APIs de Anthropic para crear y desplegar agentes alojados en la nube. En lugar de construir tu propio bucle de agente, ejecución de herramientas y runtime, obtienes un entorno totalmente gestionado donde Claude puede leer archivos, ejecutar comandos, navegar por la web y ejecutar código de forma segura. El prompt caching, la compactación, el sandboxing y la persistencia de estado vienen integrados. Se lanzó como beta pública el 8 de abril de 2026.
Q. ¿En qué se diferencia del Agent SDK?
A. En quién es responsable de la operación. El Agent SDK es un harness autoalojado que ejecutas en Python / TypeScript, donde tú operas el bucle, las herramientas y la infraestructura. En Managed Agents, Anthropic provee el bucle, el sandbox, el estado y la memoria sobre infraestructura gestionada, y tú te centras en definir el agente. No son competidores: es una elección sobre cuánto de la operación te quedas tú.
Q. ¿Qué son la memoria persistente y el "dreaming"?
A. La memoria persistente (un memory store) es una colección de documentos de texto con alcance de workspace, montada en el sandbox como /mnt/memory/; el agente la lee y la escribe con operaciones de archivo normales y persiste entre sesiones. El "dreaming" es un trabajo asíncrono que lee la memoria existente y transcripciones de sesiones anteriores para producir un memory store reorganizado: fusionando duplicados, actualizando valores obsoletos y poniendo de relieve nuevas observaciones. Actualmente el dreaming es una vista previa de investigación (requiere solicitud de acceso).
Q. ¿Cuánto cuesta?
A. Dos dimensiones: cargos por tokens + tiempo de ejecución de la sesión a $0.08 por hora de sesión. El tiempo de ejecución se mide al milisegundo y se factura solo mientras el estado es running (estar inactivo / reprogramando es gratis). La estimación de Anthropic es de alrededor de $0.705 para una sesión de Opus 4.8 de 1 hora. Los tokens usan las tarifas estándar del modelo con prompt caching.
Q. ¿Puede usarlo cualquiera?
A. Es una beta pública desde el 8 de abril de 2026, activada por defecto para todas las cuentas de API, accesible vía Claude Console / Platform CLI / Claude Code. Pero como es con estado por diseño, no es elegible para Zero Data Retention (ZDR) ni para un HIPAA BAA. Ten en cuenta además que las funciones difieren según la etapa: el dreaming es una vista previa de investigación que requiere solicitud de acceso (consulta la documentación oficial para lo más reciente).