Rodar um agente em produção significa montar o loop do agente, a execução de ferramentas, um sandbox e a persistência de estado—tudo por conta própria. Os Claude Managed Agents tiram todo esse fardo das suas mãos: a Anthropic roda tudo para você. Lançado como beta público em 8 de abril de 2026, é um conjunto de APIs combináveis para construir e implantar agentes hospedados na nuvem em escala.

Este artigo cobre, com base em informações oficiais, o que são os Managed Agents, como diferem do Agent SDK auto-hospedado, a memória persistente e o "dreaming", a avaliação baseada em resultados e o multiagente, além dos preços. Os pontos principais logo de início. ① Em vez de "construir o seu próprio loop de agente", você ganha um ambiente totalmente gerenciado onde o Claude pode ler arquivos, executar comandos, navegar na web e rodar código com segurança. ② Possui memória persistente com escopo de workspace (montada em /mnt/memory), que um "dream" pode reorganizar e consolidar. ③ O preço é tokens + $0.08 por hora de sessão.

ANTHROPIC · MANAGED AGENTS

A Anthropic assume todo o "lado da execução"

— loop, sandbox, estado e memória em infraestrutura gerenciada

☁ AMBIENTE GERENCIADO (a Anthropic roda)
Agent loop + execução de ferramentas
Sandbox arquivo/bash/web/código
Estado persistência, compactação, cache
Memory store /mnt/memory
⟳ um dream reorganiza a memória (mescla duplicatas / atualiza valores obsoletos)

Você foca em definir o agente. O preço é tokens + $0.08 por hora de sessão (apenas enquanto roda, medido ao milissegundo).

1. O que são os Managed Agents?

Nas palavras da Anthropic, os Managed Agents são "um conjunto de APIs combináveis para construir e implantar agentes hospedados na nuvem em escala", e a documentação os descreve como um "harness de agente pré-construído e configurável que roda em infraestrutura gerenciada". O ponto central: "Em vez de construir o seu próprio loop de agente, execução de ferramentas e runtime, você ganha um ambiente totalmente gerenciado onde o Claude pode ler arquivos, executar comandos, navegar na web e rodar código com segurança". Cache de prompt, compactação de contexto, sandboxing e persistência de estado já vêm embutidos desde o início.

Está organizado em torno de quatro conceitos—Agent (a definição) / Environment (onde roda) / Session / Events. O Environment pode ser um sandbox em nuvem gerenciado pela Anthropic ou um sandbox auto-hospedado na sua própria infraestrutura.

2. vs o Agent SDK (auto-hospedado vs gerenciado)

O que é fácil confundir é a diferença em relação ao Claude Agent SDK. Os dois formam um par ao longo do eixo "você roda" vs "a Anthropic roda".

Agent SDK
= você roda (auto-hospedado)
  • Seu próprio harness em Python / TypeScript
  • Você opera o loop, as ferramentas e o runtime
  • A infraestrutura e a escala são sua responsabilidade
  • Controle total sobre os detalhes
Managed Agents
= a Anthropic roda (gerenciado)
  • Loop, sandbox e estado ficam no lado gerenciado
  • Memória persistente e dreaming já vêm embutidos
  • Cobrado pelo tempo de execução ($0.08/hora)
  • Foque na definição, delegue a operação

Em resumo: "quer construir o seu próprio motor? Agent SDK. Quer alugar o motor e focar no conteúdo? Managed Agents." Não são concorrentes—são uma escolha sobre quanto da operação você mesmo mantém. Para o conceito de agentes, veja o que é multiagente; para construir um, como construir um sistema multiagente.

3. Memória persistente e "dreaming"

Um recurso marcante dos Managed Agents é a memória persistente (um memory store). É "uma coleção de documentos de texto com escopo de workspace", montada como um diretório (/mnt/memory/) dentro do sandbox da sessão. O agente a lê e escreve com operações normais de arquivo, e o conteúdo persiste entre sessões. Cada alteração cria uma versão de memória imutável para auditoria (retenção de 30 dias). Limites: 100 kB por memória, 2.000 memórias por store, 8 stores por sessão.

Mais incomum é o "dreaming". Conforme a descrição oficial: "Um dream lê um memory store existente junto com transcrições de sessões passadas e então produz um novo memory store reorganizado: duplicatas mescladas, entradas obsoletas ou contraditas substituídas pelo valor mais recente e novos insights trazidos à tona". É um job assíncrono (1–100 sessões de entrada, com instruções opcionais) que exige um cabeçalho beta dedicado.

⚠️ Nota de precisão: o dreaming é um research preview que exige solicitação de acesso. Alguns textos o chamam de "processo agendado", mas a documentação oficial o descreve como um job assíncrono sob demanda que você cria e consulta (poll). É correto pensar nele como "um processo de consolidação que você pode rodar de forma agendada", e este artigo não afirma que "a Anthropic o executa automaticamente".

4. Avaliação por resultados e multiagente

Um recurso mais recente é a avaliação baseada em resultados (outcomes-based grading). Segundo a Anthropic: "Você escreve uma rubrica descrevendo como é o sucesso e o agente trabalha em direção a ela. Um avaliador (grader) separado avalia a saída contra os seus critérios na sua própria janela de contexto". A Anthropic relata que isso "melhorou a taxa de sucesso de tarefas em até 10 pontos em relação a um loop de prompting padrão" (+8,4% para docx, +10,1% para pptx—números publicados pela Anthropic). Beta público.

A orquestração multiagente também já vem embutida: "Um agente líder divide o trabalho em partes e delega cada uma a um especialista com seu próprio modelo, prompt e ferramentas", rodando em paralelo sobre um sistema de arquivos compartilhado. A filosofia de design de orquestrar agentes ecoa como construir um sistema multiagente.

5. Preços e disponibilidade

O preço tem duas dimensões: ① tokens (tarifas padrão do modelo, com cache de prompt aplicado) + ② tempo de execução da sessão a $0.08 por hora de sessão. O tempo de execução é medido ao milissegundo e cobrado apenas enquanto o status estiver running (ocioso ou reagendando é gratuito). O exemplo prático da Anthropic: uma sessão Opus 4.8 de 1 hora custa cerca de $0.705.

ItemDetalhes
Lançamento8 de abril de 2026 · beta público (habilitado por padrão para todas as contas de API)
AcessoVia Claude Console / Platform CLI / Claude Code
PreçoTokens + $0.08 / hora de sessão (apenas enquanto roda, medido ao ms)
RessalvaStateful por design, então não elegível para Zero Data Retention (ZDR) nem para um HIPAA BAA
Memória / dreamo dreaming é um research preview (exige solicitação de acesso)

Resumo

Os Claude Managed Agents são um ambiente totalmente gerenciado onde a Anthropic opera o loop do agente, a execução de ferramentas, o sandbox e a persistência de estado por você. Onde o Agent SDK auto-hospedado significa "você roda o motor", os Managed Agents significam "a Anthropic roda, e você foca na definição"—uma escolha pareada que difere em onde fica a responsabilidade operacional.

Suas marcas registradas são a memória persistente com escopo de workspace (montada em /mnt/memory, persistindo entre sessões) e o "dreaming" (research preview) para reorganizá-la e consolidá-la, além da avaliação baseada em resultados e da orquestração multiagente. O preço é tokens + $0.08 por hora de sessão, disponível para todas as contas de API como beta público de abril de 2026 (stateful, então não elegível para ZDR / HIPAA BAA). Relacionados: guia do Agent SDK, o que é multiagente, como construir um sistema multiagente.

FAQ

Q. O que são os Managed Agents?
A. O conjunto de APIs da Anthropic para construir e implantar agentes hospedados na nuvem. Em vez de construir o seu próprio loop de agente, execução de ferramentas e runtime, você ganha um ambiente totalmente gerenciado onde o Claude pode ler arquivos, executar comandos, navegar na web e rodar código com segurança. Cache de prompt, compactação, sandboxing e persistência de estado já vêm embutidos. Foi lançado como beta público em 8 de abril de 2026.

Q. Como difere do Agent SDK?
A. Em quem é dono da operação. O Agent SDK é um harness auto-hospedado que você roda em Python / TypeScript, onde você opera o loop, as ferramentas e a infraestrutura. Nos Managed Agents, a Anthropic fornece o loop, o sandbox, o estado e a memória em infraestrutura gerenciada, e você foca em definir o agente. Não são concorrentes—é uma escolha sobre quanto da operação você mantém.

Q. O que são a memória persistente e o "dreaming"?
A. A memória persistente (um memory store) é uma coleção de documentos de texto com escopo de workspace, montada no sandbox como /mnt/memory/; o agente a lê e escreve com operações normais de arquivo e ela persiste entre sessões. O "dreaming" é um job assíncrono que lê a memória existente e as transcrições de sessões passadas para produzir um memory store reorganizadomesclando duplicatas, atualizando valores obsoletos e trazendo à tona novos insights. O dreaming é atualmente um research preview (exige solicitação de acesso).

Q. Quanto custa?
A. Duas dimensões: cobrança por tokens + tempo de execução da sessão a $0.08 por hora de sessão. O tempo de execução é medido ao milissegundo e cobrado apenas enquanto o status estiver running (ocioso / reagendando é gratuito). A estimativa da Anthropic é de cerca de $0.705 para uma sessão Opus 4.8 de 1 hora. Os tokens usam as tarifas padrão do modelo com cache de prompt.

Q. Qualquer um pode usar?
A. É um beta público a partir de 8 de abril de 2026, habilitado por padrão para todas as contas de API, acessível via Claude Console / Platform CLI / Claude Code. Mas, por ser stateful por design, não é elegível para Zero Data Retention (ZDR) nem para um HIPAA BAA. Note também que os recursos variam por estágio—o dreaming é um research preview que exige solicitação de acesso (consulte a documentação oficial para o mais recente).