Faire tourner un agent en production, cela veut dire mettre en place la boucle de l'agent, l'exécution des outils, un sandbox et la persistance de l'état — le tout par vous-même. Claude Managed Agents vous retire toute cette charge : Anthropic s'en occupe pour vous. Lancé en bêta publique le 8 avril 2026, c'est une suite d'API composables pour construire et déployer des agents hébergés dans le cloud à grande échelle.

Cet article présente, sur la base d'informations officielles, ce qu'est Managed Agents, en quoi il se distingue de l'Agent SDK auto-hébergé, la mémoire persistante et le « dreaming », la notation fondée sur les résultats et le multi-agent, ainsi que la tarification. Les points clés d'emblée. ① Au lieu de « construire votre propre boucle d'agent », vous obtenez un environnement entièrement managé où Claude peut lire des fichiers, exécuter des commandes, naviguer sur le web et exécuter du code en toute sécurité. ② Il dispose d'une mémoire persistante limitée à l'espace de travail (montée sur /mnt/memory), qu'un « dream » peut réorganiser et consolider. ③ La tarification est tokens + $0.08 par heure de session.

ANTHROPIC · MANAGED AGENTS

Anthropic prend en charge tout le « côté exécution »

— boucle, sandbox, état et mémoire sur une infrastructure managée

☁ ENVIRONNEMENT MANAGÉ (Anthropic l'exécute)
Boucle de l'agent + exécution des outils
Sandbox fichier/bash/web/code
État persistance, compaction, cache
Memory store /mnt/memory
⟳ un dream réorganise la mémoire (fusion des doublons / mise à jour des valeurs obsolètes)

Vous vous concentrez sur la définition de l'agent. La tarification est tokens + $0.08 par heure de session (uniquement pendant l'exécution, facturée à la milliseconde).

1. Qu'est-ce que Managed Agents ?

Selon les mots d'Anthropic, Managed Agents est « une suite d'API composables pour construire et déployer des agents hébergés dans le cloud à grande échelle », et la documentation le décrit comme un « harnais d'agent préconstruit et configurable qui s'exécute sur une infrastructure managée ». L'essentiel : « Au lieu de construire votre propre boucle d'agent, votre exécution d'outils et votre runtime, vous obtenez un environnement entièrement managé où Claude peut lire des fichiers, exécuter des commandes, naviguer sur le web et exécuter du code en toute sécurité. » La mise en cache des prompts, la compaction du contexte, le sandboxing et la persistance de l'état sont intégrés dès le départ.

Il s'organise autour de quatre concepts — Agent (la définition) / Environment (où il s'exécute) / Session / Events. L'Environment peut être un sandbox cloud managé par Anthropic ou un sandbox auto-hébergé sur votre propre infrastructure.

2. Comparaison avec l'Agent SDK (auto-hébergé vs managé)

Ce qu'on a facilement tendance à confondre, c'est la différence avec le Claude Agent SDK. Les deux forment une paire selon l'axe « vous l'exécutez » vs « Anthropic l'exécute ».

Agent SDK
= vous l'exécutez (auto-hébergé)
  • Votre propre harnais en Python / TypeScript
  • Vous gérez la boucle, les outils et le runtime
  • L'infrastructure et la montée en charge sont à votre charge
  • Contrôle total sur les détails
Managed Agents
= Anthropic l'exécute (managé)
  • La boucle, le sandbox et l'état sont du côté managé
  • La mémoire persistante et le dreaming sont intégrés
  • Facturé au temps d'exécution ($0.08/heure)
  • Concentrez-vous sur la définition, déléguez l'exploitation

En bref : « vous voulez construire votre propre moteur ? Agent SDK. Vous voulez louer le moteur et vous concentrer sur le contenu ? Managed Agents. » Ce ne sont pas des concurrents — c'est un choix sur la part de l'exploitation que vous gardez vous-même. Pour le concept d'agents, voir qu'est-ce que le multi-agent ; pour en construire un, comment construire un système multi-agent.

3. Mémoire persistante et « dreaming »

Une fonctionnalité emblématique de Managed Agents est la mémoire persistante (un memory store). C'est « une collection de documents texte limitée à l'espace de travail », montée comme un répertoire (/mnt/memory/) à l'intérieur du sandbox de la session. L'agent la lit et l'écrit avec des opérations de fichiers normales, et son contenu persiste d'une session à l'autre. Chaque modification crée une version de mémoire immuable à des fins d'audit (conservation 30 jours). Limites : 100 kB par mémoire, 2 000 mémoires par store, 8 stores par session.

Plus inhabituel : le « dreaming ». D'après la description officielle : « Un dream lit un memory store existant en même temps que les transcriptions des sessions passées, puis produit un nouveau memory store réorganisé : doublons fusionnés, entrées obsolètes ou contredites remplacées par la dernière valeur, et nouvelles informations mises en avant. » C'est un job asynchrone (1 à 100 sessions en entrée, avec des instructions facultatives) qui nécessite un en-tête bêta dédié.

⚠️ Note d'exactitude : le dreaming est une préversion de recherche (research preview) qui requiert une demande d'accès. Certains articles le qualifient de « processus planifié », mais la documentation officielle le décrit comme un job asynchrone à la demande que vous créez et interrogez. Il est exact de le voir comme « un processus de consolidation que vous pouvez lancer selon un planning », et cet article n'affirme pas qu'« Anthropic l'exécute automatiquement ».

4. Notation par résultats et multi-agent

Une fonctionnalité plus récente est la notation fondée sur les résultats. D'après Anthropic : « Vous rédigez un barème décrivant à quoi ressemble le succès et l'agent travaille à l'atteindre. Un évaluateur distinct juge la sortie par rapport à vos critères dans sa propre fenêtre de contexte. » Anthropic indique qu'elle « a amélioré le taux de réussite des tâches jusqu'à 10 points par rapport à une boucle de prompting standard » (+8,4 % pour docx, +10,1 % pour pptx — chiffres publiés par Anthropic). Bêta publique.

L'orchestration multi-agent est également intégrée : « Un agent principal découpe le travail en plusieurs parties et délègue chacune à un spécialiste doté de son propre modèle, prompt et outils », s'exécutant en parallèle sur un système de fichiers partagé. La philosophie de conception consistant à orchestrer des agents fait écho à comment construire un système multi-agent.

5. Tarification et disponibilité

La tarification comporte deux dimensions : ① les tokens (tarifs standard des modèles, avec mise en cache des prompts appliquée) + ② le temps d'exécution de la session à $0.08 par heure de session. Le temps d'exécution est facturé à la milliseconde et uniquement tant que le statut est running (l'inactivité ou la replanification sont gratuites). Exemple chiffré d'Anthropic : une session Opus 4.8 d'une heure coûte environ $0.705.

ÉlémentDétails
Lancement8 avril 2026 · bêta publique (activée par défaut pour tous les comptes API)
AccèsVia Claude Console / Platform CLI / Claude Code
TarificationTokens + $0.08 / heure de session (uniquement pendant l'exécution, facturé à la ms)
RéserveStateful par conception, donc non éligible au Zero Data Retention (ZDR) ni à un HIPAA BAA
Mémoire / dreamle dreaming est une préversion de recherche (research preview) (demande d'accès requise)

Résumé

Claude Managed Agents est un environnement entièrement managé où Anthropic exploite pour vous la boucle de l'agent, l'exécution des outils, le sandbox et la persistance de l'état. Là où l'Agent SDK auto-hébergé signifie « vous faites tourner le moteur », Managed Agents signifie « Anthropic l'exécute, et vous vous concentrez sur la définition » — un choix apparié qui diffère sur l'endroit où se situe la responsabilité d'exploitation.

Ses marques de fabrique sont la mémoire persistante limitée à l'espace de travail (montée sur /mnt/memory, persistant d'une session à l'autre) et le « dreaming » (préversion de recherche) pour la réorganiser et la consolider, auxquels s'ajoutent la notation fondée sur les résultats et l'orchestration multi-agent. La tarification est tokens + $0.08 par heure de session, disponible pour tous les comptes API en tant que bêta publique d'avril 2026 (stateful, donc non éligible au ZDR / HIPAA BAA). À lire aussi : guide de l'Agent SDK, qu'est-ce que le multi-agent, comment construire un système multi-agent.

FAQ

Q. Qu'est-ce que Managed Agents ?
A. La suite d'API d'Anthropic pour construire et déployer des agents hébergés dans le cloud. Au lieu de construire votre propre boucle d'agent, exécution d'outils et runtime, vous obtenez un environnement entièrement managé où Claude peut lire des fichiers, exécuter des commandes, naviguer sur le web et exécuter du code en toute sécurité. La mise en cache des prompts, la compaction, le sandboxing et la persistance de l'état sont intégrés. Il a été lancé en bêta publique le 8 avril 2026.

Q. En quoi diffère-t-il de l'Agent SDK ?
A. Sur qui détient l'exploitation. L'Agent SDK est un harnais auto-hébergé que vous exécutez en Python / TypeScript, où vous gérez la boucle, les outils et l'infrastructure. Avec Managed Agents, Anthropic fournit la boucle, le sandbox, l'état et la mémoire sur une infrastructure managée, et vous vous concentrez sur la définition de l'agent. Ce ne sont pas des concurrents — c'est un choix sur la part de l'exploitation que vous conservez.

Q. Qu'est-ce que la mémoire persistante et le « dreaming » ?
A. La mémoire persistante (un memory store) est une collection de documents texte limitée à l'espace de travail, montée dans le sandbox sous /mnt/memory/ ; l'agent la lit et l'écrit avec des opérations de fichiers normales et elle persiste d'une session à l'autre. Le « dreaming » est un job asynchrone qui lit la mémoire existante et les transcriptions des sessions passées pour produire un memory store réorganiséen fusionnant les doublons, en mettant à jour les valeurs obsolètes et en faisant émerger de nouvelles informations. Le dreaming est actuellement une préversion de recherche (demande d'accès requise).

Q. Combien ça coûte ?
A. Deux dimensions : frais de tokens + temps d'exécution de la session à $0.08 par heure de session. Le temps d'exécution est facturé à la milliseconde et uniquement tant que le statut est running (inactivité / replanification gratuites). L'estimation d'Anthropic est d'environ $0.705 pour une session Opus 4.8 d'une heure. Les tokens utilisent les tarifs standard des modèles avec mise en cache des prompts.

Q. Tout le monde peut-il l'utiliser ?
A. C'est une bêta publique depuis le 8 avril 2026, activée par défaut pour tous les comptes API, accessible via Claude Console / Platform CLI / Claude Code. Mais comme elle est stateful par conception, elle est non éligible au Zero Data Retention (ZDR) ni à un HIPAA BAA. Notez aussi que les fonctionnalités varient selon leur stade — le dreaming est une préversion de recherche nécessitant une demande d'accès (consultez la documentation officielle pour les informations les plus récentes).