Sommaire

Pourquoi Anthropic fait rêver ses agents

Dreaming : la mémoire qui se nettoie pendant le sommeil

Outcomes : remplacer les prompts par des rubriques

Multi-Agent Orchestration : un chef d'équipe et ses spécialistes

Pile mémoire complète : Memory + Dreaming + Outcomes

Cas concrets : Harvey, Netflix et le playbook de descente

Comment activer ces fonctionnalités dans vos agents

Risques sécurité et bonnes pratiques

Impact sur l'écosystème Claude Code

FAQ

---

Pourquoi Anthropic fait rêver ses agents {#introduction}

Le 6 mai 2026 à la conférence Code with Claude 2026, Anthropic a dévoilé trois nouvelles fonctionnalités pour Claude Managed Agents qui marquent un tournant dans la façon dont les agents IA apprennent et s'organisent : Dreaming, Outcomes et Multi-Agent Orchestration.

Ces trois primitives répondent à des problèmes opérationnels concrets que rencontrent toutes les équipes déployant des agents en production : comment garder une mémoire cohérente entre sessions, comment évaluer le succès de tâches subjectives, et comment décomposer des missions complexes sans saturer un seul contexte.

Si vous découvrez l'écosystème, commencez par notre guide complet Claude Code puis remontez vers les Managed Agents pour entreprises qui constituent la couche d'infrastructure sous-jacente.

---

Dreaming : la mémoire qui se nettoie pendant le sommeil {#dreaming}

Le problème de la mémoire brute

Depuis l'arrivée de la mémoire persistante, un agent Claude pouvait accumuler des notes au fil des sessions. Mais cette mémoire grossit sans contrôle : un agent en production sur 6 mois peut accumuler des milliers d'entrées contradictoires, redondantes ou obsolètes. Plus la mémoire grossit, plus le coût de la consulter explose et plus la qualité des décisions baisse.

Le mécanisme du rêve

Dreaming est un processus planifié (research preview au moment de la rédaction) qui s'exécute en arrière-plan, généralement la nuit ou pendant les périodes creuses de l'agent. Il fait trois choses :

1.Lecture rétrospective : il revisite les logs de sessions récentes et le memory store

2.Extraction de patterns : il identifie les requêtes récurrentes, les approches qui ont fonctionné, les erreurs répétées et les angles morts

3.Curation : il consolide, déduplique, archive ou réécrit les souvenirs pour produire un store plus dense et plus actionnable

Le résultat ressemble à ce qu'un humain fait pendant le sommeil paradoxal : compresser l'expérience récente en heuristiques utilisables.

Architecture conceptuelle

Composant	Rôle	Fréquence
Memory store	Stockage brut des observations agent	Mise à jour en temps réel
Dreaming scheduler	Planificateur qui déclenche les sessions de rêve	Cron configurable (souvent nocturne)
Pattern miner	Analyse les logs pour identifier des séquences récurrentes	À chaque session de rêve
Memory curator	Réécrit, fusionne ou supprime les souvenirs	À chaque session de rêve
Cross-agent sync	Partage les apprentissages entre agents de la même flotte	Optionnel, configurable

Pourquoi c'est plus qu'un simple résumé

Un résumé classique perd de l'information. Dreaming réorganise la mémoire : il transforme un journal chronologique en un index thématique. Quand un agent reprend du service, il accède à une mémoire structurée — pas à un dump.

---

Outcomes : remplacer les prompts par des rubriques {#outcomes}

Le problème du prompt qui définit trop ou trop peu

Quand vous donnez une tâche complexe à un agent, deux écueils :

Sur-spécifier : vous décrivez la méthode étape par étape, ce qui réduit la créativité de l'agent et explose la longueur du prompt

Sous-spécifier : vous dites "fais le mieux possible" et l'agent ne sait pas comment se mesurer

Outcomes propose une troisième voie : vous décrivez ce à quoi ressemble le succès, sans dicter le chemin. L'agent travaille alors itérativement contre cette rubrique.

Anatomie d'une rubrique Outcomes

Une rubrique Outcomes est un ensemble de critères pondérés, vérifiables soit par l'agent, soit par un agent juge, soit par des tests automatisés. Exemple pour une tâche "génère une présentation produit" :

outcome:
  name: presentation-produit-q3
  criteria:
    - id: structure
      weight: 0.2
      description: "8 à 12 slides, intro/problème/solution/preuves/CTA"
      check: agent-judge
    - id: chiffres-cles
      weight: 0.3
      description: "Chaque slide de preuve cite une métrique précise"
      check: regex-and-judge
    - id: cohesion-visuelle
      weight: 0.2
      description: "Palette cohérente, pas de mix de styles"
      check: agent-judge
    - id: clarte-message
      weight: 0.3
      description: "Un message principal identifiable par slide"
      check: agent-judge
  pass_threshold: 0.85

L'agent itère : il génère, s'auto-évalue contre la rubrique, ajuste. Il s'arrête quand le score dépasse le seuil ou qu'un budget d'itérations est épuisé.

Résultats mesurés

Sur les benchmarks internes d'Anthropic, Outcomes améliore le taux de succès de 10 points par rapport à un prompting classique, avec les gains les plus importants sur les tâches difficiles. Le cas PowerPoint en particulier a vu une amélioration qualitative de 10.1 % sur des présentations notées à l'aveugle.

Quand utiliser Outcomes vs un prompt classique

Situation	Recommandation
Tâche bien définie, output mesurable	Outcomes
Tâche créative subjective avec critères flous	Outcomes + agent juge
Tâche déterministe avec sortie unique	Prompt classique
Tâche itérative avec budget de retries	Outcomes
Tâche très courte (< 30 secondes)	Prompt classique (overhead Outcomes trop coûteux)

---

Multi-Agent Orchestration : un chef d'équipe et ses spécialistes {#orchestration}

Le pattern lead-agent + sub-specialists

Pour les missions complexes qui dépassent un seul contexte, Multi-Agent Orchestration introduit un pattern formalisé :

1.Un lead agent reçoit la demande

2.Il décompose en sous-tâches

3.Chaque sous-tâche est confiée à un specialist agent avec son propre modèle, prompt et outils

4.Les résultats reviennent au lead qui les recompose

Ce pattern existait déjà via les sub-agents Claude Code, mais Multi-Agent Orchestration le promeut au rang de primitive managée : Anthropic gère le routing, les retries, l'isolation des contextes et la facturation.

Comparaison avec les sub-agents Claude Code locaux

Aspect	Sub-agents Claude Code	Multi-Agent Orchestration
Localisation	Process local	Cloud managé
Coordination	Conversation parent	Lead agent dédié
Isolation contexte	Oui (window séparée)	Oui (instance séparée)
Modèle par sub-agent	Configurable	Configurable + facturé indépendamment
Outils par sub-agent	Hérités ou restreints	Définis par spécialisation
Cas d'usage	Refactor multi-fichiers, recherche	Pipelines longs, traitements parallèles massifs

Le cas Netflix : traitement massif en parallèle

Netflix utilise Multi-Agent Orchestration pour traiter les logs de centaines de builds simultanément. Un lead agent reçoit l'ensemble des builds échoués de la nuit, dispatche un specialist par build, chaque specialist analyse les logs, identifie la cause racine, propose un fix et remonte un rapport. Le lead agrège et priorise.

Là où un seul agent aurait pris des heures séquentiellement, l'orchestration parallèle ramène le temps de traitement à quelques minutes.

---

Pile mémoire complète : Memory + Dreaming + Outcomes {#pile-memoire}

Les trois fonctionnalités forment une pile cohérente :

┌──────────────────────────────────────────┐
│ OUTCOMES  (rubrique du succès)           │
│ ↓ guide l'itération                      │
├──────────────────────────────────────────┤
│ EXÉCUTION (agent + outils)               │
│ ↓ produit des observations               │
├──────────────────────────────────────────┤
│ MEMORY    (stockage brut, real-time)     │
│ ↓ alimente                               │
├──────────────────────────────────────────┤
│ DREAMING  (curation périodique)          │
│ ↓ raffine et partage                     │
├──────────────────────────────────────────┤
│ MEMORY    (version curée, réutilisable)  │
└──────────────────────────────────────────┘

Memory capture ce que l'agent apprend en travaillant. Dreaming raffine cette mémoire entre les sessions, en extrayant des apprentissages partagés entre agents et en la maintenant à jour. Outcomes définit la cible vers laquelle l'agent itère pendant l'exécution.

---

Cas concrets : Harvey, Netflix et le playbook de descente {#cas-concrets}

Harvey : 6x sur le taux de complétion

Harvey, plateforme d'IA juridique, a vu son taux de complétion de tâches multiplié par environ 6 après l'activation de Dreaming. La raison : les agents juridiques d'Harvey traitent des contrats avec des patterns récurrents (clauses de non-concurrence, indemnisation, IP). Dreaming a permis de capitaliser sur les cas vus en production pour améliorer les sessions suivantes sans intervention humaine.

Netflix : centaines de builds en parallèle

Comme mentionné, Multi-Agent Orchestration sert chez Netflix à analyser les pipelines CI. Ce cas d'usage rejoint celui décrit dans notre article sur les pipelines DevOps avec Claude Code, mais à une échelle où l'orchestration cloud devient indispensable.

Le playbook de descente : Dreaming en simulation

Un cas d'école cité par Anthropic : un agent qui pilotait des simulations de descente atmosphérique. Après plusieurs sessions de Dreaming sur les logs de simulations passées, l'agent a produit un playbook de descente complet — un ensemble d'heuristiques tirées de patterns à travers de multiples missions. Aucun ingénieur n'a écrit ce playbook ; il est émergent du processus de rêve.

---

Comment activer ces fonctionnalités dans vos agents {#activation}

Prérequis

Compte Claude avec accès aux Managed Agents

Outcomes et Multi-Agent Orchestration : public beta, disponibles pour tous les développeurs

Dreaming : research preview, accès progressif via la plateforme Claude

Activation d'Outcomes

Dans la configuration de votre agent, ajoutez un bloc outcome :

agent:
  name: doc-writer
  model: claude-opus-4-7
  outcome:
    criteria:
      - id: longueur
        weight: 0.2
        description: "Entre 1500 et 2500 mots"
      - id: structure
        weight: 0.3
        description: "Intro, 3-5 sections, conclusion, FAQ"
    pass_threshold: 0.85
    max_iterations: 5

Activation de Multi-Agent Orchestration

Déclarez un lead et ses specialists :

orchestration:
  lead:
    name: code-reviewer-lead
    model: claude-opus-4-7
  specialists:
    - name: security-reviewer
      model: claude-opus-4-7
      focus: "vulnérabilités OWASP, injection, secrets"
    - name: performance-reviewer
      model: claude-sonnet-4-6
      focus: "complexité algorithmique, N+1, fuites mémoire"
    - name: style-reviewer
      model: claude-haiku-4-5
      focus: "conventions de nommage, formatage, docs"

Le lead reçoit le diff, dispatche aux specialists en parallèle, et agrège les remontées.

Activation de Dreaming

Pour les agents éligibles, configurez un schedule :

dreaming:
  enabled: true
  schedule: "0 3 * * *"   # tous les jours à 3h UTC
  scope:
    sessions_lookback: 7d
    memory_lookback: 30d
  cross_agent_sharing: true

L'agent rêve chaque nuit en consolidant 7 jours de sessions et 30 jours de mémoire. Le partage entre agents permet à toute une flotte d'apprendre collectivement.

---

Risques sécurité et bonnes pratiques {#securite}

Nouvelles surfaces d'attaque

Les chercheurs en sécurité ont identifié plusieurs vecteurs spécifiques à ces fonctionnalités :

Memory poisoning via Dreaming : un attaquant qui insère des données malveillantes dans une session espère qu'elles soient consolidées en heuristique pendant le rêve

Outcome manipulation : si un agent juge évalue les outcomes, un prompt injection peut détourner le juge

Cross-agent contamination : avec le partage inter-agents, une compromission d'un agent peut se propager à toute la flotte

Mitigations recommandées

1.Isolation par tenant : ne partagez jamais la mémoire entre agents servant des clients différents

2.Validation humaine des rubriques : auditez régulièrement le contenu des memory stores après Dreaming

3.Limites de scope Dreaming : restreignez le lookback à des fenêtres courtes pour les agents sensibles

4.Audit des juges Outcomes : utilisez des juges distincts du modèle principal pour limiter les angles morts

Pour aller plus loin sur ces aspects, consultez notre article dédié à la sécurité des assistants IA de code en 2026.

---

Impact sur l'écosystème Claude Code {#impact}

Continuité avec Claude Code

Si Managed Agents reste une offre cloud, l'API et les patterns associés influencent directement Claude Code. On peut déjà constater :

Les routines automatisées qui ressemblent à des dreaming triggers

Les sub-agents qui anticipent le pattern lead-specialist

Les hooks qui peuvent déclencher des sessions Outcomes

Il est probable que Dreaming et Outcomes arrivent dans Claude Code dans une variante locale au cours du second semestre 2026.

Comparaison avec les concurrents

Plateforme	Memory	Dreaming-like	Outcomes-like	Orchestration
Claude Managed Agents	Oui	Oui (research preview)	Oui (public beta)	Oui (public beta)
OpenAI Assistants	Oui	Non	Partiel via evals	Limité
Cursor Background Agents	Partiel	Non	Non	Partiel
GitHub Copilot Workspaces	Non	Non	Non	Non

Anthropic creuse l'écart sur la dimension "agents apprenants en continu". Voir aussi notre comparatif OpenAI Codex vs Claude Code pour le contexte concurrentiel.

---

FAQ {#faq}

Dreaming est-il disponible dans Claude Code ?

Pas encore. Dreaming est pour l'instant exclusif aux Managed Agents en research preview. Anthropic n'a pas annoncé de portage vers Claude Code local mais l'évolution probable est l'arrivée d'une primitive équivalente côté CLI.

Faut-il payer plus cher pour Outcomes et Multi-Agent Orchestration ?

Pas de coût supplémentaire pour activer la primitive. En revanche, chaque itération Outcomes consomme des jetons et chaque specialist dans Multi-Agent Orchestration est facturé indépendamment. Une rubrique mal calibrée peut multiplier la consommation de jetons par 5 ou 10.

Dreaming peut-il halluciner des souvenirs ?

C'est un risque réel. Comme tout processus génératif, Dreaming peut consolider des patterns inexacts. Anthropic recommande des audits réguliers du memory store et la possibilité de roll back vers un snapshot antérieur.

Combien d'agents peuvent partager une mémoire via Dreaming ?

La limite n'est pas publiée. En pratique, le partage est configurable par groupe d'agents (un "fleet" partage le même store curé) ce qui permet une organisation par équipe ou par produit.

Outcomes remplace-t-il les tests automatisés ?

Non. Outcomes est complémentaire. Pour du code, gardez vos tests unitaires et d'intégration ; voir notre article sur les tests automatisés et TDD avec Claude Code. Outcomes brille sur les tâches subjectives ou difficilement testables (rédaction, design, présentation).

Puis-je auto-héberger Dreaming ?

Non au moment de la rédaction. Dreaming s'exécute sur l'infrastructure managée d'Anthropic. Pour un équivalent self-hosted, vous devrez implémenter votre propre boucle de curation mémoire sur l'API Claude.

Quel modèle pour le lead agent en orchestration ?

Anthropic recommande Opus 4.7 pour le lead (décisions stratégiques) et un mix Opus/Sonnet/Haiku pour les specialists selon la complexité de la sous-tâche. Voir notre guide Opus 4.7 pour choisir.

---

*Sources : Anthropic Claude Managed Agents announcement (6 mai 2026), VentureBeat, MindStudio, The New Stack, documentation Claude Platform.*

Claude Dreaming : Les Agents IA qui Rêvent et s'Auto-Améliorent