Sommaire

Pourquoi le Advisor Tool change l'économie des agents

Le pattern executor + advisor expliqué

Comment activer le Advisor Tool dans l'API

Benchmarks : -12% de coût, +2,7 points SWE-bench

Quand le writer demande conseil — la heuristique

Cas d'usage où le pattern brille

Advisor Tool vs Managed Agents Multiagent

Pièges classiques à éviter

Bonnes pratiques en production

FAQ

---

Pourquoi le Advisor Tool change l'économie des agents {#introduction}

Le 9 avril 2026, Anthropic a lancé en bêta sur la Claude Platform un outil qui répond à une question que chaque équipe agentique se pose : *"Comment garder la qualité d'Opus tout en payant le prix d'un Sonnet ou d'un Haiku ?"*.

La réponse s'appelle Advisor Tool. C'est un nouveau type d'outil natif qui permet à un modèle "exécuteur" (typiquement Sonnet 4.6 ou Haiku 4.5) de consulter en cours de tâche un modèle "conseiller" plus puissant (Claude Opus 4.7 ou Opus 4.6) pour les décisions difficiles. L'exécuteur reste maître du déroulé. Il appelle l'advisor seulement quand il bloque sur un choix architectural, un edge case piégeux ou une revue critique.

Et les chiffres sont parlants : sur SWE-bench Multilingual, Sonnet avec un advisor Opus passe de 72,1% à 74,8% (+2,7 points). Sur BrowseComp avec Haiku exécuteur, le bond est encore plus brutal : 19,7% → 41,2%. Et tout ça en réduisant le coût moyen par tâche agentique de 11,9% par rapport à un Opus monomodale.

Pour quiconque a une charge agentique non triviale, c'est un levier ROI qui ne demande qu'une ligne d'API à activer.

---

Le pattern executor + advisor expliqué {#pattern}

Le constat de base

Une tâche agentique alterne entre :

1.Du travail mécanique : lire des fichiers, exécuter des commandes, appliquer un patch, vérifier un test. C'est du volume.

2.Des décisions stratégiques : "ma stratégie X ne marche pas, dois-je tenter Y ou repartir de zéro ?", "comment refactoriser cette partie sans casser la suite de tests ?", "ce bug vient-il de la fonction A ou du caller B ?". C'est du raisonnement.

Le travail mécanique est rentable à faire en Sonnet 4.6 ou Haiku 4.5 (moins cher, plus rapide). Les décisions stratégiques bénéficient massivement d'Opus.

L'architecture en deux modèles

┌──────────────────────────────────┐
│  EXECUTOR (Sonnet 4.6 / Haiku)        │
│  Tourne en boucle agentic standard    │
│  Exécute tools, lit, écrit, raisonne  │
└────────────────┬─────────────────┘
                 │
       Décision difficile ?
                 │
                 ▼
       (appelle "advisor" tool)
                 │
                 ▼
┌──────────────────────────────────┐
│  ADVISOR (Opus 4.7)                   │
│  Reçoit transcript complet (system,   │
│  tools, turns, tool_results)          │
│  Renvoie un conseil structuré         │
└────────────────┬─────────────────┘
                 │
                 ▼
       Executor reprend la main

Ce que l'advisor voit

C'est le point clé que beaucoup ratent : l'advisor n'a pas besoin que vous lui passiez du contexte manuellement. Lors de l'appel, le serveur Anthropic forwarde automatiquement :

Le system prompt

Toutes les définitions d'outils

Tous les turns précédents (user, assistant, tool_results)

Le state actuel du raisonnement

Concrètement, Opus voit la même conversation que l'executor, sans que vous ayez à packager quoi que ce soit côté client. C'est ce qui rend ses conseils contextualisés et utiles.

---

Comment activer le Advisor Tool dans l'API {#activation}

Le header beta

Côté Messages API, vous devez d'abord activer la feature :

anthropic-beta: advisor-tool-2026-03-01

La définition de l'outil

Vous ajoutez le tool natif advisor_20260301 dans votre tableau tools :

{
  "type": "advisor_20260301",
  "name": "advisor",
  "advisor_model": "claude-opus-4-7"
}

Le champ advisor_model choisit le modèle conseiller. Valeurs courantes :

claude-opus-4-7 (le plus puissant, recommandé)

claude-opus-4-6 (équivalent qualité, moins cher sur certaines tâches)

Exemple complet de requête

import anthropic

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=4096,
    extra_headers={"anthropic-beta": "advisor-tool-2026-03-01"},
    tools=[
        {
            "type": "advisor_20260301",
            "name": "advisor",
            "advisor_model": "claude-opus-4-7",
        },
        # vos autres tools métier (bash, edit_file, etc.)
    ],
    system="You are a senior engineer. Call the advisor tool when you face a non-trivial architectural decision.",
    messages=[
        {"role": "user", "content": "Refactor src/payments/ to support multi-currency settlements."}
    ],
)

Format de l'appel par l'executor

Quand l'executor décide de consulter le conseiller, il émet un tool_use standard :

{
  "type": "tool_use",
  "name": "advisor",
  "input": {
    "question": "I'm hesitating between adding a CurrencyConverter class or extending Money with a currency field. The codebase uses value objects elsewhere. What's the cleanest approach given the test suite I just read?"
  }
}

Le serveur Anthropic exécute alors un appel Opus en arrière-plan, retourne un tool_result avec le conseil structuré, et l'executor continue la conversation.

---

Benchmarks : -12% de coût, +2,7 points SWE-bench {#benchmarks}

Les chiffres publiés par Anthropic sont concrets. Voici les benchmarks principaux.

SWE-bench Multilingual (Sonnet 4.6 + Opus advisor)

Configuration	Score	Coût relatif
Opus 4.7 seul	75,3%	100% (référence)
Sonnet 4.6 + Opus advisor	74,8%	~67%
Sonnet 4.6 seul	72,1%	~50%

Le pattern executor + advisor récupère la quasi-totalité de la qualité d'Opus pour 2/3 du coût.

BrowseComp (Haiku 4.5 + Opus advisor)

Configuration	Score
Haiku 4.5 seul	19,7%
Haiku 4.5 + Opus advisor	41,2%

Plus que doublé. Sur les tâches où l'exécuteur natif est faible, l'advisor change la classe de performance.

Coût agentique réel

Anthropic rapporte -11,9% de coût moyen par tâche agentique vs un agent 100% Opus. La logique est simple : la majorité des tours sont du travail mécanique (lecture, patch, run tests) que Sonnet ou Haiku abat sans souci. Les ~10-15% de tours qui demandent du raisonnement profond appellent l'advisor.

Pourquoi ça marche

Trois raisons techniques :

1.L'advisor voit tout le contexte sans surcharge prompt côté client (pas de "prompt cache miss" inattendu).

2.L'executor garde la main sur les actions : il décide quand demander, l'advisor ne fait pas d'actions, juste du conseil.

3.Le coût d'un appel advisor est borné : c'est un seul tour, pas une multi-turn complète en Opus.

---

Quand le writer demande conseil — la heuristique {#heuristique}

Les signaux qui déclenchent un appel advisor

Le system prompt joue un rôle décisif pour calibrer quand l'executor doit déranger l'advisor. Quelques patterns qui marchent bien :

Call the advisor tool when:
1. You face an architectural or design decision with multiple valid approaches.
2. A test fails for a reason you don't immediately understand.
3. You have to choose between competing hypotheses for a bug.
4. The user request is ambiguous and your interpretation has wide implications.
5. You're about to make a change that touches more than 3 files.

Do NOT call the advisor for:
- Routine code edits where the next step is obvious.
- Reading files or running standard commands.
- Reformatting or applying a known refactor.

Cette heuristique limite les appels advisor à ~10-20% des tours sur une tâche moyenne, ce qui maintient le ROI.

Le piège du "panic advisor"

Sans cadrage, certains executors développent un réflexe panique : ils consultent l'advisor à chaque mini-décision. Résultat : le coût explose et vous perdez le bénéfice du pattern. La règle d'or : l'advisor est un senior qu'on dérange pour les vraies questions, pas un compagnon de pair-programming pour chaque ligne.

Le piège inverse : executor trop confiant

Symétriquement, un Sonnet/Haiku peut "foncer dans le mur" sur une mauvaise hypothèse sans jamais consulter. Symptôme : vos taux d'échec sur les tâches dures restent élevés malgré l'advisor activé. Reformulez le system prompt pour encourager l'usage sur les décisions stratégiques.

---

Cas d'usage où le pattern brille {#cas-usage}

1. Refactorings complexes

Un agent applique un refactoring qui touche plusieurs modules. Le Sonnet executor fait le travail de patch et de vérification, l'Opus advisor tranche les choix d'architecture (ex: "pattern stratégie vs héritage", "garder la backward compat ou pas").

2. Debug multi-hypothèses

Quand un test échoue sans message clair, l'advisor aide à hiérarchiser les hypothèses. C'est exactement le cas où Opus brille — son raisonnement structuré sur des causes possibles est supérieur.

3. Browse + extraction (BrowseComp)

L'executor Haiku est rapide pour parcourir des pages et clicker. Mais quand vient le moment d'interpréter une page complexe ou de décider quel lien suivre, l'advisor donne le verdict. D'où le bond 19,7% → 41,2%.

4. Code Review automatisée

Combiné avec Code Review d'Anthropic, le pattern advisor permet à l'agent reviewer (Sonnet) de creuser un point précis avec Opus. Vous obtenez la profondeur d'Opus sur les findings critiques sans le coût d'une review Opus complète.

5. Migration de code legacy

Un agent migre un fichier d'une stack à une autre. Sonnet patch et teste, Opus tranche les cas tordus ("comment porter ce useEffect qui dépend de 3 contexts en Server Component ?").

6. Agents de support technique

L'executor Haiku répond aux questions standards. L'advisor Opus est consulté quand la question demande un raisonnement profond sur un cas client. Excellent rapport coût/qualité pour scaler un support.

---

Advisor Tool vs Managed Agents Multiagent {#comparaison}

Les deux concepts peuvent se confondre. Voici la distinction nette.

Aspect	Advisor Tool	Multiagent Orchestration
Pattern	1 executor consulte 1 conseiller	1 lead orchestre N spécialistes
Spécialistes	Le conseiller n'agit pas	Chaque spécialiste exécute des tools
Parallélisme	Aucun (advisor synchrone)	Spécialistes en parallèle
Filesystem partagé	Non	Oui (artifacts shared)
Activation	Tool natif via header beta	Configuration agent managé
Coût	Surcoût Opus ponctuel	Coût plein des spécialistes
Cas d'usage	Décisions difficiles ponctuelles	Tâches lourdes décomposables

En pratique, les deux se cumulent : un agent managé multiagent peut intégrer le Advisor Tool pour ses spécialistes Sonnet ou Haiku. Pour le côté managé, voir notre article sur Claude Managed Agents pour entreprises.

---

Pièges classiques à éviter {#pieges}

Piège 1 : oublier que l'advisor ne fait pas d'actions

L'advisor renvoie du texte. Il ne lit pas de fichier, n'exécute pas de commande. Si votre executor pose une question type "lis tel fichier et dis-moi ce qu'il fait", l'advisor répondra "je n'ai pas accès au fichier, demande à l'executor de le lire d'abord". Reformulez les questions.

Piège 2 : appeler l'advisor au mauvais moment

Si vous appelez l'advisor avant que l'executor ait collecté le contexte nécessaire (ex: avant d'avoir lu les fichiers concernés), l'advisor répond sur la base du peu qu'il a. Toujours pré-charger le contexte côté executor avant la consultation.

Piège 3 : trop d'appels advisor consécutifs

Chaque appel advisor est synchrone et coûteux. Deux appels consécutifs sur le même sujet sont presque toujours le signe d'une question mal posée. Reformulez en un seul appel avec tous les éléments.

Piège 4 : ignorer la trace du conseil

Le conseil de l'advisor est dans le tool_result. C'est une mine d'or pour comprendre comment l'executor raisonne et où il bloque. Si vous loggez les transcripts, gardez systématiquement ces tool_results dans votre observabilité.

Piège 5 : passer le mauvais modèle en `advisor_model`

Mettre Sonnet ou Haiku en advisor_model retire l'intérêt du pattern (vous payez 2x le même modèle). L'advisor doit toujours être au-dessus de l'executor en capacité. Sonnet executor + Opus advisor est la combinaison nominale.

---

Bonnes pratiques en production {#bonnes-pratiques}

1. Mesurez le ratio "tours executor / tours advisor"

Un ratio sain tourne autour de 5-10:1. Si vous descendez à 2:1, l'executor sur-consulte et vous perdez le ROI. Si vous montez à 30:1, l'executor sous-consulte et la qualité chute. Ajustez le system prompt.

2. Cachez les system prompts longs

Le system prompt est inclus dans chaque appel advisor. Activez le prompt caching pour ne pas re-payer le préfixe à chaque consultation.

3. Loggez les questions et les réponses

Un journal "advisor questions + answers" devient un dataset précieux pour :

Améliorer le system prompt de l'executor (en montrant les patterns de questions)

Identifier des tâches où l'executor seul suffit

Construire des évaluations de qualité de l'advisor

4. Combinez avec un système de routes

Si vous opérez plusieurs types de tâches, certaines bénéficient peu de l'advisor (tâches mécaniques pures). Routez les requêtes simples vers un Sonnet sans advisor et les requêtes complexes vers la combo. Économie supplémentaire de 20-30%.

5. Surveillez la dérive de qualité

Lancez une éval quotidienne sur 50 tâches représentatives. Si le score chute, vérifiez : modèle exécuteur déprécié ? Modèle advisor changé ? System prompt drifté ? L'observabilité est plus importante avec un pipeline à deux modèles.

6. Préférez Opus 4.7 comme advisor

Opus 4.7 bat Opus 4.6 sur les benchmarks de raisonnement long et de software engineering — le sweet spot exact du Advisor Tool. À tarification équivalente, c'est le défaut recommandé.

---

FAQ {#faq}

Le Advisor Tool est-il disponible dans Claude Code CLI ?

Pas directement. C'est une feature native de la Claude Platform (Messages API). Pour Claude Code, vous l'utilisez si vous opérez vos propres agents via SDK. Pour le CLI standard, le pricing reste basé sur le modèle sélectionné.

Quel est le coût exact d'un appel advisor ?

Un appel advisor = 1 tour Opus complet. Le prompt inclut le transcript jusqu'au point d'appel + la question. Comptez en moyenne 0,05-0,30 USD par consultation selon la longueur de la conversation. Le prompt caching réduit fortement ce coût sur les sessions longues.

Peut-on enchainer plusieurs advisors différents ?

Oui. Vous pouvez déclarer plusieurs tools advisor avec des noms et modèles différents. Par exemple : security_advisor qui pointe sur Opus 4.7 avec un system prompt sécurité, architect_advisor qui pointe sur Opus 4.6 avec un system prompt architecture. L'executor choisit lequel consulter selon la question.

Le advisor a-t-il une mémoire entre appels ?

Non, chaque appel advisor est un tour API isolé. Il voit le transcript complet de la conversation principale, donc en pratique il a accès à toutes les interactions précédentes (y compris les conseils qu'il a donnés plus tôt). Mais il n'a pas de state propre.

Peut-on tester Advisor Tool en local avec Ollama ou un modèle open-source ?

Non, le Advisor Tool est natif Claude Platform. Pour reproduire le pattern manuellement, vous pouvez le coder côté client en faisant un appel à un modèle supérieur quand votre executor déclare une "tool call" custom. C'est exactement ce que Claude Code Agent Teams faisait avant le tool natif.

Quand préférer Opus 4.6 vs 4.7 comme advisor ?

Opus 4.7 est meilleur sur software engineering et tâches longues. Opus 4.6 reste excellent et est moins cher sur certaines régions. Si vos benchmarks ne montrent pas de différence > 1 point, gardez Opus 4.6 pour économiser.

L'advisor peut-il refuser de répondre ?

Très rarement. Si la question viole les politiques de modération Anthropic, oui. En pratique pour des cas d'usage code/produit normaux, jamais.

Comment intégrer Advisor Tool dans un agent existant ?

Trois étapes : (1) ajouter le header beta, (2) déclarer le tool dans le tableau tools, (3) ajouter dans le system prompt des instructions pour quand l'appeler. Pas de migration de code applicatif nécessaire.

Est-ce compatible avec Skills et MCP ?

Oui. L'advisor cohabite avec les serveurs MCP et les Skills personnalisés. L'executor peut utiliser tout son arsenal de tools en plus de l'advisor.

Existe-t-il un mode "batch" pour amortir le coût ?

Pas spécifiquement, mais le Batch API d'Anthropic fonctionne avec les agents et le advisor inclus. Pour des charges nocturnes, c'est 50% moins cher.

---

*Sources : Anthropic Advisor Tool docs (platform.claude.com/docs/en/agents-and-tools/tool-use/advisor-tool), Anthropic Engineering blog "Advanced tool use" (9 avril 2026), BuildFastWithAI strategy analysis, TestingCatalog coverage, LiteLLM rollout issue #25516, Anthropic SWE-bench/BrowseComp benchmarks.*

Claude Advisor Tool : Coupler Sonnet/Haiku avec un Conseiller Opus pour Coder Moins Cher