Claude Advisor Tool : Coupler Sonnet/Haiku avec un Conseiller Opus pour Coder Moins Cher
Découvrez le Advisor Tool d'Anthropic : un pattern qui appaire un exécuteur Sonnet ou Haiku rapide avec un conseiller Opus, et baisse vos coûts agentiques de 12% sans sacrifier la qualité.
Sommaire
---
Pourquoi le Advisor Tool change l'économie des agents {#introduction}
Le 9 avril 2026, Anthropic a lancé en bêta sur la Claude Platform un outil qui répond à une question que chaque équipe agentique se pose : *"Comment garder la qualité d'Opus tout en payant le prix d'un Sonnet ou d'un Haiku ?"*.
La réponse s'appelle Advisor Tool. C'est un nouveau type d'outil natif qui permet à un modèle "exécuteur" (typiquement Sonnet 4.6 ou Haiku 4.5) de consulter en cours de tâche un modèle "conseiller" plus puissant ([Claude Opus 4.7](/blog/claude-opus-4-7-guide-nouveau-modele-claude-code) ou Opus 4.6) pour les décisions difficiles. L'exécuteur reste maître du déroulé. Il appelle l'advisor seulement quand il bloque sur un choix architectural, un edge case piégeux ou une revue critique.
Et les chiffres sont parlants : sur SWE-bench Multilingual, Sonnet avec un advisor Opus passe de 72,1% à 74,8% (+2,7 points). Sur BrowseComp avec Haiku exécuteur, le bond est encore plus brutal : 19,7% → 41,2%. Et tout ça en réduisant le coût moyen par tâche agentique de 11,9% par rapport à un Opus monomodale.
Pour quiconque a une charge agentique non triviale, c'est un levier ROI qui ne demande qu'une ligne d'API à activer.
---
Le pattern executor + advisor expliqué {#pattern}
Le constat de base
Une tâche agentique alterne entre :
Le travail mécanique est rentable à faire en Sonnet 4.6 ou Haiku 4.5 (moins cher, plus rapide). Les décisions stratégiques bénéficient massivement d'Opus.
L'architecture en deux modèles
\\\text ┌──────────────────────────────────┐ │ EXECUTOR (Sonnet 4.6 / Haiku) │ │ Tourne en boucle agentic standard │ │ Exécute tools, lit, écrit, raisonne │ └────────────────┬─────────────────┘ │ Décision difficile ? │ ▼ (appelle "advisor" tool) │ ▼ ┌──────────────────────────────────┐ │ ADVISOR (Opus 4.7) │ │ Reçoit transcript complet (system, │ │ tools, turns, tool_results) │ │ Renvoie un conseil structuré │ └────────────────┬─────────────────┘ │ ▼ Executor reprend la main \\\
Ce que l'advisor voit
C'est le point clé que beaucoup ratent : l'advisor n'a pas besoin que vous lui passiez du contexte manuellement. Lors de l'appel, le serveur Anthropic forwarde automatiquement :
Concrètement, Opus voit la même conversation que l'executor, sans que vous ayez à packager quoi que ce soit côté client. C'est ce qui rend ses conseils contextualisés et utiles.
---
Comment activer le Advisor Tool dans l'API {#activation}
Le header beta
Côté Messages API, vous devez d'abord activer la feature :
\\\http anthropic-beta: advisor-tool-2026-03-01 \\\
La définition de l'outil
Vous ajoutez le tool natif advisor_20260301 dans votre tableau tools :
\\\json { "type": "advisor_20260301", "name": "advisor", "advisor_model": "claude-opus-4-7" } \\\
Le champ advisor_model choisit le modèle conseiller. Valeurs courantes :
claude-opus-4-7 (le plus puissant, recommandé)claude-opus-4-6 (équivalent qualité, moins cher sur certaines tâches)Exemple complet de requête
\\\`python import anthropic
client = anthropic.Anthropic()
response = client.messages.create( model="claude-sonnet-4-6", max_tokens=4096, extra_headers={"anthropic-beta": "advisor-tool-2026-03-01"}, tools=[ { "type": "advisor_20260301", "name": "advisor", "advisor_model": "claude-opus-4-7", }, # vos autres tools métier (bash, edit_file, etc.) ], system="You are a senior engineer. Call the advisor tool when you face a non-trivial architectural decision.", messages=[ {"role": "user", "content": "Refactor src/payments/ to support multi-currency settlements."} ], ) \\\`
Format de l'appel par l'executor
Quand l'executor décide de consulter le conseiller, il émet un tool_use standard :
\\\json { "type": "tool_use", "name": "advisor", "input": { "question": "I'm hesitating between adding a CurrencyConverter class or extending Money with a currency field. The codebase uses value objects elsewhere. What's the cleanest approach given the test suite I just read?" } } \\\
Le serveur Anthropic exécute alors un appel Opus en arrière-plan, retourne un tool_result avec le conseil structuré, et l'executor continue la conversation.
---
Benchmarks : -12% de coût, +2,7 points SWE-bench {#benchmarks}
Les chiffres publiés par Anthropic sont concrets. Voici les benchmarks principaux.
SWE-bench Multilingual (Sonnet 4.6 + Opus advisor)
| Configuration | Score | Coût relatif |
|---|---|---|
| Opus 4.7 seul | 75,3% | 100% (référence) |
| Sonnet 4.6 + Opus advisor | 74,8% | ~67% |
| Sonnet 4.6 seul | 72,1% | ~50% |
Le pattern executor + advisor récupère la quasi-totalité de la qualité d'Opus pour 2/3 du coût.
BrowseComp (Haiku 4.5 + Opus advisor)
| Configuration | Score |
|---|---|
| Haiku 4.5 seul | 19,7% |
| Haiku 4.5 + Opus advisor | 41,2% |
Plus que doublé. Sur les tâches où l'exécuteur natif est faible, l'advisor change la classe de performance.
Coût agentique réel
Anthropic rapporte -11,9% de coût moyen par tâche agentique vs un agent 100% Opus. La logique est simple : la majorité des tours sont du travail mécanique (lecture, patch, run tests) que Sonnet ou Haiku abat sans souci. Les ~10-15% de tours qui demandent du raisonnement profond appellent l'advisor.
Pourquoi ça marche
Trois raisons techniques :
---
Quand le writer demande conseil — la heuristique {#heuristique}
Les signaux qui déclenchent un appel advisor
Le system prompt joue un rôle décisif pour calibrer quand l'executor doit déranger l'advisor. Quelques patterns qui marchent bien :
\\\`text Call the advisor tool when:
Do NOT call the advisor for:
\\\`
Cette heuristique limite les appels advisor à ~10-20% des tours sur une tâche moyenne, ce qui maintient le ROI.
Le piège du "panic advisor"
Sans cadrage, certains executors développent un réflexe panique : ils consultent l'advisor à chaque mini-décision. Résultat : le coût explose et vous perdez le bénéfice du pattern. La règle d'or : l'advisor est un senior qu'on dérange pour les vraies questions, pas un compagnon de pair-programming pour chaque ligne.
Le piège inverse : executor trop confiant
Symétriquement, un Sonnet/Haiku peut "foncer dans le mur" sur une mauvaise hypothèse sans jamais consulter. Symptôme : vos taux d'échec sur les tâches dures restent élevés malgré l'advisor activé. Reformulez le system prompt pour encourager l'usage sur les décisions stratégiques.
---
Cas d'usage où le pattern brille {#cas-usage}
1. Refactorings complexes
Un agent applique un refactoring qui touche plusieurs modules. Le Sonnet executor fait le travail de patch et de vérification, l'Opus advisor tranche les choix d'architecture (ex: "pattern stratégie vs héritage", "garder la backward compat ou pas").
2. Debug multi-hypothèses
Quand un test échoue sans message clair, l'advisor aide à hiérarchiser les hypothèses. C'est exactement le cas où Opus brille — son raisonnement structuré sur des causes possibles est supérieur.
3. Browse + extraction (BrowseComp)
L'executor Haiku est rapide pour parcourir des pages et clicker. Mais quand vient le moment d'interpréter une page complexe ou de décider quel lien suivre, l'advisor donne le verdict. D'où le bond 19,7% → 41,2%.
4. Code Review automatisée
Combiné avec [Code Review d'Anthropic](/blog/claude-code-review-multi-agent), le pattern advisor permet à l'agent reviewer (Sonnet) de creuser un point précis avec Opus. Vous obtenez la profondeur d'Opus sur les findings critiques sans le coût d'une review Opus complète.
5. Migration de code legacy
Un agent migre un fichier d'une stack à une autre. Sonnet patch et teste, Opus tranche les cas tordus ("comment porter ce useEffect qui dépend de 3 contexts en Server Component ?").
6. Agents de support technique
L'executor Haiku répond aux questions standards. L'advisor Opus est consulté quand la question demande un raisonnement profond sur un cas client. Excellent rapport coût/qualité pour scaler un support.
---
Advisor Tool vs Managed Agents Multiagent {#comparaison}
Les deux concepts peuvent se confondre. Voici la distinction nette.
| Aspect | Advisor Tool | Multiagent Orchestration |
|---|---|---|
| Pattern | 1 executor consulte 1 conseiller | 1 lead orchestre N spécialistes |
| Spécialistes | Le conseiller n'agit pas | Chaque spécialiste exécute des tools |
| Parallélisme | Aucun (advisor synchrone) | Spécialistes en parallèle |
| Filesystem partagé | Non | Oui (artifacts shared) |
| Activation | Tool natif via header beta | Configuration agent managé |
| Coût | Surcoût Opus ponctuel | Coût plein des spécialistes |
| Cas d'usage | Décisions difficiles ponctuelles | Tâches lourdes décomposables |
En pratique, les deux se cumulent : un agent managé multiagent peut intégrer le Advisor Tool pour ses spécialistes Sonnet ou Haiku. Pour le côté managé, voir notre article sur [Claude Managed Agents pour entreprises](/blog/claude-managed-agents-entreprises-2026).
---
Pièges classiques à éviter {#pieges}
Piège 1 : oublier que l'advisor ne fait pas d'actions
L'advisor renvoie du texte. Il ne lit pas de fichier, n'exécute pas de commande. Si votre executor pose une question type "lis tel fichier et dis-moi ce qu'il fait", l'advisor répondra "je n'ai pas accès au fichier, demande à l'executor de le lire d'abord". Reformulez les questions.
Piège 2 : appeler l'advisor au mauvais moment
Si vous appelez l'advisor avant que l'executor ait collecté le contexte nécessaire (ex: avant d'avoir lu les fichiers concernés), l'advisor répond sur la base du peu qu'il a. Toujours pré-charger le contexte côté executor avant la consultation.
Piège 3 : trop d'appels advisor consécutifs
Chaque appel advisor est synchrone et coûteux. Deux appels consécutifs sur le même sujet sont presque toujours le signe d'une question mal posée. Reformulez en un seul appel avec tous les éléments.
Piège 4 : ignorer la trace du conseil
Le conseil de l'advisor est dans le tool_result. C'est une mine d'or pour comprendre comment l'executor raisonne et où il bloque. Si vous loggez les transcripts, gardez systématiquement ces tool_results dans votre observabilité.
Piège 5 : passer le mauvais modèle en `advisor_model`
Mettre Sonnet ou Haiku en advisor_model retire l'intérêt du pattern (vous payez 2x le même modèle). L'advisor doit toujours être au-dessus de l'executor en capacité. Sonnet executor + Opus advisor est la combinaison nominale.
---
Bonnes pratiques en production {#bonnes-pratiques}
1. Mesurez le ratio "tours executor / tours advisor"
Un ratio sain tourne autour de 5-10:1. Si vous descendez à 2:1, l'executor sur-consulte et vous perdez le ROI. Si vous montez à 30:1, l'executor sous-consulte et la qualité chute. Ajustez le system prompt.
2. Cachez les system prompts longs
Le system prompt est inclus dans chaque appel advisor. Activez le [prompt caching](/blog/claude-code-analytics-api-metriques-equipe) pour ne pas re-payer le préfixe à chaque consultation.
3. Loggez les questions et les réponses
Un journal "advisor questions + answers" devient un dataset précieux pour :
4. Combinez avec un système de routes
Si vous opérez plusieurs types de tâches, certaines bénéficient peu de l'advisor (tâches mécaniques pures). Routez les requêtes simples vers un Sonnet sans advisor et les requêtes complexes vers la combo. Économie supplémentaire de 20-30%.
5. Surveillez la dérive de qualité
Lancez une éval quotidienne sur 50 tâches représentatives. Si le score chute, vérifiez : modèle exécuteur déprécié ? Modèle advisor changé ? System prompt drifté ? L'observabilité est plus importante avec un pipeline à deux modèles.
6. Préférez Opus 4.7 comme advisor
[Opus 4.7](/blog/claude-opus-4-7-guide-nouveau-modele-claude-code) bat Opus 4.6 sur les benchmarks de raisonnement long et de software engineering — le sweet spot exact du Advisor Tool. À tarification équivalente, c'est le défaut recommandé.
---
FAQ {#faq}
Le Advisor Tool est-il disponible dans Claude Code CLI ?
Pas directement. C'est une feature native de la Claude Platform (Messages API). Pour Claude Code, vous l'utilisez si vous opérez vos propres agents via SDK. Pour le CLI standard, le [pricing reste basé sur le modèle sélectionné](/blog/claude-code-vs-cursor).
Quel est le coût exact d'un appel advisor ?
Un appel advisor = 1 tour Opus complet. Le prompt inclut le transcript jusqu'au point d'appel + la question. Comptez en moyenne 0,05-0,30 USD par consultation selon la longueur de la conversation. Le prompt caching réduit fortement ce coût sur les sessions longues.
Peut-on enchainer plusieurs advisors différents ?
Oui. Vous pouvez déclarer plusieurs tools advisor avec des noms et modèles différents. Par exemple : security_advisor qui pointe sur Opus 4.7 avec un system prompt sécurité, architect_advisor qui pointe sur Opus 4.6 avec un system prompt architecture. L'executor choisit lequel consulter selon la question.
Le advisor a-t-il une mémoire entre appels ?
Non, chaque appel advisor est un tour API isolé. Il voit le transcript complet de la conversation principale, donc en pratique il a accès à toutes les interactions précédentes (y compris les conseils qu'il a donnés plus tôt). Mais il n'a pas de state propre.
Peut-on tester Advisor Tool en local avec Ollama ou un modèle open-source ?
Non, le Advisor Tool est natif Claude Platform. Pour reproduire le pattern manuellement, vous pouvez le coder côté client en faisant un appel à un modèle supérieur quand votre executor déclare une "tool call" custom. C'est exactement ce que [Claude Code Agent Teams](/blog/claude-code-agent-teams) faisait avant le tool natif.
Quand préférer Opus 4.6 vs 4.7 comme advisor ?
Opus 4.7 est meilleur sur software engineering et tâches longues. Opus 4.6 reste excellent et est moins cher sur certaines régions. Si vos benchmarks ne montrent pas de différence > 1 point, gardez Opus 4.6 pour économiser.
L'advisor peut-il refuser de répondre ?
Très rarement. Si la question viole les politiques de modération Anthropic, oui. En pratique pour des cas d'usage code/produit normaux, jamais.
Comment intégrer Advisor Tool dans un agent existant ?
Trois étapes : (1) ajouter le header beta, (2) déclarer le tool dans le tableau tools, (3) ajouter dans le system prompt des instructions pour quand l'appeler. Pas de migration de code applicatif nécessaire.
Est-ce compatible avec Skills et MCP ?
Oui. L'advisor cohabite avec les [serveurs MCP](/blog/mcp-model-context-protocol-claude-code) et les [Skills personnalisés](/blog/claude-code-skills-creer-commandes-personnalisees). L'executor peut utiliser tout son arsenal de tools en plus de l'advisor.
Existe-t-il un mode "batch" pour amortir le coût ?
Pas spécifiquement, mais le [Batch API d'Anthropic](https://docs.claude.com/en/api/messages-batches) fonctionne avec les agents et le advisor inclus. Pour des charges nocturnes, c'est 50% moins cher.
---
*Sources : Anthropic Advisor Tool docs (platform.claude.com/docs/en/agents-and-tools/tool-use/advisor-tool), Anthropic Engineering blog "Advanced tool use" (9 avril 2026), BuildFastWithAI strategy analysis, TestingCatalog coverage, LiteLLM rollout issue #25516, Anthropic SWE-bench/BrowseComp benchmarks.*
Envie de maîtriser Claude Code ?
Rejoignez notre formation complète et apprenez à utiliser Claude Code comme un pro.
Découvrir la formation