

Temps de lecture : 3 min
Points clés à retenir
- Profondeur réglable : Claude Opus 4.8 propose cinq niveaux d’effort (Low à Max) pour ajuster la réflexion du modèle.
- Économie de tokens : aligner le niveau sur la complexité de la tâche évite de gaspiller des tokens sur des requêtes simples.
- Réglage simple : il s’effectue en quelques clics depuis le sélecteur de modèle, sous la zone de saisie.
Pourquoi régler l’effort de Claude ?
Toutes les requêtes ne demandent pas la même profondeur d’analyse. Avec Claude Opus 4.8, Anthropic introduit un contrôle direct du niveau d’effort : cela permet d’ajuster la puissance de réflexion du modèle et, par extension, sa consommation de tokens. Passons au concret : vous pouvez demander à Claude de réfléchir intensément sur un problème complexe, ou au contraire répondre rapidement à une question simple. En pratique, c’est un levier d’économie immédiat pour les équipes qui utilisent l’IA en production.
Cinq niveaux d’effort disponibles
Le niveau d’effort n’est pas un budget de tokens fixe, mais un signal de comportement : plus il est élevé, plus Claude raisonne longuement avant de répondre. La qualité progresse sur les tâches difficiles, mais le temps de réponse augmente et vos crédits s’épuisent plus vite. À l’inverse, un niveau bas accélère la réponse et consomme moins de ressources.
- Low : pour les requêtes simples, quand la rapidité prime sur la profondeur.
- Medium : un compromis entre vitesse et qualité.
- High : le niveau par défaut, adapté à la majorité des usages.
- Extra : un cran supplémentaire pour les tâches exigeantes.
- Max : la réflexion la plus poussée, pour les problèmes les plus complexes.
Un bouton « Thinking », distinct des niveaux d’effort, permet par ailleurs d’activer la réflexion étendue de Claude sur les tâches complexes.
Comment effectuer le réglage ?
Décortiquons la structure du réglage. Il se trouve directement dans le sélecteur de modèle, sous la zone de saisie de la requête. En quelques clics :
- Cliquez sur le nom du modèle (par exemple « Opus 4.8 ») affiché sous le champ de message.
- Dans le menu, ouvrez l’option « Effort ».
- Sélectionnez le niveau souhaité parmi Low, Medium, High, Extra ou Max.
Le niveau retenu s’affiche ensuite à côté du nom du modèle — par exemple « Opus 4.8 High » — ce qui permet de vérifier le réglage en cours d’un simple coup d’œil. Le même menu donne accès au bouton « Thinking » pour activer ou désactiver la réflexion étendue.
Quel niveau choisir pour économiser des tokens ?
La logique d’économie est simple : aligner le niveau d’effort sur la complexité réelle de la tâche, plutôt que de laisser Claude raisonner à plein régime en permanence. Sur le terrain, voici les cas d’usage typiques :
- Reformulation, correction, question factuelle : les niveaux Low ou Medium suffisent, et préservent vos limites d’usage.
- Tâches professionnelles courantes : le niveau High, défini par défaut, couvre la majorité des cas.
- Analyse de fond, code complexe, raisonnement multi-étapes : les niveaux Extra et Max sont à réserver aux tâches qui le justifient vraiment.
Le niveau Max, en particulier, est à manier avec parcimonie : il consomme un volume de tokens important. Si c’est complexe, c’est que c’est mal réglé. En pratique, commencez par High et ajustez vers le bas ou vers le haut selon vos besoins réels.