Image for post Effort en Claude Code: cuándo subir a max y cuándo no

Effort en Claude Code: cuándo subir a max y cuándo no


TL;DR: El effort level en Claude Code controla cuánto razona el modelo antes de actuar. Con Claude Opus 4.7 hay cinco niveles (low, medium, high, xhigh y max) y Claude Code usa xhigh por defecto en todos los planes. Subir a max no mejora casi nada en tareas normales y dispara el gasto de tokens; lo rentable es ajustar el effort por tipo de tarea con el comando /effort.

El modelo no es la única palanca que eliges

En Claude Code llevas tiempo decidiendo entre Opus y Sonnet según la tarea. Desde Claude Opus 4.7 hay una segunda palanca, igual de importante y mucho menos visible: el effort level, es decir, cuánto razonamiento le dejas gastar al modelo antes de responder.

El problema es que casi nadie la toca. Claude Code trae un valor por defecto, funciona, y la mayoría seguimos a lo nuestro. Pero ese valor por defecto está pensado para el caso medio, no para tu tarea concreta. Renombrar una variable y refactorizar tres módulos no necesitan el mismo presupuesto de razonamiento, y pagarlos igual significa o ir lento de más o gastar tokens de más.

Ajustar el effort por tipo de tarea es una de esas decisiones de workflow que cuestan diez segundos y se notan toda la sesión. Igual que vimos al explicar por qué la configuración pesa más que el modelo elegido, aquí el ajuste fino importa tanto como la elección grande.

¿Qué es el effort level en Claude Code?

El effort level es el dial que le dice a Claude cuánto trabajo invertir en una respuesta: más razonamiento, más llamadas a herramientas, más exploración y más comprobaciones. Subir el effort no cambia el modelo, cambia cuánto piensa ese modelo antes y durante la tarea.

Con Opus 4.7 hay cinco niveles: low, medium, high, xhigh y max. Opus 4.6 y Sonnet 4.6 solo exponen cuatro (low, medium, high y max): xhigh es nuevo de 4.7.

Conviene no confundir el effort con el extended thinking. En Opus 4.7 el pensamiento es adaptativo: se activa o no, sin presupuesto fijo de tokens. El effort es la palanca de alto nivel; el thinking adaptativo es la mecánica que hay debajo.

¿Qué cambió con xhigh en Opus 4.7?

xhigh es un nivel intermedio entre high y max, pensado para coding agéntico y flujos largos con muchas herramientas. Da margen al modelo para explorar, retroceder y razonar a lo largo de muchos pasos sin pagar la latencia completa de max.

El detalle que se pasa por alto: en Claude Code, Opus 4.7 usa xhigh por defecto en todos los planes. En Opus 4.6 y Sonnet 4.6 el defecto es high, o medium en los planes Pro y Max. Si actualizaste de 4.6 a 4.7 y notaste respuestas más lentas o más caras, parte de eso es el salto silencioso del valor por defecto.

Anthropic también recoge que el nivel low de Opus 4.7 rinde aproximadamente como el medium de Opus 4.6. Toda la escala se ha desplazado hacia arriba, así que los niveles ya no significan lo mismo que antes de la actualización.

Cómo cambiar el effort level paso a paso

El control principal dentro de Claude Code es el comando /effort, uno más de los slash commands de Claude Code. Lo ejecutas y eliges nivel de una lista.

# Fija el nivel de razonamiento; persiste entre sesiones
/effort xhigh

# Sube a max solo para la tarea actual (max no persiste)
/effort max

# Deja que Claude Code decida el nivel por ti
/effort auto

Tu elección se guarda entre sesiones, con una excepción: max solo aplica a la sesión actual. Es deliberado, max no está pensado para vivir ahí de forma fija.

Para fijarlo fuera de la sesión interactiva tienes la variable de entorno y el flag de la CLI:

# Arranca Claude Code con un effort por defecto
CLAUDE_CODE_EFFORT_LEVEL=high claude

# O directamente con el flag de la CLI
claude --effort high

Y si quieres dejarlo escrito en la configuración del proyecto, en settings.json:

{
  "effortLevel": "high"
}

Qué nivel usar según la tarea

NivelCuándo usarlo
lowTareas cortas, acotadas y sensibles a latencia que no exigen inteligencia: lookups, formateo, renombrados.
mediumTrabajo sensible al coste que admite ceder algo de calidad a cambio de gastar menos tokens.
highMínimo recomendable para trabajo que sí exige inteligencia, o para gastar menos que xhigh.
xhighMejor resultado para la mayoría de tareas de código y agénticas. Defecto recomendado en Opus 4.7.
maxPuede ayudar en tareas muy exigentes, pero con rendimientos decrecientes y tendencia a sobrepensar. Pruébalo antes de adoptarlo.

Un día normal: cuándo bajo y cuándo subo el effort

En la práctica, el effort no se toca una vez y se olvida: se mueve con el tipo de trabajo. Un patrón que funciona en el día a día es tratar el nivel como parte del enunciado de la tarea, no como una preferencia fija.

Para tareas mecánicas (ajustar imports, renombrar, escribir un test trivial, formatear un JSON) bajo a low o medium. Son cosas donde correcto y rápido gana a perfecto y lento, y el modelo no necesita explorar nada.

Para el grueso del trabajo de código (implementar una feature, depurar un bug con varias hipótesis, refactor de varios archivos) me quedo en xhigh, el defecto. Es el punto donde el modelo explora y verifica sin irse de presupuesto.

Reservo max para lo que de verdad lo pide: un bug que se resiste, una decisión de arquitectura con muchos caminos, una revisión donde un fallo sale caro. Y lo activo con /effort max sabiendo que se queda en esa sesión. La regla mental es simple: el effort debería seguir a la dificultad de la tarea, no a tu ansiedad por que salga bien.

En producción: coste, latencia y límites

Lo que en el tutorial es un dial más, en producción es una línea de tu factura. Opus 4.7 cuesta alrededor de 4,60€ por millón de tokens de entrada y 23€ por millón de salida. El effort no cambia ese precio por token, cambia cuántos tokens se gastan.

Y la diferencia no es pequeña. Una prueba pública que recorrió las cinco tiers con los mismos problemas de código encontró que el coste por tarea puede variar hasta 2,7 veces entre el nivel más barato y el más caro. Para un desarrollador que gasta entre 10 y 50€ al mes en API, elegir mal el effort de forma sistemática mueve ese rango de forma perceptible.

Tres cosas a tener en cuenta antes de fijar un nivel:

  • Latencia. Más effort es más tiempo de respuesta. En tareas interactivas, max puede romper tu ritmo a cambio de una mejora marginal.
  • Sobrepensar. Anthropic avisa de que max tiene rendimientos decrecientes y tiende a sobreanalizar. Más razonamiento no es siempre mejor razonamiento.
  • Tokens y tokenizer. Opus 4.7 razona más en los turnos tardíos de sesiones agénticas y usa un tokenizer nuevo que mapea el mismo texto a entre un 0 y un 35% más de tokens que 4.6. El gasto sube por dos vías a la vez.

En sesiones largas esto se nota especialmente: si trabajas en horas pico y sesiones largas, un effort alto consume tu cuota antes. Y si te preocupa el contexto, recuerda que gestionar la memoria en capas es una palanca distinta y complementaria: el effort regula cuánto piensa el modelo, la memoria regula con qué piensa.

Errores comunes al ajustar el effort

Error: dejar max como nivel fijo por si acaso. Causa: asumir que más razonamiento siempre da mejor resultado. Solución: usa xhigh como base y sube a max puntualmente con /effort max; no persiste a propósito.

Error: respuestas más lentas y caras tras actualizar a Opus 4.7. Causa: el defecto en Claude Code subió de high a xhigh, sumado al tokenizer nuevo. Solución: si tu trabajo tolera algo menos de profundidad, baja a high con /effort high.

Error: CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING no hace nada. Causa: esa variable controlaba el thinking de presupuesto fijo de 4.6; en Opus 4.7 el pensamiento es adaptativo y la variable se ignora. Solución: gestiona la profundidad con /effort; para desactivar el thinking por completo, usa MAX_THINKING_TOKENS=0.

Preguntas frecuentes

¿Cuál es el mejor effort level para programar en Claude Code?

Para la mayoría de tareas de código, xhigh, que es el defecto en Opus 4.7. Anthropic recomienda empezar en high o xhigh y reservar max para problemas concretos muy exigentes.

¿El effort level cambia el precio por token?

No. El precio por token de Opus 4.7 es fijo. El effort cambia cuántos tokens se consumen: más effort significa más razonamiento y más tokens de salida, así que la factura sube aunque la tarifa no.

¿Se puede usar xhigh con Sonnet 4.6?

No. xhigh es exclusivo de Opus 4.7. Opus 4.6 y Sonnet 4.6 solo exponen low, medium, high y max.

Lo que me llevo

El effort en Claude Code es una decisión de workflow diaria, no un ajuste que tocas una vez. Hemos visto que con Opus 4.7 hay cinco niveles, que xhigh es el punto dulce para coding y que max rara vez compensa fuera de problemas concretos. La clave está en hacer que el effort siga a la dificultad real de la tarea: bajar en lo mecánico, quedarse en xhigh para el grueso y subir a max solo cuando un fallo sale caro.

Si interiorizas eso, dejas de pagar razonamiento que no necesitas y de ir lento donde sí lo necesitas. ¿Has medido cuánto te cambia la factura según el effort? Cuéntamelo en los comentarios o en Twitter @sergiomarquezp_. En el próximo artículo le toca el turno a los task budgets de la API, la otra forma de controlar el gasto de tokens en runs largos.

Compartir X LinkedIn