
Cuánto gasta tu Claude Code: tokens y coste en VS Code
TL;DR
Un dashboard de uso de Claude Code te muestra cuántos tokens consumes, cuánto cuesta cada sesión y cuánto te queda de límite, sin salir de VS Code. No hay una extensión oficial de Anthropic para esto, pero el Marketplace está lleno de extensiones de comunidad que leen tus ficheros de sesión locales y lo pintan en una barra de estado. Lo nativo y oficial vive en el comando /usage, la statusline y OpenTelemetry. Aquí ves cuál usar según si quieres un vistazo rápido, histórico para presupuestar o un panel de equipo.
El problema: programas a ciegas sobre tu factura
Claude Code consume tokens en cada turno y no pone un contador grande delante de ti. Con un plan de suscripción gastas cupo de unas ventanas de uso; con la API gastas euros directos. En ambos casos el dolor es el mismo: te enteras de que ibas rápido cuando ya te han cortado a mitad de tarea o cuando llega el cargo.
En mi experiencia migrando flujos de trabajo a agentes de código, el consumo no es lineal ni intuitivo. Un refactor de varios ficheros con razonamiento alto puede gastar en diez minutos lo que una mañana entera de preguntas cortas. Sin un dashboard de uso de Claude Code dentro del editor, ese gasto es invisible hasta que duele.
Medir el consumo no es contabilidad opcional. Es parte del flujo: te dice qué prompts disparan el gasto, cuándo conviene bajar de modelo y cuánto margen real te queda antes de un límite.
¿Qué es la observabilidad de consumo en Claude Code?
La observabilidad de consumo es la capacidad de ver, en tiempo real o de forma histórica, cuántos tokens y cuánto coste genera tu uso de Claude Code. Se apoya en un dato que ya existe en tu máquina: cada sesión queda registrada en ficheros JSONL dentro de ~/.claude/projects/, con los tokens de entrada, salida, creación de caché y lectura de caché, y el modelo usado en cada turno.
Esa es la clave que casi nadie aprovecha. No necesitas un servicio externo para saber lo que gastas, porque el registro está en local. Las herramientas que verás abajo se limitan a leer esos ficheros y presentarlos de forma legible, o a exportar las mismas métricas por un canal estándar.
Lo nativo: el comando /usage y la statusline
Antes de instalar nada, Claude Code ya trae dos formas oficiales de mirar el gasto.
El comando /usage (con sus alias /cost y /stats) es el camino más directo. Dentro de una sesión te muestra el coste estimado, los tokens, la duración y los cambios de código. En planes Pro, Max, Team y Enterprise añade además barras de límite de plan, con la ventana de 5 horas y el cap semanal, y atribuye el uso reciente a skills, subagentes, plugins y servidores MCP. Las teclas d y w alternan entre las últimas 24 horas y los últimos 7 días.
Hay un matiz importante: ese euro o dólar es una estimación local calculada desde los tokens, no tu factura. Solo cuenta el historial de esa máquina, así que no incluye otros dispositivos ni el uso de claude.ai con la misma cuenta.
La statusline nativa deja el dato siempre a la vista. Recibe por stdin un JSON con cost.total_cost_usd y context_window.used_percentage, entre otros campos, y lo pintas debajo del prompt. Como mantiene totales acumulados de respuestas ya finalizadas, suele ser más fiable para el agregado de sesión que leer el JSONL en crudo. Contexto y coste van de la mano, y por eso conviene tenerlos juntos: lo desarrollé al hablar de las capas de memoria y contexto en Claude Code, porque cuanto más llenas la ventana, más pagas por turno.
Extensiones de VS Code que sí existen (todas de comunidad)
Anthropic no publica una extensión oficial de tokens, pero la comunidad ha llenado ese hueco. Casi todas leen los mismos JSONL locales y los pintan dentro del editor. Estas son las verificadas a fecha de este artículo (junio de 2026), con su ID exacto del Marketplace, porque varias tienen nombres casi idénticos:
| Extensión (ID Marketplace) | Qué te da | Fuente de datos |
|---|---|---|
Claude Code Usage Dashboardman-vu.claude-code-usage-dashboard | Barra de estado más panel analítico: rate limits, coste equivalente a API, tokens, caché y distribución por modelo y proyecto | JSONL local; una llamada de red solo para el rate limit |
Claude Code Usage Monitorsuzuki0430.ccusage-vscode | Coste de hoy en la barra, refresco cada 30 s, tabla de los últimos 7 días. Funciona en VS Code y Cursor | JSONL local (inspirada en ccusage) |
Claude Code Usagegrowthjack.claude-code-usage | Coste de hoy y de la sesión, cuota de 5 h y semanal, advisor opcional. Multi-idioma con español parcial. MIT | Logs locales, estima por precio público |
Claude Code Dashboardjspw.claude-code-dashboard | Pestañas Overview, Charts, Search e Insights: tendencia de 30 días, heatmap, hot files, búsqueda de prompts. AGPL-3.0 | Todo local, sin API key |
ClusageAjax1029.clusage | Gasto del día, cuota 5 h/semanal real, reset timer y panel de 6 secciones. Refresco por file-watcher | JSONL local + headers de rate limit vía OAuth |
El detalle que separa a unas de otras es de dónde sacan la cuota. Las que muestran el límite real de 5 horas y semanal (como Clusage o el dashboard de man-vu) hacen una llamada mínima a api.anthropic.com para leer los headers anthropic-ratelimit- usando el token OAuth de tu ~/.claude/.credentials.json. Las demás solo estiman coste multiplicando tokens por precio público.
ccusage: el histórico que sí presupuesta
ccusage, de ryoppippi, es la herramienta de línea de comandos de comunidad que se ha vuelto el estándar de facto. Lee tus JSONL locales y agrega el gasto por día, mes, sesión y bloques de 5 horas. No es una extensión de editor, pero varias de las de arriba la usan como motor por debajo.
Se ejecuta sin instalación previa con npx:
# Resumen de consumo por dia leyendo los ficheros locales de sesion
npx ccusage@latest daily
# Bloques de 5h: mapea la ventana de uso y te dice cuanto queda en la actual
npx ccusage@latest blocks
El modo blocks es el más útil con suscripción, porque dibuja la ventana de facturación de 5 horas y el burn rate. El desglose por modelo (--breakdown) te enseña negro sobre blanco cuánto cuesta tirar de Opus frente a Sonnet, una decisión que toqué al comparar cuándo elegir Opus o Sonnet en Claude Code. Estima el coste con el pricing de LiteLLM, así que conviene usar siempre @latest para que los precios estén al día.
También trae su propia statusline (ccusage statusline), que muestra coste de sesión, del día y del bloque, burn rate con colores y porcentaje de contexto usado, todo en la barra inferior.
Para un panel de equipo: OpenTelemetry
Si quieres un dashboard standalone, con gráficas históricas y agregado de varias personas, el camino oficial es la exportación por OpenTelemetry (OTEL). Claude Code emite métricas, eventos y traces (estos en beta) sin SDK ni wrapper, solo con variables de entorno:
# Activa la telemetria y exportala por OTLP a tu colector
export CLAUDE_CODE_ENABLE_TELEMETRY=1
export OTEL_METRICS_EXPORTER=otlp
export OTEL_EXPORTER_OTLP_ENDPOINT=http://localhost:4317
Las métricas tienen nombres exactos: claude_code.token.usage (desglosado por tipo input, output, cacheRead y cacheCreation, y por usuario, equipo y modelo) y claude_code.cost.usage en dólares, además de líneas de código, commits y pull requests. Las recoges en Prometheus o Grafana; existe incluso un dashboard publicado en Grafana Labs (ID 25255) listo para consumir estas métricas.
Dos avisos prácticos. El primero: hay una latencia normal de unos 75 a 90 segundos antes de ver datos, porque Claude Code exporta cada 60 segundos y Prometheus scrapea cada 15. El segundo: el contenido sensible (prompts, parámetros de Bash, bodies de la API) está desactivado por defecto, lo cual está bien, pero tenlo en cuenta si esperabas verlo.
Extensión de editor frente a panel standalone
La elección de fondo es esta: extensión dentro de VS Code si quieres el número donde ya trabajas y te basta con el día y la sesión, o dashboard OTEL standalone si necesitas historial, comparativas y agregado de varios usuarios para FinOps. No son excluyentes. Lo habitual en solitario es ccusage o una extensión para el día a día, y OTEL solo cuando hay un equipo que presupuestar.
En Producción
Cuando esto deja de ser un experimento y se vuelve tu forma de trabajar diaria, importan los números reales.
- Suscripción frente a API: los planes son Pro a 20 $ al mes (unos 18 €), Max 5x a 100 $ (unos 92 €) y Max 20x a 200 $ (unos 184 €). Con suscripción no pagas por token sino cupo, así que el dato que importa no es el coste en euros, es cuánto cupo te queda. Max no es otro modelo, es más margen sobre los mismos modelos.
- Coste de API: el output cuesta 5 veces el input en todos los modelos actuales, y los descuentos de verdad vienen del Batch API (un 50% menos) y del prompt caching (hasta un 90% menos sobre el input cacheado). Para un desarrollador con proyectos pequeños y medianos, un gasto razonable suele moverse entre 10 y 50 € al mes. Las cifras exactas por modelo cambian con cada versión, así que verifícalas en la página oficial de Anthropic, que advierte que están sujetas a cambio.
- Doble límite simultáneo: una ventana móvil de 5 horas más un cap semanal (vigente desde agosto de 2025), con un sub-límite más estricto para Opus. Al tocar cualquiera de los dos se bloquean los prompts hasta el reset, sin override manual. Y el pool es compartido entre Claude Code y claude.ai con la misma cuenta. Ojo, estos límites se mueven mes a mes: trata cualquier número como caducable.
- El gasto lo dispara la configuración, no el modelo: el nivel de razonamiento, el tamaño del contexto y los fallos de caché pesan más que la etiqueta del modelo. Lo desarrollé en por qué la configuración pesa más que el modelo en los coding agents y, en concreto sobre factura, en las cosas que disparan tu factura por cache miss en Claude Code.
Errores comunes y depuración
Error: el euro que muestra /usage o una extensión no cuadra con tu factura. Causa: todas estas cifras son estimaciones por precio público multiplicado por token, no facturación. Con suscripción el uso va incluido en la cuota. Solución: para facturación autoritativa usa el Console web de Anthropic; con plan de suscripción mira tokens y porcentaje de cupo, no euros.
Error: Claude Code te cobra a tarifa API aunque tengas plan Max. Causa: tienes ANTHROPIC_API_KEY exportada en el shell, y Claude Code la detecta y factura por token ignorando la suscripción. Solución: quita esa variable del entorno cuando uses tu plan; el extra de pago por token puede costar varios euros por hora con Opus.
Error: una extensión que solo lee JSONL reporta menos consumo del real. Causa: Claude Code escribe el JSONL durante el streaming, así que muchas entradas tienen input_tokens en 0 o 1 y hay duplicados por requestId. Solución: usa herramientas que deduplican por requestId, o fíate de la statusline y del comando nativo para el agregado de sesión.
Preguntas frecuentes
¿Hay un dashboard oficial de uso de Claude Code en VS Code?
No. A junio de 2026 Anthropic no publica una extensión oficial de tokens. Lo oficial es el comando /usage, la statusline y la exportación por OpenTelemetry. Para un panel dentro del editor tienes extensiones de comunidad como las de man-vu, suzuki0430 o GrowthJack, y para histórico por consola, ccusage.
¿Estas herramientas envían mi código a algún servidor?
Las basadas en JSONL y ccusage procesan todo en local. Algunas hacen una llamada mínima a la API solo para leer tus límites de cuota usando el token OAuth que ya tienes. Si montas OpenTelemetry hacia un colector remoto, ahí sí sale tráfico de tu máquina, aunque el contenido sensible va desactivado por defecto.
¿Cómo sé cuánto me queda de límite con un plan Max?
El comando /usage muestra barras con la ventana de 5 horas y el cap semanal en planes de suscripción. Para verlo siempre en el editor, una extensión que lea los headers de rate limit, como Clusage, te da el porcentaje y el tiempo de reset sin abrir otra ventana.
Lo que te llevas
Hemos visto que el dato de consumo ya está en tu máquina y que medirlo es cuestión de elegir la lente adecuada: /usage y la statusline para lo nativo, una extensión de comunidad si quieres el panel dentro de VS Code, ccusage para presupuestar con histórico y OpenTelemetry cuando hay un equipo detrás. La clave está en convertir el gasto en algo visible, porque lo que no se mide se dispara sin avisar, y la mitad de los sustos vienen de detalles tontos como una ANTHROPIC_API_KEY olvidada en el shell.
Si trabajas con razonamiento alto, el siguiente paso natural es cruzar este consumo con cuándo merece la pena subir el esfuerzo, algo que tienes en cuándo subir el effort a max en Claude Code y cuándo no. ¿Ya vigilas tus tokens o programas a ciegas? Cuéntamelo en los comentarios o en Twitter @sergiomarquezp_.


