2026-05-11 11:50:24 +07:00

16 KiB

Raw Blame History

Seguimiento de cuota y monitoreo de uso

Rastrea el consumo de tokens en tiempo real, monitorea los límites de cuota, estima costos y recibe alertas antes de quedarte sin recursos. Nunca desperdicies cuota de suscripción ni excedas los límites de presupuesto.

Resumen

9Router proporciona un seguimiento de cuota integral para todos los proveedores:

Consumo de tokens en tiempo real - Mira los tokens usados por solicitud
Límites de cuota y restantes - Rastrea el uso vs límites
Cuenta regresiva de reinicio - Sabe cuándo se refresca la cuota
Estimación de costos - Calcula el gasto para niveles de pago
Reportes mensuales - Analiza patrones de uso
Alertas y notificaciones - Recibe advertencias antes de los límites

Resumen del dashboard

Resumen de cuota

Dashboard → Home → Quota Overview

┌─────────────────────────────────────────────┐
│ Claude Code (cc/)                           │
│ ████████████░░░░░░░░ 2.5h / 5h (50%)       │
│ Se reinicia en: 2h 30m                      │
│ Costo: $0 (suscripción)                     │
└─────────────────────────────────────────────┘

┌─────────────────────────────────────────────┐
│ Gemini CLI (gc/)                            │
│ ████████░░░░░░░░░░░░ 450 / 1000 (45%)      │
│ Reinicio diario en: 18h 30m                 │
│ Mensual: 45K / 180K (25%)                   │
│ Costo: $0 (nivel gratis)                    │
└─────────────────────────────────────────────┘

┌─────────────────────────────────────────────┐
│ GLM-4.7 (glm/)                              │
│ ██████████████░░░░░░ 7M / 10M tokens (70%)  │
│ Se reinicia: Diario 10:00 AM (en 5h 35m)   │
│ Costo hoy: $4.20                            │
└─────────────────────────────────────────────┘

┌─────────────────────────────────────────────┐
│ MiniMax M2.1 (minimax/)                     │
│ ████████████████░░░░ 4M / 5M tokens (80%)   │
│ Ventana rolling 5h                          │
│ Costo (5h): $0.80                           │
└─────────────────────────────────────────────┘

┌─────────────────────────────────────────────┐
│ iFlow (if/)                                 │
│ ████████████████████ Ilimitado              │
│ Costo: $0 (gratis para siempre)             │
└─────────────────────────────────────────────┘

Consumo de tokens en tiempo real

Seguimiento por solicitud

Cada solicitud muestra el uso detallado de tokens:

Dashboard → Activity → Recent Requests

Request #1234
Model: cc/claude-opus-4-5-20251101
Timestamp: 2026-02-04 04:15:32

Tokens:
  Input: 1,250 tokens
  Output: 850 tokens
  Total: 2,100 tokens

Cost: $0 (cuota de suscripción)
Duration: 3.2s
Status: ✅ Success

Monitor de uso en vivo

Dashboard → Live Monitor

Solicitud actual:
  Model: glm/glm-4.7
  Tokens transmitidos: 450 / ~800 estimados
  Costo hasta ahora: $0.0009
  Duración: 1.8s

Desglose de tokens por modelo

Dashboard → Analytics → Token Usage

Hoy (4 feb 2026):
  cc/claude-opus-4-5: 15M tokens ($0, suscripción)
  glm/glm-4.7: 8M tokens ($4.80)
  if/kimi-k2-thinking: 3M tokens ($0, gratis)
  
Total: 26M tokens
Costo: $4.80

Límites de cuota y tiempos de reinicio

Proveedores de suscripción

Claude Code (Pro/Max)

Tipo de cuota: Basado en tiempo (rolling 5 horas)
Límite: 5 horas de uso
Reinicio: Ventana rolling 5 horas + refresh semanal
Seguimiento: Tiempo de uso por modelo

El dashboard muestra:
  Opus: 2.5h / 5h usados
  Sonnet: 1.2h / 5h usados
  Haiku: 0.8h / 5h usados
  
Reinicio semanal: Todos los lunes 00:00 UTC

OpenAI Codex (Plus/Pro)

Tipo de cuota: Basado en tiempo (rolling 5 horas)
Límite: 5 horas (Plus) / 10 horas (Pro)
Reinicio: Ventana rolling 5 horas + refresh semanal

El dashboard muestra:
  GPT-5.2 Codex: 3.5h / 5h usados
  Se reinicia en: 1h 30m

Gemini CLI (GRATIS)

Tipo de cuota: Conteo de solicitudes + tokens mensuales
Límite diario: 1,000 solicitudes
Límite mensual: 180,000 completados
Reinicio: Diario 00:00 UTC + Mensual día 1

El dashboard muestra:
  Hoy: 450 / 1,000 solicitudes (45%)
  Este mes: 45K / 180K completados (25%)
  Reinicio diario en: 18h 30m
  Reinicio mensual en: 26 días

GitHub Copilot

Tipo de cuota: Uso mensual
Límite: Varía según el plan
Reinicio: 1ro de cada mes

El dashboard muestra:
  Uso: 60% de la cuota mensual
  Se reinicia: 1 mar 2026 (en 25 días)

Proveedores baratos

GLM-4.7

Tipo de cuota: Límite diario de tokens
Límite: 10M tokens/día (Coding Plan)
Reinicio: Diario 10:00 AM hora de Beijing (UTC+8)

El dashboard muestra:
  Usados: 7M / 10M tokens (70%)
  Restantes: 3M tokens
  Se reinicia en: 5h 35m
  Costo hoy: $4.20

MiniMax M2.1

Tipo de cuota: Ventana rolling 5 horas
Límite: 5M tokens por 5 horas
Reinicio: Ventana rolling continua

El dashboard muestra:
  Usados (5h): 4M / 5M tokens (80%)
  El uso más antiguo expira en: 45m
  Costo (5h): $0.80

Kimi K2

Tipo de cuota: Suscripción mensual
Límite: 10M tokens/mes ($9 plano)
Reinicio: Mensual en la fecha de suscripción

El dashboard muestra:
  Usados: 6M / 10M tokens (60%)
  Se reinicia: 15 feb 2026 (en 11 días)
  Costo: $9/mes (pagado por adelantado)

Proveedores gratis

iFlow / Qwen / Kiro

Tipo de cuota: Ilimitado (con rate-limit)
Límite: Sin límite duro
Reinicio: N/A

El dashboard muestra:
  Usados hoy: 5M tokens
  Costo: $0 (gratis para siempre)
  Estado: ✅ Disponible

Estimación de costos

Seguimiento de costos en tiempo real

Dashboard → Costs → Today

Proveedores de suscripción: $0
  Claude Code: 15M tokens ($0, incluido)
  Gemini CLI: 3M tokens ($0, nivel gratis)

Proveedores de pago: $4.80
  GLM-4.7: 8M tokens ($4.80)
    Input: 6M × $0.60/1M = $3.60
    Output: 2M × $2.20/1M = $4.40
    Total: $4.80

Proveedores gratis: $0
  iFlow: 3M tokens ($0)

Total hoy: $4.80

Reporte de gasto mensual

Dashboard → Costs → This Month (Febrero 2026)

Semana 1 (1-7 feb):
  Suscripción: $0 (80M tokens)
  Pago: $15.20 (25M tokens)
  Gratis: $0 (10M tokens)
  Total: $15.20

Semana 2 (8-14 feb):
  Suscripción: $0 (75M tokens)
  Pago: $12.80 (20M tokens)
  Gratis: $0 (8M tokens)
  Total: $12.80

Mes hasta la fecha: $28.00
Proyectado (30 días): ~$120

Desglose por proveedor:
  GLM-4.7: $22.00 (78%)
  MiniMax M2.1: $6.00 (22%)
  
Costo promedio por 1M tokens: $0.62
Ahorros vs ChatGPT API: 97% ($4,000 → $120)

Proyección de costos

Dashboard → Costs → Projections

Basado en uso de los últimos 7 días:
  Promedio diario: 50M tokens
  Costo diario: $4.50

Proyección mensual:
  Tokens: 1,500M (1.5B)
  Costo: $135
  
Desglose:
  Suscripción: 900M tokens ($0)
  GLM-4.7: 450M tokens ($90)
  MiniMax: 120M tokens ($24)
  Gratis: 30M tokens ($0)

Estado del presupuesto:
  Límite diario: $5 → 90% usado hoy
  Límite mensual: $150 → 90% proyectado
  ⚠️ Advertencia: Puede exceder el presupuesto mensual

Dashboard de uso

Estadísticas generales

Dashboard → Analytics → Overview

Hoy (4 feb 2026):
  Solicitudes: 1,234
  Tokens: 26M
  Costo: $4.80
  Tiempo promedio de respuesta: 2.1s

Esta semana:
  Solicitudes: 8,456
  Tokens: 180M
  Costo: $28.00
  Tasa de éxito: 99.2%

Este mes:
  Solicitudes: 15,234
  Tokens: 320M
  Costo: $52.00
  Modelo principal: cc/claude-opus-4-5 (45%)

Uso por modelo

Dashboard → Analytics → Models

Modelos principales (este mes):
1. cc/claude-opus-4-5: 145M tokens (45%)
2. glm/glm-4.7: 95M tokens (30%)
3. if/kimi-k2-thinking: 50M tokens (16%)
4. minimax/MiniMax-M2.1: 20M tokens (6%)
5. gc/gemini-3-flash: 10M tokens (3%)

Desglose de costos:
  cc/claude-opus: $0 (suscripción)
  glm/glm-4.7: $45.00
  if/kimi-k2-thinking: $0 (gratis)
  minimax/MiniMax-M2.1: $7.00
  gc/gemini-3-flash: $0 (gratis)

Uso por tiempo

Dashboard → Analytics → Timeline

Uso por hora (hoy):
00:00 - 01:00: 0.5M tokens
01:00 - 02:00: 0.2M tokens
...
08:00 - 09:00: 3.2M tokens (pico)
09:00 - 10:00: 2.8M tokens
...
23:00 - 00:00: 0.8M tokens

Horas pico: 08:00 - 12:00 (codificación matutina)
Horas bajas: 00:00 - 06:00 (noche)

Uso por combo

Dashboard → Analytics → Combos

premium-coding:
  Solicitudes: 456
  Tokens: 12M
  Costo: $2.40
  
  Desglose:
    cc/claude-opus: 8M tokens (67%, $0)
    glm/glm-4.7: 3M tokens (25%, $1.80)
    minimax/MiniMax-M2.1: 1M tokens (8%, $0.20)

budget-combo:
  Solicitudes: 234
  Tokens: 6M
  Costo: $1.20
  
  Desglose:
    glm/glm-4.7: 4M tokens (67%, $2.40)
    if/kimi-k2-thinking: 2M tokens (33%, $0)

Alertas y notificaciones

Alertas de cuota

Dashboard → Settings → Alerts

Advertencias de cuota:
  ✅ Alerta al 80% de cuota usada
  ✅ Alerta al 90% de cuota usada
  ✅ Alerta cuando la cuota se agota
  ✅ Notificar cuando la cuota se reinicia

Entrega:
  ✅ Notificación del dashboard
  ✅ Email (opcional)
  ✅ Webhook (opcional)

Ejemplo de notificaciones:

⚠️ Cuota de Claude Code 80% usada
   2.5h restantes (se reinicia en 1h 30m)
   
⚠️ Cuota de GLM-4.7 90% usada
   1M tokens restantes (se reinicia en 5h)
   
✅ Cuota de Gemini CLI reiniciada
   1,000 solicitudes disponibles (límite diario)

Alertas de presupuesto

Dashboard → Settings → Budget Alerts

Presupuesto diario: $5
  ✅ Alerta al 80% ($4)
  ✅ Alerta al 100% ($5)
  ✅ Cambio automático al nivel gratis cuando se excede

Presupuesto mensual: $150
  ✅ Alerta al 50% ($75)
  ✅ Alerta al 80% ($120)
  ✅ Alerta al 100% ($150)

Ejemplo de notificaciones:

⚠️ Presupuesto diario 80% usado
   $4.00 / $5.00 gastados hoy
   
⚠️ Presupuesto mensual 50% alcanzado
   $75 / $150 gastados este mes
   Proyectado: $135 (dentro del presupuesto)
   
🚨 Presupuesto diario excedido
   $5.20 / $5.00 gastados hoy
   Cambio automático al nivel gratis

Detección de anomalías de costo

Dashboard → Settings → Anomaly Detection

✅ Detectar patrones de gasto inusuales
✅ Alerta en picos de costo (>2× promedio diario)
✅ Advertencia en patrones de agotamiento de cuota

Ejemplo de alerta:
⚠️ Pico de costo detectado
   Hoy: $12.50 (2.5× promedio diario)
   Razón: Alto uso de GLM-4.7 (20M tokens)
   Sugerencia: Verifica si los modelos principales tienen cuota agotada

Mejores prácticas

1. Monitorea la cuota diariamente

Rutina diaria:
1. Revisa el resumen de cuota del dashboard (30 segundos)
2. Revisa los tiempos de reinicio
3. Planifica el uso según la disponibilidad de cuota

Ejemplo:

Revisión matutina:
  ✅ Claude Code: 5h disponibles (reinicio fresco)
  ✅ Gemini CLI: 1K solicitudes disponibles
  ⚠️ GLM-4.7: 2M tokens restantes (se reinicia 10AM)
  
Acción: Usar Claude Code para el trabajo matutino

2. Establece límites de presupuesto

Dashboard → Settings → Budget:
  Diario: $5 (previene gastos excesivos)
  Mensual: $150 (alinea con el presupuesto)

Resultado: Cambio automático al nivel gratis cuando se alcanza el límite.

3. Optimiza el uso de combos

Dashboard → Analytics → Combos:
  Revisa qué modelos se usan más
  Ajusta el orden del combo para minimizar costos

Ejemplo:

Actual: cc/claude-opus → glm/glm-4.7
  80% vía Claude (bueno)
  20% vía GLM ($12/mes)

Optimizado: gc/gemini-3-flash → cc/claude-opus → glm/glm-4.7
  50% vía Gemini (gratis)
  40% vía Claude (suscripción)
  10% vía GLM ($6/mes)
  
Ahorros: $6/mes

4. Rastrea los tiempos de reinicio

Dashboard → Quota → Reset Schedule:
  Claude Code: 5h rolling + Semanal lunes
  Gemini CLI: Diario 00:00 UTC + Mensual día 1
  GLM-4.7: Diario 10:00 AM hora Beijing
  MiniMax: Ventana rolling 5h

Estrategia: Usa proveedores cuando la cuota esté fresca.

5. Revisa los reportes mensuales

Dashboard → Analytics → Monthly Report:
  Total de tokens: 1.5B
  Costo total: $120
  Ahorros: 97% vs ChatGPT API
  
Insights:
  - 60% de uso vía suscripciones ($0)
  - 30% vía GLM ($90)
  - 10% vía nivel gratis ($0)
  
Optimización:
  - Aumentar el uso de Gemini CLI (gratis)
  - Reducir el uso de GLM (costoso)

Acceso por API

Obtener estado de cuota

GET http://localhost:20128/api/quota
Authorization: Bearer your-api-key

Response:
{
  "providers": [
    {
      "id": "cc",
      "name": "Claude Code",
      "quota": {
        "used": 2.5,
        "limit": 5,
        "unit": "hours",
        "percentage": 50
      },
      "reset": {
        "type": "rolling",
        "window": "5h",
        "nextReset": "2026-02-04T06:45:00Z"
      },
      "cost": {
        "today": 0,
        "month": 0,
        "currency": "USD"
      }
    },
    {
      "id": "glm",
      "name": "GLM-4.7",
      "quota": {
        "used": 7000000,
        "limit": 10000000,
        "unit": "tokens",
        "percentage": 70
      },
      "reset": {
        "type": "daily",
        "time": "10:00 AM UTC+8",
        "nextReset": "2026-02-04T10:00:00+08:00"
      },
      "cost": {
        "today": 4.20,
        "month": 52.00,
        "currency": "USD"
      }
    }
  ]
}

Obtener estadísticas de uso

GET http://localhost:20128/api/usage?period=today
Authorization: Bearer your-api-key

Response:
{
  "period": "today",
  "date": "2026-02-04",
  "summary": {
    "requests": 1234,
    "tokens": 26000000,
    "cost": 4.80
  },
  "byModel": [
    {
      "model": "cc/claude-opus-4-5",
      "requests": 456,
      "tokens": 15000000,
      "cost": 0
    },
    {
      "model": "glm/glm-4.7",
      "requests": 234,
      "tokens": 8000000,
      "cost": 4.80
    }
  ]
}

Solución de problemas

Problema: La cuota muestra 0% pero las solicitudes fallan

Solución:

Verifica la conexión del proveedor (Dashboard → Providers)
Verifica que las API keys sean válidas
Verifica si el proveedor está caído (página de estado)
Intenta reconectar los proveedores OAuth

Problema: Estimación de costos incorrecta

Solución:

Dashboard → Settings → Pricing
Verifica que el precio por proveedor coincida con las tarifas actuales
Actualiza el precio si el proveedor cambió las tarifas
Contacta a soporte si la discrepancia persiste

Problema: El tiempo de reinicio no se actualiza

Solución:

Refresca el dashboard (F5)
Verifica que la hora del sistema sea correcta
Verifica la configuración de zona horaria
Reinicia 9Router si el problema persiste

Problema: No se reciben alertas

Solución:

Dashboard → Settings → Alerts
Verifica que la dirección de email sea correcta
Revisa la carpeta de spam
Prueba la notificación (botón Send Test)

Relacionado

Enrutamiento inteligente - Fallback automático según cuota
Combos - Crea cadenas de fallback personalizadas

16 KiB Raw Blame History Unescape Escape

Seguimiento de cuota y monitoreo de uso

Resumen

Resumen del dashboard

Resumen de cuota

Consumo de tokens en tiempo real

Seguimiento por solicitud

Monitor de uso en vivo

Desglose de tokens por modelo

Límites de cuota y tiempos de reinicio

Proveedores de suscripción

Proveedores baratos

Proveedores gratis

Estimación de costos

Seguimiento de costos en tiempo real

Reporte de gasto mensual

Proyección de costos

Dashboard de uso

Estadísticas generales

Uso por modelo

Uso por tiempo

Uso por combo

Alertas y notificaciones

Alertas de cuota

Alertas de presupuesto

Detección de anomalías de costo

Mejores prácticas

1. Monitorea la cuota diariamente

2. Establece límites de presupuesto

3. Optimiza el uso de combos

4. Rastrea los tiempos de reinicio

5. Revisa los reportes mensuales

Acceso por API

Obtener estado de cuota

Obtener estadísticas de uso

Solución de problemas

Relacionado

16 KiB

Raw Blame History