2026-05-11 11:50:24 +07:00

11 KiB

Raw Blame History

Combos - Cadenas de fallback personalizadas

Crea combinaciones de modelos personalizadas con fallback automático. Los combos te permiten definir tu propia estrategia de enrutamiento basada en costo, calidad y disponibilidad.

¿Qué son los combos?

Los combos son cadenas de fallback personalizadas que creas en el dashboard. En lugar de usar un solo modelo, defines una secuencia de modelos que 9Router intenta en orden.

Ejemplo:

Nombre del combo: premium-coding
Modelos:
  1. cc/claude-opus-4-5-20251101 (intentar primero)
  2. glm/glm-4.7 (si #1 tiene cuota agotada)
  3. minimax/MiniMax-M2.1 (si #2 tiene cuota agotada)

Uso en CLI:

Model: premium-coding

9Router intenta automáticamente cada modelo en secuencia hasta que uno tenga éxito.

¿Por qué usar combos?

1. Maximiza el valor de la suscripción

cc/claude-opus → glm/glm-4.7 → if/kimi-k2-thinking

→ Usa la suscripción primero, respaldo barato, emergencia gratis
→ Obtén el valor completo de las suscripciones que ya pagas

2. Minimiza costos

glm/glm-4.7 → minimax/MiniMax-M2.1 → if/kimi-k2-thinking

→ Comienza con la opción de pago más barata ($0.60/1M)
→ Fallback a una aún más barata ($0.20/1M)
→ Nivel de emergencia gratis
→ Costo total: ~$5-10/mes vs $2000 en ChatGPT API

3. Garantiza disponibilidad 24/7

cc/claude-opus → cx/gpt-5.2-codex → glm/glm-4.7 → if/kimi-k2-thinking

→ Siempre incluye el nivel gratis al final
→ Nunca te quedes sin cuota
→ Codifica en cualquier momento, en cualquier lugar

4. Optimiza por calidad

cc/claude-opus-4-5 → cx/gpt-5.2-codex → gc/gemini-3-pro

→ Mejores modelos primero
→ Fallback a otros modelos premium
→ Mantén alta calidad en toda la cadena de fallback

Cómo crear combos

Paso 1: Abrir el dashboard

http://localhost:20128
→ Inicia sesión con tu contraseña

Paso 2: Navegar a Combos

Dashboard → Combos → Create New Combo

Paso 3: Configurar el combo

Nombre del combo:

premium-coding

Descripción (opcional):

Suscripción primero, respaldo barato, emergencia gratis

Seleccionar modelos:

1. cc/claude-opus-4-5-20251101
2. glm/glm-4.7
3. minimax/MiniMax-M2.1

Arrastra para reordenar - Prioridad de arriba a abajo.

Paso 4: Guardar

Clic en "Save Combo"
→ El combo aparece en la lista de modelos

Paso 5: Usar en CLI

Cursor/Cline/Cualquier herramienta:
  Model: premium-coding

Combos de ejemplo

Ejemplo 1: Premium Coding (Suscripción → Barato → Gratis)

Objetivo: Maximizar el valor de la suscripción, minimizar costos extras.

Dashboard → Combos → Create New

Name: premium-coding
Models:
  1. cc/claude-opus-4-5-20251101
  2. glm/glm-4.7
  3. minimax/MiniMax-M2.1

Uso:

Cursor IDE:
  Model: premium-coding

Comportamiento:

Mañana (cuota fresca):
  Solicitud → cc/claude-opus-4-5 ✅

Tarde (cuota de Claude agotada):
  Solicitud → glm/glm-4.7 ✅ (cambio automático)

Noche (cuota de GLM agotada):
  Solicitud → minimax/MiniMax-M2.1 ✅ (cambio automático)

Costo mensual (100M tokens):

80M vía Claude Code: $0 (suscripción)
15M vía GLM: $9
5M vía MiniMax: $1
Total: $10 + tu suscripción

Ahorros: ~99% vs ChatGPT API ($2000).

Ejemplo 2: Combo de presupuesto (Barato → Gratis)

Objetivo: Minimizar costos, usar el nivel gratis como respaldo.

Dashboard → Combos → Create New

Name: budget-combo
Models:
  1. glm/glm-4.7
  2. minimax/MiniMax-M2.1
  3. if/kimi-k2-thinking

Uso:

Cline:
  Provider: OpenAI Compatible
  Base URL: http://localhost:20128/v1
  Model: budget-combo

Comportamiento:

Solicitud → glm/glm-4.7
  ✅ Cuota diaria disponible → Usa GLM ($0.60/1M)
  ❌ Cuota agotada → Intenta MiniMax ($0.20/1M)
  ❌ Cuota de MiniMax agotada → Usa iFlow (GRATIS)

Costo mensual (100M tokens):

70M vía GLM: $42
20M vía MiniMax: $4
10M vía iFlow: $0
Total: $46 vs $2000 en ChatGPT API

Ahorros: 97%.

Ejemplo 3: Combo gratis (Cero costo)

Objetivo: 100% gratis, sin costos nunca.

Dashboard → Combos → Create New

Name: free-combo
Models:
  1. if/kimi-k2-thinking
  2. qw/qwen3-coder-plus
  3. kr/claude-sonnet-4.5

Uso:

Claude Desktop:
  Model: free-combo

Comportamiento:

Solicitud → if/kimi-k2-thinking
  ✅ Disponible → Usa iFlow
  ❌ Error → Intenta Qwen
  ❌ Error → Intenta Kiro

Costo mensual:

100M tokens vía proveedores gratis: $0
Total: $0 para siempre

Caso de uso: Proyectos personales, aprendizaje, experimentación.

Ejemplo 4: Calidad primero (Solo modelos premium)

Objetivo: Mejor calidad, sin fallback barato.

Dashboard → Combos → Create New

Name: quality-first
Models:
  1. cc/claude-opus-4-5-20251101
  2. cx/gpt-5.2-codex
  3. gc/gemini-3-pro-preview

Uso:

Codex CLI:
  export OPENAI_BASE_URL="http://localhost:20128"
  Model: quality-first

Comportamiento:

Solicitud → cc/claude-opus-4-5
  ❌ Cuota agotada → cx/gpt-5.2-codex
  ❌ Cuota agotada → gc/gemini-3-pro-preview
  ❌ Todo agotado → Devuelve error (sin fallback barato)

Caso de uso: Código crítico de producción, refactoring complejo.

Ejemplo 5: Multi-suscripción (Maximiza todo)

Objetivo: Usa todas las suscripciones antes de pagar extra.

Dashboard → Combos → Create New

Name: multi-sub
Models:
  1. gc/gemini-3-flash-preview (GRATIS 180K/mes)
  2. cc/claude-opus-4-5-20251101 (suscripción Pro)
  3. cx/gpt-5.2-codex (suscripción Plus)
  4. gh/gpt-5 (suscripción Copilot)
  5. glm/glm-4.7 (respaldo barato)
  6. if/kimi-k2-thinking (emergencia gratis)

Costo mensual (200M tokens):

50M vía Gemini CLI: $0 (nivel gratis)
80M vía Claude Code: $0 (suscripción)
40M vía Codex: $0 (suscripción)
20M vía Copilot: $0 (suscripción)
8M vía GLM: $4.80
2M vía iFlow: $0
Total: $4.80 + suscripciones existentes

Resultado: Usa 190M tokens de suscripciones, solo $4.80 extra.

Ejemplo 6: Optimización de reinicio de cuota

Objetivo: Distribuir el uso según los tiempos de reinicio.

Dashboard → Combos → Create New

Name: reset-optimized
Models:
  1. cc/claude-opus-4-5 (reinicio 5h, usar mañana)
  2. gc/gemini-3-flash (1K/día, usar tarde)
  3. glm/glm-4.7 (reinicio diario 10AM, usar noche)
  4. minimax/MiniMax-M2.1 (rolling 5h, usar madrugada)
  5. if/kimi-k2-thinking (ilimitado, emergencia)

Rutina diaria:

08:00 - 13:00: Claude Code (cuota fresca de 5h)
13:00 - 18:00: Gemini CLI (cuota 1K/día)
18:00 - 22:00: GLM (se reinicia 10AM del día siguiente)
22:00 - 08:00: MiniMax (rolling 5h) o iFlow

Resultado: Codifica 24/7 con costos mínimos.

Usar combos en herramientas CLI

Cursor IDE

Settings → Models → Advanced:
  OpenAI API Base URL: http://localhost:20128/v1
  OpenAI API Key: [desde el dashboard]
  Model: premium-coding

Claude Desktop

Edita ~/.claude/config.json:

{
  "anthropic_api_base": "http://localhost:20128/v1",
  "anthropic_api_key": "your-9router-api-key",
  "model": "budget-combo"
}

Codex CLI

export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-9router-api-key"

codex --model quality-first "your prompt"

Cline / Continue / RooCode

Provider: OpenAI Compatible
Base URL: http://localhost:20128/v1
API Key: [desde el dashboard]
Model: free-combo

Solicitud por API

curl http://localhost:20128/v1/chat/completions \
  -H "Authorization: Bearer your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "premium-coding",
    "messages": [
      {"role": "user", "content": "Write a function to..."}
    ],
    "stream": true
  }'

Mejores prácticas

1. Siempre incluye el nivel gratis

✅ Bueno:
cc/claude-opus → glm/glm-4.7 → if/kimi-k2-thinking

❌ Malo:
cc/claude-opus → glm/glm-4.7
(sin fallback gratis, puede quedarse sin cuota)

Por qué: Garantiza disponibilidad 24/7, nunca bloqueado por cuota.

2. Ordena por costo (Barato a costoso)

✅ Bueno:
glm/glm-4.7 → minimax/MiniMax-M2.1 → cc/claude-opus

❌ Malo:
cc/claude-opus → glm/glm-4.7
(desperdicia cuota de suscripción en tareas simples)

Excepción: Si quieres maximizar el valor de la suscripción, pon la suscripción primero.

3. Coincide con los requisitos de calidad

Para código de producción:
cc/claude-opus → cx/gpt-5.2-codex → glm/glm-4.7

Para tareas rápidas:
glm/glm-4.7 → if/kimi-k2-thinking

Para experimentación:
if/kimi-k2-thinking → qw/qwen3-coder-plus

4. Considera los tiempos de reinicio de cuota

Combo matutino (cuotas frescas):
cc/claude-opus → cx/gpt-5.2-codex

Combo nocturno (cuotas probablemente agotadas):
glm/glm-4.7 → minimax/MiniMax-M2.1 → if/kimi-k2-thinking

5. Crea múltiples combos para diferentes casos de uso

premium-coding: Para tareas complejas
budget-combo: Para tareas simples
free-combo: Para experimentación
quality-first: Para código de producción

Cambia entre combos según los requisitos de la tarea.

6. Monitorea el desempeño del combo

Dashboard → Analytics → Combo Usage:
  premium-coding:
    80% vía cc/claude-opus (bueno, usando suscripción)
    15% vía glm/glm-4.7 (respaldo aceptable)
    5% vía minimax (fallback raro)

Optimiza: Si hay demasiado uso de fallback, aumenta la cuota principal o reordena modelos.

Configuración avanzada

Establecer límites de presupuesto por combo

Dashboard → Combos → Edit → Budget:
  Daily limit: $5
  Monthly limit: $50

Cuando se alcanza el límite, 9Router omite los modelos de pago y usa solo el nivel gratis.

Habilitar/Deshabilitar modelos en un combo

Dashboard → Combos → Edit → Models:
  ✅ cc/claude-opus-4-5 (habilitado)
  ❌ glm/glm-4.7 (deshabilitado temporalmente)
  ✅ if/kimi-k2-thinking (habilitado)

Caso de uso: Deshabilitar temporalmente modelos costosos sin eliminar el combo.

Clonar un combo existente

Dashboard → Combos → Clone "premium-coding"
→ Crea una copia con sufijo "-copy"
→ Modifica y guarda como nuevo combo

Caso de uso: Crear variaciones para diferentes escenarios.

Solución de problemas

Problema: El combo no aparece en la lista de modelos

Solución:

Refresca el dashboard
Verifica que el combo esté guardado (marca verde)
Reinicia la herramienta CLI para refrescar la lista de modelos

Problema: El combo siempre usa el último modelo (nivel gratis)

Solución:

Verifica la cuota de los modelos principales (Dashboard → Quota)
Verifica que las API keys sean válidas (Dashboard → Providers)
Verifica que no se hayan excedido los límites de presupuesto

Problema: El combo cuesta más de lo esperado

Solución:

Dashboard → Analytics → Revisa el uso del combo
Verifica si los modelos principales tienen cuota agotada
Reordena los modelos (pon los más baratos primero)
Establece límites de presupuesto

Relacionado

Enrutamiento inteligente - Cómo funciona el fallback automático
Seguimiento de cuota - Monitorea uso y costos

11 KiB Raw Blame History

Combos - Cadenas de fallback personalizadas

¿Qué son los combos?

¿Por qué usar combos?

1. Maximiza el valor de la suscripción

2. Minimiza costos

3. Garantiza disponibilidad 24/7

4. Optimiza por calidad

Cómo crear combos

Paso 1: Abrir el dashboard

Paso 2: Navegar a Combos

Paso 3: Configurar el combo

Paso 4: Guardar

Paso 5: Usar en CLI

Combos de ejemplo

Ejemplo 1: Premium Coding (Suscripción → Barato → Gratis)

Ejemplo 2: Combo de presupuesto (Barato → Gratis)

Ejemplo 3: Combo gratis (Cero costo)

Ejemplo 4: Calidad primero (Solo modelos premium)

Ejemplo 5: Multi-suscripción (Maximiza todo)

Ejemplo 6: Optimización de reinicio de cuota

Usar combos en herramientas CLI

Cursor IDE

Claude Desktop

Codex CLI

Cline / Continue / RooCode

Solicitud por API

Mejores prácticas

1. Siempre incluye el nivel gratis

2. Ordena por costo (Barato a costoso)

3. Coincide con los requisitos de calidad

4. Considera los tiempos de reinicio de cuota

5. Crea múltiples combos para diferentes casos de uso

6. Monitorea el desempeño del combo

Configuración avanzada

Establecer límites de presupuesto por combo

Habilitar/Deshabilitar modelos en un combo

Clonar un combo existente

Solución de problemas

Relacionado

11 KiB

Raw Blame History