# Combos - Cadenas de fallback personalizadas

Crea combinaciones de modelos personalizadas con fallback automático. Los combos te permiten definir tu propia estrategia de enrutamiento basada en costo, calidad y disponibilidad.

---

## ¿Qué son los combos?

Los combos son **cadenas de fallback personalizadas** que creas en el dashboard. En lugar de usar un solo modelo, defines una secuencia de modelos que 9Router intenta en orden.

**Ejemplo:**
```
Nombre del combo: premium-coding
Modelos:
  1. cc/claude-opus-4-5-20251101 (intentar primero)
  2. glm/glm-4.7 (si #1 tiene cuota agotada)
  3. minimax/MiniMax-M2.1 (si #2 tiene cuota agotada)
```

**Uso en CLI:**
```
Model: premium-coding
```

9Router intenta automáticamente cada modelo en secuencia hasta que uno tenga éxito.

---

## ¿Por qué usar combos?

### 1. Maximiza el valor de la suscripción
```
cc/claude-opus → glm/glm-4.7 → if/kimi-k2-thinking

→ Usa la suscripción primero, respaldo barato, emergencia gratis
→ Obtén el valor completo de las suscripciones que ya pagas
```

### 2. Minimiza costos
```
glm/glm-4.7 → minimax/MiniMax-M2.1 → if/kimi-k2-thinking

→ Comienza con la opción de pago más barata ($0.60/1M)
→ Fallback a una aún más barata ($0.20/1M)
→ Nivel de emergencia gratis
→ Costo total: ~$5-10/mes vs $2000 en ChatGPT API
```

### 3. Garantiza disponibilidad 24/7
```
cc/claude-opus → cx/gpt-5.2-codex → glm/glm-4.7 → if/kimi-k2-thinking

→ Siempre incluye el nivel gratis al final
→ Nunca te quedes sin cuota
→ Codifica en cualquier momento, en cualquier lugar
```

### 4. Optimiza por calidad
```
cc/claude-opus-4-5 → cx/gpt-5.2-codex → gc/gemini-3-pro

→ Mejores modelos primero
→ Fallback a otros modelos premium
→ Mantén alta calidad en toda la cadena de fallback
```

---

## Cómo crear combos

### Paso 1: Abrir el dashboard

```
http://localhost:20128
→ Inicia sesión con tu contraseña
```

### Paso 2: Navegar a Combos

```
Dashboard → Combos → Create New Combo
```

### Paso 3: Configurar el combo

**Nombre del combo:**
```
premium-coding
```

**Descripción (opcional):**
```
Suscripción primero, respaldo barato, emergencia gratis
```

**Seleccionar modelos:**
```
1. cc/claude-opus-4-5-20251101
2. glm/glm-4.7
3. minimax/MiniMax-M2.1
```

**Arrastra para reordenar** - Prioridad de arriba a abajo.

### Paso 4: Guardar

```
Clic en "Save Combo"
→ El combo aparece en la lista de modelos
```

### Paso 5: Usar en CLI

```
Cursor/Cline/Cualquier herramienta:
  Model: premium-coding
```

---

## Combos de ejemplo

### Ejemplo 1: Premium Coding (Suscripción → Barato → Gratis)

**Objetivo**: Maximizar el valor de la suscripción, minimizar costos extras.

```
Dashboard → Combos → Create New

Name: premium-coding
Models:
  1. cc/claude-opus-4-5-20251101
  2. glm/glm-4.7
  3. minimax/MiniMax-M2.1
```

**Uso:**
```
Cursor IDE:
  Model: premium-coding
```

**Comportamiento:**
```
Mañana (cuota fresca):
  Solicitud → cc/claude-opus-4-5 ✅

Tarde (cuota de Claude agotada):
  Solicitud → glm/glm-4.7 ✅ (cambio automático)

Noche (cuota de GLM agotada):
  Solicitud → minimax/MiniMax-M2.1 ✅ (cambio automático)
```

**Costo mensual (100M tokens):**
```
80M vía Claude Code: $0 (suscripción)
15M vía GLM: $9
5M vía MiniMax: $1
Total: $10 + tu suscripción
```

**Ahorros**: ~99% vs ChatGPT API ($2000).

---

### Ejemplo 2: Combo de presupuesto (Barato → Gratis)

**Objetivo**: Minimizar costos, usar el nivel gratis como respaldo.

```
Dashboard → Combos → Create New

Name: budget-combo
Models:
  1. glm/glm-4.7
  2. minimax/MiniMax-M2.1
  3. if/kimi-k2-thinking
```

**Uso:**
```
Cline:
  Provider: OpenAI Compatible
  Base URL: http://localhost:20128/v1
  Model: budget-combo
```

**Comportamiento:**
```
Solicitud → glm/glm-4.7
  ✅ Cuota diaria disponible → Usa GLM ($0.60/1M)
  ❌ Cuota agotada → Intenta MiniMax ($0.20/1M)
  ❌ Cuota de MiniMax agotada → Usa iFlow (GRATIS)
```

**Costo mensual (100M tokens):**
```
70M vía GLM: $42
20M vía MiniMax: $4
10M vía iFlow: $0
Total: $46 vs $2000 en ChatGPT API
```

**Ahorros**: 97%.

---

### Ejemplo 3: Combo gratis (Cero costo)

**Objetivo**: 100% gratis, sin costos nunca.

```
Dashboard → Combos → Create New

Name: free-combo
Models:
  1. if/kimi-k2-thinking
  2. qw/qwen3-coder-plus
  3. kr/claude-sonnet-4.5
```

**Uso:**
```
Claude Desktop:
  Model: free-combo
```

**Comportamiento:**
```
Solicitud → if/kimi-k2-thinking
  ✅ Disponible → Usa iFlow
  ❌ Error → Intenta Qwen
  ❌ Error → Intenta Kiro
```

**Costo mensual:**
```
100M tokens vía proveedores gratis: $0
Total: $0 para siempre
```

**Caso de uso**: Proyectos personales, aprendizaje, experimentación.

---

### Ejemplo 4: Calidad primero (Solo modelos premium)

**Objetivo**: Mejor calidad, sin fallback barato.

```
Dashboard → Combos → Create New

Name: quality-first
Models:
  1. cc/claude-opus-4-5-20251101
  2. cx/gpt-5.2-codex
  3. gc/gemini-3-pro-preview
```

**Uso:**
```
Codex CLI:
  export OPENAI_BASE_URL="http://localhost:20128"
  Model: quality-first
```

**Comportamiento:**
```
Solicitud → cc/claude-opus-4-5
  ❌ Cuota agotada → cx/gpt-5.2-codex
  ❌ Cuota agotada → gc/gemini-3-pro-preview
  ❌ Todo agotado → Devuelve error (sin fallback barato)
```

**Caso de uso**: Código crítico de producción, refactoring complejo.

---

### Ejemplo 5: Multi-suscripción (Maximiza todo)

**Objetivo**: Usa todas las suscripciones antes de pagar extra.

```
Dashboard → Combos → Create New

Name: multi-sub
Models:
  1. gc/gemini-3-flash-preview (GRATIS 180K/mes)
  2. cc/claude-opus-4-5-20251101 (suscripción Pro)
  3. cx/gpt-5.2-codex (suscripción Plus)
  4. gh/gpt-5 (suscripción Copilot)
  5. glm/glm-4.7 (respaldo barato)
  6. if/kimi-k2-thinking (emergencia gratis)
```

**Costo mensual (200M tokens):**
```
50M vía Gemini CLI: $0 (nivel gratis)
80M vía Claude Code: $0 (suscripción)
40M vía Codex: $0 (suscripción)
20M vía Copilot: $0 (suscripción)
8M vía GLM: $4.80
2M vía iFlow: $0
Total: $4.80 + suscripciones existentes
```

**Resultado**: Usa 190M tokens de suscripciones, solo $4.80 extra.

---

### Ejemplo 6: Optimización de reinicio de cuota

**Objetivo**: Distribuir el uso según los tiempos de reinicio.

```
Dashboard → Combos → Create New

Name: reset-optimized
Models:
  1. cc/claude-opus-4-5 (reinicio 5h, usar mañana)
  2. gc/gemini-3-flash (1K/día, usar tarde)
  3. glm/glm-4.7 (reinicio diario 10AM, usar noche)
  4. minimax/MiniMax-M2.1 (rolling 5h, usar madrugada)
  5. if/kimi-k2-thinking (ilimitado, emergencia)
```

**Rutina diaria:**
```
08:00 - 13:00: Claude Code (cuota fresca de 5h)
13:00 - 18:00: Gemini CLI (cuota 1K/día)
18:00 - 22:00: GLM (se reinicia 10AM del día siguiente)
22:00 - 08:00: MiniMax (rolling 5h) o iFlow
```

**Resultado**: Codifica 24/7 con costos mínimos.

---

## Usar combos en herramientas CLI

### Cursor IDE

```
Settings → Models → Advanced:
  OpenAI API Base URL: http://localhost:20128/v1
  OpenAI API Key: [desde el dashboard]
  Model: premium-coding
```

### Claude Desktop

Edita `~/.claude/config.json`:
```json
{
  "anthropic_api_base": "http://localhost:20128/v1",
  "anthropic_api_key": "your-9router-api-key",
  "model": "budget-combo"
}
```

### Codex CLI

```bash
export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-9router-api-key"

codex --model quality-first "your prompt"
```

### Cline / Continue / RooCode

```
Provider: OpenAI Compatible
Base URL: http://localhost:20128/v1
API Key: [desde el dashboard]
Model: free-combo
```

### Solicitud por API

```bash
curl http://localhost:20128/v1/chat/completions \
  -H "Authorization: Bearer your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "premium-coding",
    "messages": [
      {"role": "user", "content": "Write a function to..."}
    ],
    "stream": true
  }'
```

---

## Mejores prácticas

### 1. Siempre incluye el nivel gratis

```
✅ Bueno:
cc/claude-opus → glm/glm-4.7 → if/kimi-k2-thinking

❌ Malo:
cc/claude-opus → glm/glm-4.7
(sin fallback gratis, puede quedarse sin cuota)
```

**Por qué**: Garantiza disponibilidad 24/7, nunca bloqueado por cuota.

### 2. Ordena por costo (Barato a costoso)

```
✅ Bueno:
glm/glm-4.7 → minimax/MiniMax-M2.1 → cc/claude-opus

❌ Malo:
cc/claude-opus → glm/glm-4.7
(desperdicia cuota de suscripción en tareas simples)
```

**Excepción**: Si quieres maximizar el valor de la suscripción, pon la suscripción primero.

### 3. Coincide con los requisitos de calidad

```
Para código de producción:
cc/claude-opus → cx/gpt-5.2-codex → glm/glm-4.7

Para tareas rápidas:
glm/glm-4.7 → if/kimi-k2-thinking

Para experimentación:
if/kimi-k2-thinking → qw/qwen3-coder-plus
```

### 4. Considera los tiempos de reinicio de cuota

```
Combo matutino (cuotas frescas):
cc/claude-opus → cx/gpt-5.2-codex

Combo nocturno (cuotas probablemente agotadas):
glm/glm-4.7 → minimax/MiniMax-M2.1 → if/kimi-k2-thinking
```

### 5. Crea múltiples combos para diferentes casos de uso

```
premium-coding: Para tareas complejas
budget-combo: Para tareas simples
free-combo: Para experimentación
quality-first: Para código de producción
```

**Cambia entre combos** según los requisitos de la tarea.

### 6. Monitorea el desempeño del combo

```
Dashboard → Analytics → Combo Usage:
  premium-coding:
    80% vía cc/claude-opus (bueno, usando suscripción)
    15% vía glm/glm-4.7 (respaldo aceptable)
    5% vía minimax (fallback raro)
```

**Optimiza**: Si hay demasiado uso de fallback, aumenta la cuota principal o reordena modelos.

---

## Configuración avanzada

### Establecer límites de presupuesto por combo

```
Dashboard → Combos → Edit → Budget:
  Daily limit: $5
  Monthly limit: $50
```

Cuando se alcanza el límite, 9Router omite los modelos de pago y usa solo el nivel gratis.

### Habilitar/Deshabilitar modelos en un combo

```
Dashboard → Combos → Edit → Models:
  ✅ cc/claude-opus-4-5 (habilitado)
  ❌ glm/glm-4.7 (deshabilitado temporalmente)
  ✅ if/kimi-k2-thinking (habilitado)
```

**Caso de uso**: Deshabilitar temporalmente modelos costosos sin eliminar el combo.

### Clonar un combo existente

```
Dashboard → Combos → Clone "premium-coding"
→ Crea una copia con sufijo "-copy"
→ Modifica y guarda como nuevo combo
```

**Caso de uso**: Crear variaciones para diferentes escenarios.

---

## Solución de problemas

**Problema: El combo no aparece en la lista de modelos**

**Solución:**
1. Refresca el dashboard
2. Verifica que el combo esté guardado (marca verde)
3. Reinicia la herramienta CLI para refrescar la lista de modelos

**Problema: El combo siempre usa el último modelo (nivel gratis)**

**Solución:**
1. Verifica la cuota de los modelos principales (Dashboard → Quota)
2. Verifica que las API keys sean válidas (Dashboard → Providers)
3. Verifica que no se hayan excedido los límites de presupuesto

**Problema: El combo cuesta más de lo esperado**

**Solución:**
1. Dashboard → Analytics → Revisa el uso del combo
2. Verifica si los modelos principales tienen cuota agotada
3. Reordena los modelos (pon los más baratos primero)
4. Establece límites de presupuesto

---

## Relacionado

- [Enrutamiento inteligente](./smart-routing.md) - Cómo funciona el fallback automático
- [Seguimiento de cuota](./quota-tracking.md) - Monitorea uso y costos