# Enrutamiento inteligente y fallback automático 9Router enruta automáticamente tus solicitudes a través del mejor proveedor disponible usando un sistema de fallback de 3 niveles. Nunca dejes de codificar debido a límites de cuota o rate-limiting. --- ## Cómo funciona 9Router usa enrutamiento inteligente para maximizar tus suscripciones existentes, minimizar costos y garantizar disponibilidad 24/7: ``` Solicitud → 9Router → Verificar Nivel 1 (Suscripción) ↓ cuota agotada Verificar Nivel 2 (Barato) ↓ límite de presupuesto Verificar Nivel 3 (Gratis) ↓ Respuesta ``` ### Sistema de fallback de 3 niveles **Nivel 1: SUSCRIPCIÓN (Primario)** - Claude Code (Pro/Max) - OpenAI Codex (Plus/Pro) - Gemini CLI (GRATIS 180K/mes) - GitHub Copilot - Antigravity (Google) **Objetivo**: Maximizar el valor de las suscripciones que ya pagas. **Nivel 2: BARATO (Respaldo)** - GLM-4.7 ($0.60/1M entrada) - MiniMax M2.1 ($0.20/1M entrada) - Kimi K2 ($9/mes plano) **Objetivo**: Respaldo ultra-barato cuando se agota la cuota de suscripción (~90% más barato que ChatGPT API). **Nivel 3: GRATIS (Emergencia)** - iFlow (8 modelos) - Qwen (3 modelos) - Kiro (Claude GRATIS) **Objetivo**: Fallback de cero costo para codificación ilimitada. --- ## Cambio automático 9Router monitorea la cuota en tiempo real y cambia de proveedor automáticamente: ### Escenario 1: Cuota de suscripción agotada ``` Solicitud del usuario → cc/claude-opus-4-5 ↓ cuota agotada (límite de 5 horas alcanzado) Cambio automático → glm/glm-4.7 ↓ cuota diaria agotada Cambio automático → minimax/MiniMax-M2.1 ↓ cuota de 5 horas agotada Cambio automático → if/kimi-k2-thinking (GRATIS) ↓ Respuesta entregada ✅ ``` **Resultado**: Cero tiempo de inactividad, experiencia sin interrupciones. ### Escenario 2: Rate limiting ``` Solicitud del usuario → cx/gpt-5.2-codex ↓ rate limited (demasiadas solicitudes) Cambio automático → glm/glm-4.7 ↓ Respuesta entregada ✅ ``` ### Escenario 3: Proveedor no disponible ``` Solicitud del usuario → cc/claude-opus-4-5 ↓ error del proveedor (503) Cambio automático → siguiente modelo disponible ↓ Respuesta entregada ✅ ``` --- ## Lógica de selección de modelo 9Router selecciona el mejor modelo según: 1. **Disponibilidad de cuota** - Verifica si el proveedor tiene cuota restante 2. **Nivel de costo** - Prefiere suscripción → barato → gratis 3. **Tiempo de reinicio** - Considera cuándo se reinicia la cuota 4. **Salud del proveedor** - Omite proveedores con errores ### Ejemplo de orden de prioridad Para una solicitud a `cc/claude-opus-4-5`: ``` 1. Verificar cuota de Claude Code ✅ Disponible → Usa cc/claude-opus-4-5 ❌ Agotada → Continúa al paso 2 2. Verificar nivel de fallback (si está configurado) ✅ Cuota de GLM disponible → Usa glm/glm-4.7 ❌ Agotada → Continúa al paso 3 3. Verificar nivel gratis ✅ iFlow disponible → Usa if/kimi-k2-thinking ❌ Todo agotado → Devuelve error de cuota ``` --- ## Opciones de configuración ### Configuración del dashboard **1. Habilitar/Deshabilitar fallback automático** ``` Dashboard → Settings → Smart Routing → Toggle "Auto Fallback" ON/OFF ``` - **ON** (por defecto): Cambio automático de nivel - **OFF**: Modo estricto, devuelve error si el modelo principal no está disponible **2. Establecer límites de presupuesto** ``` Dashboard → Settings → Budget Control → Límite diario: $5 → Límite mensual: $50 ``` Cuando se alcanza el presupuesto, 9Router cambia automáticamente al nivel gratis. **3. Configurar el orden de fallback** ``` Dashboard → Settings → Fallback Priority → Arrastra para reordenar proveedores dentro de cada nivel ``` Ejemplo de orden personalizado: ``` Nivel 1: Gemini CLI → Claude Code → Codex Nivel 2: MiniMax → GLM → Kimi Nivel 3: iFlow → Kiro → Qwen ``` **4. Notificaciones de reinicio de cuota** ``` Dashboard → Settings → Notifications → Email cuando se reinicia la cuota → Alerta cuando se usa 80% de cuota ``` --- ## Ejemplos ### Ejemplo 1: Fallback automático básico **Configuración:** ``` Model: cc/claude-opus-4-5-20251101 Fallback: Auto (3 niveles por defecto) ``` **Comportamiento:** ``` Mañana (cuota fresca): Solicitud → cc/claude-opus-4-5 ✅ Tarde (cuota agotada): Solicitud → glm/glm-4.7 ✅ (cambio automático) Noche (cuota de GLM agotada): Solicitud → minimax/MiniMax-M2.1 ✅ (cambio automático) Madrugada (toda la cuota de pago agotada): Solicitud → if/kimi-k2-thinking ✅ (nivel gratis) ``` **Costo**: ~$5-10/mes extra (en su mayoría cubierto por la suscripción). ### Ejemplo 2: Enrutamiento consciente del presupuesto **Configuración:** ``` Dashboard → Settings: Presupuesto diario: $2 Presupuesto mensual: $20 Fallback: Habilitado ``` **Comportamiento:** ``` Día 1-15 (dentro del presupuesto): Solicitudes → glm/glm-4.7 (nivel barato) Costo: $1.50/día Día 16 (presupuesto alcanzado): Solicitudes → if/kimi-k2-thinking (nivel gratis) Costo: $0 Mes siguiente (presupuesto se reinicia): Solicitudes → glm/glm-4.7 nuevamente ``` **Resultado**: Nunca excede $20/mes, siempre disponible. ### Ejemplo 3: Modo solo suscripción **Configuración:** ``` Dashboard → Settings: Fallback automático: OFF Modo estricto: ON ``` **Comportamiento:** ``` Solicitud → cc/claude-opus-4-5 ✅ Cuota disponible → Éxito ❌ Cuota agotada → Devuelve error (sin fallback) ``` **Caso de uso**: Cuando solo quieres usar suscripciones de pago, sin costos extras. ### Ejemplo 4: Modo solo gratis **Configuración:** ``` Model: if/kimi-k2-thinking Fallback: qw/qwen3-coder-plus → kr/claude-sonnet-4.5 ``` **Comportamiento:** ``` Todas las solicitudes → Solo nivel gratis Costo: $0 para siempre ``` **Caso de uso**: Proyectos personales, aprendizaje, experimentación. --- ## Mejores prácticas ### 1. Maximiza el valor de la suscripción ``` Estrategia: - Establece modelos de suscripción como Nivel 1 - Monitorea el uso de cuota en el dashboard - Usa el nivel barato solo cuando la suscripción se agote ``` **Ejemplo de combo:** ``` cc/claude-opus-4-5 → glm/glm-4.7 → if/kimi-k2-thinking ``` ### 2. Optimiza por costo ``` Estrategia: - Usa el nivel gratis de Gemini CLI primero (180K/mes) - Fallback a GLM/MiniMax (ultra-baratos) - Emergencia: iFlow (gratis) ``` **Ejemplo de combo:** ``` gc/gemini-3-flash-preview → glm/glm-4.7 → if/kimi-k2-thinking ``` ### 3. Optimiza por calidad ``` Estrategia: - Usa los mejores modelos (Claude Opus, GPT-5.2) - Fallback a modelos baratos buenos (GLM-4.7) - Último recurso: Nivel gratis ``` **Ejemplo de combo:** ``` cc/claude-opus-4-5 → cx/gpt-5.2-codex → glm/glm-4.7 ``` ### 4. Disponibilidad 24/7 ``` Estrategia: - Siempre incluye el nivel gratis en el fallback - Monitorea los tiempos de reinicio de cuota - Distribuye el uso entre proveedores ``` **Ejemplo de combo:** ``` cc/claude-opus-4-5 → glm/glm-4.7 → minimax/MiniMax-M2.1 → if/kimi-k2-thinking ``` **Resultado**: Nunca te quedas sin cuota, codifica en cualquier momento. --- ## Estrategia de reinicio de cuota Planifica tu uso según los tiempos de reinicio de cuota: | Proveedor | Reinicio de cuota | Estrategia | |----------|-------------|----------| | **Claude Code** | 5 horas + semanal | Usar en la mañana, cuota fresca | | **Codex** | 5 horas + semanal | Usar después de cuota de Claude | | **Gemini CLI** | Diario (1K) + Mensual (180K) | Usar durante el día | | **GLM-4.7** | Diario 10:00 AM | Usar en la noche, se reinicia al día siguiente | | **MiniMax M2.1** | Rolling 5 horas | Usar cuando sea, rastrea ventana rolling | | **iFlow/Qwen/Kiro** | Sin límite | Respaldo de emergencia | **Ejemplo de rutina diaria:** ``` 08:00 - 13:00: Claude Code (cuota fresca 5h) 13:00 - 18:00: Gemini CLI (cuota 1K/día) 18:00 - 22:00: GLM-4.7 (barato, se reinicia 10AM) 22:00 - 08:00: MiniMax o iFlow (rolling 5h o gratis) ``` --- ## Monitoreo y alertas ### Rastreador de cuota del dashboard ``` Dashboard → Quota Overview: Claude Code: 2.5h / 5h restantes (50%) Gemini CLI: 450 / 1000 solicitudes hoy GLM-4.7: 5M / 10M tokens (se reinicia en 8h) MiniMax: 3M / 5M tokens (rolling 5h) ``` ### Notificaciones en tiempo real ``` Dashboard → Notifications: ⚠️ Cuota de Claude Code 80% usada (1h restante) ✅ Cuota de GLM-4.7 reiniciada (10M tokens disponibles) 💰 Presupuesto diario 50% usado ($2.50 / $5) ``` ### Analítica de uso ``` Dashboard → Analytics: Hoy: 50M tokens - 30M vía Claude Code (suscripción) - 15M vía GLM-4.7 ($9) - 5M vía iFlow (gratis) Costo: $9 (vs $1000 en ChatGPT API) Ahorros: 99% ``` --- ## Solución de problemas **Problema: "All providers quota exhausted"** **Solución:** 1. Verifica el rastreador de cuota del dashboard 2. Espera el reinicio de cuota (mira la cuenta regresiva) 3. Agrega el nivel gratis a la cadena de fallback 4. O aumenta el límite de presupuesto **Problema: "Demasiados cambios de fallback"** **Solución:** 1. Verifica si el proveedor principal está caído 2. Aumenta los límites de cuota (mejora la suscripción) 3. Usa un modelo principal más barato (GLM en lugar de Claude) **Problema: "Costos inesperados"** **Solución:** 1. Dashboard → Analytics → Revisa el uso 2. Establece límites de presupuesto diarios/mensuales 3. Cambia al nivel gratis para tareas no críticas 4. Usa combos con fallback gratis --- ## Relacionado - [Combos](./combos.md) - Crea cadenas de fallback personalizadas - [Seguimiento de cuota](./quota-tracking.md) - Monitorea uso y costos