9router/gitbook/content/vi/features/combos.md
2026-05-11 11:50:24 +07:00

537 lines
11 KiB
Markdown

# Combos - Chuỗi Fallback Tùy chỉnh
Tạo các tổ hợp model tùy chỉnh với fallback tự động. Combo cho phép bạn định nghĩa chiến lược routing dựa trên chi phí, chất lượng và tính khả dụng.
---
## Combos là gì?
Combos là **chuỗi fallback tùy chỉnh** bạn tạo trong dashboard. Thay vì dùng một model duy nhất, bạn định nghĩa một chuỗi các model mà 9Router sẽ thử theo thứ tự.
**Ví dụ:**
```
Combo name: premium-coding
Models:
1. cc/claude-opus-4-5-20251101 (try first)
2. glm/glm-4.7 (if #1 quota exhausted)
3. minimax/MiniMax-M2.1 (if #2 quota exhausted)
```
**Dùng trong CLI:**
```
Model: premium-coding
```
9Router tự động thử từng model theo thứ tự cho đến khi thành công.
---
## Tại sao dùng Combos?
### 1. Tối đa hóa Giá trị Subscription
```
cc/claude-opus → glm/glm-4.7 → if/kimi-k2-thinking
→ Use subscription first, cheap backup, free emergency
→ Get full value from subscriptions you already pay for
```
### 2. Giảm Chi phí
```
glm/glm-4.7 → minimax/MiniMax-M2.1 → if/kimi-k2-thinking
→ Start with cheapest paid option ($0.60/1M)
→ Fallback to even cheaper ($0.20/1M)
→ Emergency free tier
→ Total cost: ~$5-10/month vs $2000 on ChatGPT API
```
### 3. Đảm bảo Khả dụng 24/7
```
cc/claude-opus → cx/gpt-5.2-codex → glm/glm-4.7 → if/kimi-k2-thinking
→ Always include free tier at the end
→ Never run out of quota
→ Code anytime, anywhere
```
### 4. Tối ưu Chất lượng
```
cc/claude-opus-4-5 → cx/gpt-5.2-codex → gc/gemini-3-pro
→ Best models first
→ Fallback to other premium models
→ Maintain high quality across fallback chain
```
---
## Cách tạo Combos
### Bước 1: Mở Dashboard
```
http://localhost:20128
→ Login with your password
```
### Bước 2: Đi đến Combos
```
Dashboard → Combos → Create New Combo
```
### Bước 3: Cấu hình Combo
**Tên Combo:**
```
premium-coding
```
**Mô tả (tùy chọn):**
```
Subscription first, cheap backup, free emergency
```
**Chọn Models:**
```
1. cc/claude-opus-4-5-20251101
2. glm/glm-4.7
3. minimax/MiniMax-M2.1
```
**Kéo để sắp xếp lại** - Ưu tiên từ trên xuống dưới.
### Bước 4: Lưu
```
Click "Save Combo"
→ Combo appears in model list
```
### Bước 5: Dùng trong CLI
```
Cursor/Cline/Any tool:
Model: premium-coding
```
---
## Ví dụ Combos
### Ví dụ 1: Premium Coding (Subscription → Cheap → Free)
**Mục tiêu**: Tối đa giá trị subscription, giảm chi phí thêm.
```
Dashboard → Combos → Create New
Name: premium-coding
Models:
1. cc/claude-opus-4-5-20251101
2. glm/glm-4.7
3. minimax/MiniMax-M2.1
```
**Sử dụng:**
```
Cursor IDE:
Model: premium-coding
```
**Hoạt động:**
```
Morning (fresh quota):
Request → cc/claude-opus-4-5 ✅
Afternoon (Claude quota out):
Request → glm/glm-4.7 ✅ (auto switched)
Evening (GLM quota out):
Request → minimax/MiniMax-M2.1 ✅ (auto switched)
```
**Chi phí hàng tháng (100M tokens):**
```
80M via Claude Code: $0 (subscription)
15M via GLM: $9
5M via MiniMax: $1
Total: $10 + your subscription
```
**Tiết kiệm**: ~99% so với ChatGPT API ($2000).
---
### Ví dụ 2: Budget Combo (Cheap → Free)
**Mục tiêu**: Giảm chi phí, dùng free tier làm backup.
```
Dashboard → Combos → Create New
Name: budget-combo
Models:
1. glm/glm-4.7
2. minimax/MiniMax-M2.1
3. if/kimi-k2-thinking
```
**Sử dụng:**
```
Cline:
Provider: OpenAI Compatible
Base URL: http://localhost:20128/v1
Model: budget-combo
```
**Hoạt động:**
```
Request → glm/glm-4.7
✅ Daily quota available → Use GLM ($0.60/1M)
❌ Quota exhausted → Try MiniMax ($0.20/1M)
❌ MiniMax quota out → Use iFlow (FREE)
```
**Chi phí hàng tháng (100M tokens):**
```
70M via GLM: $42
20M via MiniMax: $4
10M via iFlow: $0
Total: $46 vs $2000 on ChatGPT API
```
**Tiết kiệm**: 97%.
---
### Ví dụ 3: Free Combo (Chi phí 0)
**Mục tiêu**: 100% miễn phí, không bao giờ tốn tiền.
```
Dashboard → Combos → Create New
Name: free-combo
Models:
1. if/kimi-k2-thinking
2. qw/qwen3-coder-plus
3. kr/claude-sonnet-4.5
```
**Sử dụng:**
```
Claude Desktop:
Model: free-combo
```
**Hoạt động:**
```
Request → if/kimi-k2-thinking
✅ Available → Use iFlow
❌ Error → Try Qwen
❌ Error → Try Kiro
```
**Chi phí hàng tháng:**
```
100M tokens via free providers: $0
Total: $0 forever
```
**Use case**: Dự án cá nhân, học tập, thử nghiệm.
---
### Ví dụ 4: Quality First (Chỉ Premium Models)
**Mục tiêu**: Chất lượng tốt nhất, không fallback rẻ.
```
Dashboard → Combos → Create New
Name: quality-first
Models:
1. cc/claude-opus-4-5-20251101
2. cx/gpt-5.2-codex
3. gc/gemini-3-pro-preview
```
**Sử dụng:**
```
Codex CLI:
export OPENAI_BASE_URL="http://localhost:20128"
Model: quality-first
```
**Hoạt động:**
```
Request → cc/claude-opus-4-5
❌ Quota out → cx/gpt-5.2-codex
❌ Quota out → gc/gemini-3-pro-preview
❌ All out → Return error (no cheap fallback)
```
**Use case**: Code production quan trọng, refactoring phức tạp.
---
### Ví dụ 5: Multi-Subscription (Tối đa hết tất cả)
**Mục tiêu**: Dùng hết subscription trước khi trả thêm tiền.
```
Dashboard → Combos → Create New
Name: multi-sub
Models:
1. gc/gemini-3-flash-preview (FREE 180K/month)
2. cc/claude-opus-4-5-20251101 (Pro subscription)
3. cx/gpt-5.2-codex (Plus subscription)
4. gh/gpt-5 (Copilot subscription)
5. glm/glm-4.7 (Cheap backup)
6. if/kimi-k2-thinking (Free emergency)
```
**Chi phí hàng tháng (200M tokens):**
```
50M via Gemini CLI: $0 (free tier)
80M via Claude Code: $0 (subscription)
40M via Codex: $0 (subscription)
20M via Copilot: $0 (subscription)
8M via GLM: $4.80
2M via iFlow: $0
Total: $4.80 + existing subscriptions
```
**Kết quả**: Dùng 190M tokens từ subscription, chỉ $4.80 phụ.
---
### Ví dụ 6: Tối ưu Reset Quota
**Mục tiêu**: Phân bổ sử dụng dựa trên thời gian reset.
```
Dashboard → Combos → Create New
Name: reset-optimized
Models:
1. cc/claude-opus-4-5 (5h reset, use morning)
2. gc/gemini-3-flash (1K/day, use afternoon)
3. glm/glm-4.7 (daily 10AM reset, use evening)
4. minimax/MiniMax-M2.1 (5h rolling, use night)
5. if/kimi-k2-thinking (unlimited, emergency)
```
**Lịch trình hàng ngày:**
```
08:00 - 13:00: Claude Code (fresh 5h quota)
13:00 - 18:00: Gemini CLI (1K/day quota)
18:00 - 22:00: GLM (resets 10AM next day)
22:00 - 08:00: MiniMax (5h rolling) or iFlow
```
**Kết quả**: Code 24/7 với chi phí tối thiểu.
---
## Dùng Combos trong CLI Tools
### Cursor IDE
```
Settings → Models → Advanced:
OpenAI API Base URL: http://localhost:20128/v1
OpenAI API Key: [from dashboard]
Model: premium-coding
```
### Claude Desktop
Sửa `~/.claude/config.json`:
```json
{
"anthropic_api_base": "http://localhost:20128/v1",
"anthropic_api_key": "your-9router-api-key",
"model": "budget-combo"
}
```
### Codex CLI
```bash
export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-9router-api-key"
codex --model quality-first "your prompt"
```
### Cline / Continue / RooCode
```
Provider: OpenAI Compatible
Base URL: http://localhost:20128/v1
API Key: [from dashboard]
Model: free-combo
```
### API Request
```bash
curl http://localhost:20128/v1/chat/completions \
-H "Authorization: Bearer your-api-key" \
-H "Content-Type: application/json" \
-d '{
"model": "premium-coding",
"messages": [
{"role": "user", "content": "Write a function to..."}
],
"stream": true
}'
```
---
## Best Practices
### 1. Luôn bao gồm Free Tier
```
✅ Good:
cc/claude-opus → glm/glm-4.7 → if/kimi-k2-thinking
❌ Bad:
cc/claude-opus → glm/glm-4.7
(no free fallback, can run out of quota)
```
**Lý do**: Đảm bảo khả dụng 24/7, không bao giờ bị chặn bởi quota.
### 2. Sắp xếp theo Chi phí (Rẻ đến Đắt)
```
✅ Good:
glm/glm-4.7 → minimax/MiniMax-M2.1 → cc/claude-opus
❌ Bad:
cc/claude-opus → glm/glm-4.7
(wastes subscription quota on simple tasks)
```
**Ngoại lệ**: Nếu muốn tối đa giá trị subscription, đặt subscription đầu tiên.
### 3. Phù hợp với Yêu cầu Chất lượng
```
For production code:
cc/claude-opus → cx/gpt-5.2-codex → glm/glm-4.7
For quick tasks:
glm/glm-4.7 → if/kimi-k2-thinking
For experimentation:
if/kimi-k2-thinking → qw/qwen3-coder-plus
```
### 4. Cân nhắc Thời gian Reset Quota
```
Morning combo (fresh quotas):
cc/claude-opus → cx/gpt-5.2-codex
Evening combo (quotas likely exhausted):
glm/glm-4.7 → minimax/MiniMax-M2.1 → if/kimi-k2-thinking
```
### 5. Tạo nhiều Combo cho các Use Case khác nhau
```
premium-coding: For complex tasks
budget-combo: For simple tasks
free-combo: For experimentation
quality-first: For production code
```
**Chuyển đổi combo** dựa trên yêu cầu task.
### 6. Theo dõi hiệu năng Combo
```
Dashboard → Analytics → Combo Usage:
premium-coding:
80% via cc/claude-opus (good, using subscription)
15% via glm/glm-4.7 (acceptable backup)
5% via minimax (rare fallback)
```
**Tối ưu**: Nếu fallback quá nhiều, tăng quota chính hoặc sắp xếp lại model.
---
## Cấu hình Nâng cao
### Đặt Giới hạn Ngân sách cho mỗi Combo
```
Dashboard → Combos → Edit → Budget:
Daily limit: $5
Monthly limit: $50
```
Khi đạt giới hạn, 9Router bỏ qua model trả phí và chỉ dùng free tier.
### Bật/Tắt Model trong Combo
```
Dashboard → Combos → Edit → Models:
✅ cc/claude-opus-4-5 (enabled)
❌ glm/glm-4.7 (temporarily disabled)
✅ if/kimi-k2-thinking (enabled)
```
**Use case**: Tạm tắt model đắt mà không cần xóa combo.
### Clone Combo có sẵn
```
Dashboard → Combos → Clone "premium-coding"
→ Creates copy with "-copy" suffix
→ Modify and save as new combo
```
**Use case**: Tạo biến thể cho các kịch bản khác nhau.
---
## Troubleshooting
**Issue: Combo không xuất hiện trong danh sách model**
**Giải pháp:**
1. Refresh dashboard
2. Kiểm tra combo đã được lưu (dấu tick xanh)
3. Khởi động lại CLI tool để refresh danh sách model
**Issue: Combo luôn dùng model cuối cùng (free tier)**
**Giải pháp:**
1. Kiểm tra quota cho các model chính (Dashboard → Quota)
2. Xác minh API keys hợp lệ (Dashboard → Providers)
3. Kiểm tra giới hạn ngân sách không vượt quá
**Issue: Combo tốn hơn dự kiến**
**Giải pháp:**
1. Dashboard → Analytics → Xem usage combo
2. Kiểm tra model chính có bị hết quota không
3. Sắp xếp lại model (đặt rẻ hơn lên trước)
4. Đặt giới hạn ngân sách
---
## Liên quan
- [Smart Routing](./smart-routing.md) - Cách auto fallback hoạt động
- [Quota Tracking](./quota-tracking.md) - Theo dõi sử dụng và chi phí