9router/gitbook/content/vi/features/combos.md
2026-05-11 11:50:24 +07:00

11 KiB

Combos - Chuỗi Fallback Tùy chỉnh

Tạo các tổ hợp model tùy chỉnh với fallback tự động. Combo cho phép bạn định nghĩa chiến lược routing dựa trên chi phí, chất lượng và tính khả dụng.


Combos là gì?

Combos là chuỗi fallback tùy chỉnh bạn tạo trong dashboard. Thay vì dùng một model duy nhất, bạn định nghĩa một chuỗi các model mà 9Router sẽ thử theo thứ tự.

Ví dụ:

Combo name: premium-coding
Models:
  1. cc/claude-opus-4-5-20251101 (try first)
  2. glm/glm-4.7 (if #1 quota exhausted)
  3. minimax/MiniMax-M2.1 (if #2 quota exhausted)

Dùng trong CLI:

Model: premium-coding

9Router tự động thử từng model theo thứ tự cho đến khi thành công.


Tại sao dùng Combos?

1. Tối đa hóa Giá trị Subscription

cc/claude-opus → glm/glm-4.7 → if/kimi-k2-thinking

→ Use subscription first, cheap backup, free emergency
→ Get full value from subscriptions you already pay for

2. Giảm Chi phí

glm/glm-4.7 → minimax/MiniMax-M2.1 → if/kimi-k2-thinking

→ Start with cheapest paid option ($0.60/1M)
→ Fallback to even cheaper ($0.20/1M)
→ Emergency free tier
→ Total cost: ~$5-10/month vs $2000 on ChatGPT API

3. Đảm bảo Khả dụng 24/7

cc/claude-opus → cx/gpt-5.2-codex → glm/glm-4.7 → if/kimi-k2-thinking

→ Always include free tier at the end
→ Never run out of quota
→ Code anytime, anywhere

4. Tối ưu Chất lượng

cc/claude-opus-4-5 → cx/gpt-5.2-codex → gc/gemini-3-pro

→ Best models first
→ Fallback to other premium models
→ Maintain high quality across fallback chain

Cách tạo Combos

Bước 1: Mở Dashboard

http://localhost:20128
→ Login with your password

Bước 2: Đi đến Combos

Dashboard → Combos → Create New Combo

Bước 3: Cấu hình Combo

Tên Combo:

premium-coding

Mô tả (tùy chọn):

Subscription first, cheap backup, free emergency

Chọn Models:

1. cc/claude-opus-4-5-20251101
2. glm/glm-4.7
3. minimax/MiniMax-M2.1

Kéo để sắp xếp lại - Ưu tiên từ trên xuống dưới.

Bước 4: Lưu

Click "Save Combo"
→ Combo appears in model list

Bước 5: Dùng trong CLI

Cursor/Cline/Any tool:
  Model: premium-coding

Ví dụ Combos

Ví dụ 1: Premium Coding (Subscription → Cheap → Free)

Mục tiêu: Tối đa giá trị subscription, giảm chi phí thêm.

Dashboard → Combos → Create New

Name: premium-coding
Models:
  1. cc/claude-opus-4-5-20251101
  2. glm/glm-4.7
  3. minimax/MiniMax-M2.1

Sử dụng:

Cursor IDE:
  Model: premium-coding

Hoạt động:

Morning (fresh quota):
  Request → cc/claude-opus-4-5 ✅

Afternoon (Claude quota out):
  Request → glm/glm-4.7 ✅ (auto switched)

Evening (GLM quota out):
  Request → minimax/MiniMax-M2.1 ✅ (auto switched)

Chi phí hàng tháng (100M tokens):

80M via Claude Code: $0 (subscription)
15M via GLM: $9
5M via MiniMax: $1
Total: $10 + your subscription

Tiết kiệm: ~99% so với ChatGPT API ($2000).


Ví dụ 2: Budget Combo (Cheap → Free)

Mục tiêu: Giảm chi phí, dùng free tier làm backup.

Dashboard → Combos → Create New

Name: budget-combo
Models:
  1. glm/glm-4.7
  2. minimax/MiniMax-M2.1
  3. if/kimi-k2-thinking

Sử dụng:

Cline:
  Provider: OpenAI Compatible
  Base URL: http://localhost:20128/v1
  Model: budget-combo

Hoạt động:

Request → glm/glm-4.7
  ✅ Daily quota available → Use GLM ($0.60/1M)
  ❌ Quota exhausted → Try MiniMax ($0.20/1M)
  ❌ MiniMax quota out → Use iFlow (FREE)

Chi phí hàng tháng (100M tokens):

70M via GLM: $42
20M via MiniMax: $4
10M via iFlow: $0
Total: $46 vs $2000 on ChatGPT API

Tiết kiệm: 97%.


Ví dụ 3: Free Combo (Chi phí 0)

Mục tiêu: 100% miễn phí, không bao giờ tốn tiền.

Dashboard → Combos → Create New

Name: free-combo
Models:
  1. if/kimi-k2-thinking
  2. qw/qwen3-coder-plus
  3. kr/claude-sonnet-4.5

Sử dụng:

Claude Desktop:
  Model: free-combo

Hoạt động:

Request → if/kimi-k2-thinking
  ✅ Available → Use iFlow
  ❌ Error → Try Qwen
  ❌ Error → Try Kiro

Chi phí hàng tháng:

100M tokens via free providers: $0
Total: $0 forever

Use case: Dự án cá nhân, học tập, thử nghiệm.


Ví dụ 4: Quality First (Chỉ Premium Models)

Mục tiêu: Chất lượng tốt nhất, không fallback rẻ.

Dashboard → Combos → Create New

Name: quality-first
Models:
  1. cc/claude-opus-4-5-20251101
  2. cx/gpt-5.2-codex
  3. gc/gemini-3-pro-preview

Sử dụng:

Codex CLI:
  export OPENAI_BASE_URL="http://localhost:20128"
  Model: quality-first

Hoạt động:

Request → cc/claude-opus-4-5
  ❌ Quota out → cx/gpt-5.2-codex
  ❌ Quota out → gc/gemini-3-pro-preview
  ❌ All out → Return error (no cheap fallback)

Use case: Code production quan trọng, refactoring phức tạp.


Ví dụ 5: Multi-Subscription (Tối đa hết tất cả)

Mục tiêu: Dùng hết subscription trước khi trả thêm tiền.

Dashboard → Combos → Create New

Name: multi-sub
Models:
  1. gc/gemini-3-flash-preview (FREE 180K/month)
  2. cc/claude-opus-4-5-20251101 (Pro subscription)
  3. cx/gpt-5.2-codex (Plus subscription)
  4. gh/gpt-5 (Copilot subscription)
  5. glm/glm-4.7 (Cheap backup)
  6. if/kimi-k2-thinking (Free emergency)

Chi phí hàng tháng (200M tokens):

50M via Gemini CLI: $0 (free tier)
80M via Claude Code: $0 (subscription)
40M via Codex: $0 (subscription)
20M via Copilot: $0 (subscription)
8M via GLM: $4.80
2M via iFlow: $0
Total: $4.80 + existing subscriptions

Kết quả: Dùng 190M tokens từ subscription, chỉ $4.80 phụ.


Ví dụ 6: Tối ưu Reset Quota

Mục tiêu: Phân bổ sử dụng dựa trên thời gian reset.

Dashboard → Combos → Create New

Name: reset-optimized
Models:
  1. cc/claude-opus-4-5 (5h reset, use morning)
  2. gc/gemini-3-flash (1K/day, use afternoon)
  3. glm/glm-4.7 (daily 10AM reset, use evening)
  4. minimax/MiniMax-M2.1 (5h rolling, use night)
  5. if/kimi-k2-thinking (unlimited, emergency)

Lịch trình hàng ngày:

08:00 - 13:00: Claude Code (fresh 5h quota)
13:00 - 18:00: Gemini CLI (1K/day quota)
18:00 - 22:00: GLM (resets 10AM next day)
22:00 - 08:00: MiniMax (5h rolling) or iFlow

Kết quả: Code 24/7 với chi phí tối thiểu.


Dùng Combos trong CLI Tools

Cursor IDE

Settings → Models → Advanced:
  OpenAI API Base URL: http://localhost:20128/v1
  OpenAI API Key: [from dashboard]
  Model: premium-coding

Claude Desktop

Sửa ~/.claude/config.json:

{
  "anthropic_api_base": "http://localhost:20128/v1",
  "anthropic_api_key": "your-9router-api-key",
  "model": "budget-combo"
}

Codex CLI

export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-9router-api-key"

codex --model quality-first "your prompt"

Cline / Continue / RooCode

Provider: OpenAI Compatible
Base URL: http://localhost:20128/v1
API Key: [from dashboard]
Model: free-combo

API Request

curl http://localhost:20128/v1/chat/completions \
  -H "Authorization: Bearer your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "premium-coding",
    "messages": [
      {"role": "user", "content": "Write a function to..."}
    ],
    "stream": true
  }'

Best Practices

1. Luôn bao gồm Free Tier

✅ Good:
cc/claude-opus → glm/glm-4.7 → if/kimi-k2-thinking

❌ Bad:
cc/claude-opus → glm/glm-4.7
(no free fallback, can run out of quota)

Lý do: Đảm bảo khả dụng 24/7, không bao giờ bị chặn bởi quota.

2. Sắp xếp theo Chi phí (Rẻ đến Đắt)

✅ Good:
glm/glm-4.7 → minimax/MiniMax-M2.1 → cc/claude-opus

❌ Bad:
cc/claude-opus → glm/glm-4.7
(wastes subscription quota on simple tasks)

Ngoại lệ: Nếu muốn tối đa giá trị subscription, đặt subscription đầu tiên.

3. Phù hợp với Yêu cầu Chất lượng

For production code:
cc/claude-opus → cx/gpt-5.2-codex → glm/glm-4.7

For quick tasks:
glm/glm-4.7 → if/kimi-k2-thinking

For experimentation:
if/kimi-k2-thinking → qw/qwen3-coder-plus

4. Cân nhắc Thời gian Reset Quota

Morning combo (fresh quotas):
cc/claude-opus → cx/gpt-5.2-codex

Evening combo (quotas likely exhausted):
glm/glm-4.7 → minimax/MiniMax-M2.1 → if/kimi-k2-thinking

5. Tạo nhiều Combo cho các Use Case khác nhau

premium-coding: For complex tasks
budget-combo: For simple tasks
free-combo: For experimentation
quality-first: For production code

Chuyển đổi combo dựa trên yêu cầu task.

6. Theo dõi hiệu năng Combo

Dashboard → Analytics → Combo Usage:
  premium-coding:
    80% via cc/claude-opus (good, using subscription)
    15% via glm/glm-4.7 (acceptable backup)
    5% via minimax (rare fallback)

Tối ưu: Nếu fallback quá nhiều, tăng quota chính hoặc sắp xếp lại model.


Cấu hình Nâng cao

Đặt Giới hạn Ngân sách cho mỗi Combo

Dashboard → Combos → Edit → Budget:
  Daily limit: $5
  Monthly limit: $50

Khi đạt giới hạn, 9Router bỏ qua model trả phí và chỉ dùng free tier.

Bật/Tắt Model trong Combo

Dashboard → Combos → Edit → Models:
  ✅ cc/claude-opus-4-5 (enabled)
  ❌ glm/glm-4.7 (temporarily disabled)
  ✅ if/kimi-k2-thinking (enabled)

Use case: Tạm tắt model đắt mà không cần xóa combo.

Clone Combo có sẵn

Dashboard → Combos → Clone "premium-coding"
→ Creates copy with "-copy" suffix
→ Modify and save as new combo

Use case: Tạo biến thể cho các kịch bản khác nhau.


Troubleshooting

Issue: Combo không xuất hiện trong danh sách model

Giải pháp:

  1. Refresh dashboard
  2. Kiểm tra combo đã được lưu (dấu tick xanh)
  3. Khởi động lại CLI tool để refresh danh sách model

Issue: Combo luôn dùng model cuối cùng (free tier)

Giải pháp:

  1. Kiểm tra quota cho các model chính (Dashboard → Quota)
  2. Xác minh API keys hợp lệ (Dashboard → Providers)
  3. Kiểm tra giới hạn ngân sách không vượt quá

Issue: Combo tốn hơn dự kiến

Giải pháp:

  1. Dashboard → Analytics → Xem usage combo
  2. Kiểm tra model chính có bị hết quota không
  3. Sắp xếp lại model (đặt rẻ hơn lên trước)
  4. Đặt giới hạn ngân sách

Liên quan