9router/gitbook/content/zh-CN/features/combos.md
2026-05-11 11:50:24 +07:00

537 lines
9.8 KiB
Markdown

# 组合(Combos)- 自定义回退链
创建自定义的模型组合并自动回退。组合让你根据成本、质量和可用性定义自己的路由策略。
---
## 什么是组合?
组合是你在仪表盘中创建的 **自定义回退链**。它不是单一模型,而是定义一组顺序模型,由 9Router 依次尝试。
**示例:**
```
组合名: premium-coding
模型:
1. cc/claude-opus-4-5-20251101 (首选)
2. glm/glm-4.7 (#1 配额耗尽时)
3. minimax/MiniMax-M2.1 (#2 配额耗尽时)
```
**CLI 中使用:**
```
Model: premium-coding
```
9Router 会按顺序自动尝试每个模型,直到成功为止。
---
## 为什么使用组合?
### 1. 最大化订阅价值
```
cc/claude-opus → glm/glm-4.7 → if/kimi-k2-thinking
→ 先用订阅,低价备用,免费应急
→ 充分利用你已付费的订阅
```
### 2. 最小化成本
```
glm/glm-4.7 → minimax/MiniMax-M2.1 → if/kimi-k2-thinking
→ 从最便宜的付费选项开始(每 1M $0.60)
→ 回退到更便宜的(每 1M $0.20)
→ 应急免费层
→ 总成本: 约 $5-10/月,而 ChatGPT API 需要 $2000
```
### 3. 保障 24/7 可用
```
cc/claude-opus → cx/gpt-5.2-codex → glm/glm-4.7 → if/kimi-k2-thinking
→ 末尾总是放免费层
→ 永不耗尽配额
→ 随时随地编码
```
### 4. 质量优化
```
cc/claude-opus-4-5 → cx/gpt-5.2-codex → gc/gemini-3-pro
→ 优先最好的模型
→ 回退到其他高端模型
→ 整个回退链保持高质量
```
---
## 如何创建组合
### 步骤 1:打开仪表盘
```
http://localhost:20128
→ 用密码登录
```
### 步骤 2:进入组合页面
```
仪表盘 → 组合 → 新建组合
```
### 步骤 3:配置组合
**组合名:**
```
premium-coding
```
**描述(可选):**
```
订阅优先,低价备用,免费应急
```
**选择模型:**
```
1. cc/claude-opus-4-5-20251101
2. glm/glm-4.7
3. minimax/MiniMax-M2.1
```
**拖动排序** - 自上而下表示优先级。
### 步骤 4:保存
```
点击 "Save Combo"
→ 组合出现在模型列表中
```
### 步骤 5:在 CLI 中使用
```
Cursor/Cline/任意工具:
Model: premium-coding
```
---
## 示例组合
### 示例 1:Premium Coding(订阅 → 低价 → 免费)
**目标**:最大化订阅价值,最小化额外成本。
```
仪表盘 → 组合 → 新建
名称: premium-coding
模型:
1. cc/claude-opus-4-5-20251101
2. glm/glm-4.7
3. minimax/MiniMax-M2.1
```
**用法:**
```
Cursor IDE:
Model: premium-coding
```
**行为:**
```
早上(全新配额):
请求 → cc/claude-opus-4-5 ✅
下午(Claude 配额用完):
请求 → glm/glm-4.7 ✅ (自动切换)
晚上(GLM 配额用完):
请求 → minimax/MiniMax-M2.1 ✅ (自动切换)
```
**月成本(100M tokens):**
```
80M 通过 Claude Code: $0(订阅)
15M 通过 GLM: $9
5M 通过 MiniMax: $1
合计: $10 + 你的订阅
```
**节省**:相比 ChatGPT API($2000)约 99%。
---
### 示例 2:Budget Combo(低价 → 免费)
**目标**:最小化成本,免费层作为备用。
```
仪表盘 → 组合 → 新建
名称: budget-combo
模型:
1. glm/glm-4.7
2. minimax/MiniMax-M2.1
3. if/kimi-k2-thinking
```
**用法:**
```
Cline:
Provider: OpenAI Compatible
Base URL: http://localhost:20128/v1
Model: budget-combo
```
**行为:**
```
请求 → glm/glm-4.7
✅ 每日配额可用 → 使用 GLM(每 1M $0.60)
❌ 配额耗尽 → 尝试 MiniMax(每 1M $0.20)
❌ MiniMax 配额用完 → 使用 iFlow(免费)
```
**月成本(100M tokens):**
```
70M 通过 GLM: $42
20M 通过 MiniMax: $4
10M 通过 iFlow: $0
合计: $46,而 ChatGPT API 需 $2000
```
**节省**:97%。
---
### 示例 3:Free Combo(零成本)
**目标**:100% 免费,永不付费。
```
仪表盘 → 组合 → 新建
名称: free-combo
模型:
1. if/kimi-k2-thinking
2. qw/qwen3-coder-plus
3. kr/claude-sonnet-4.5
```
**用法:**
```
Claude Desktop:
Model: free-combo
```
**行为:**
```
请求 → if/kimi-k2-thinking
✅ 可用 → 使用 iFlow
❌ 错误 → 尝试 Qwen
❌ 错误 → 尝试 Kiro
```
**月成本:**
```
100M tokens 通过免费提供商: $0
合计: 永远 $0
```
**适用场景**:个人项目、学习、试验。
---
### 示例 4:Quality First(仅高端模型)
**目标**:最高质量,无低价回退。
```
仪表盘 → 组合 → 新建
名称: quality-first
模型:
1. cc/claude-opus-4-5-20251101
2. cx/gpt-5.2-codex
3. gc/gemini-3-pro-preview
```
**用法:**
```
Codex CLI:
export OPENAI_BASE_URL="http://localhost:20128"
Model: quality-first
```
**行为:**
```
请求 → cc/claude-opus-4-5
❌ 配额用完 → cx/gpt-5.2-codex
❌ 配额用完 → gc/gemini-3-pro-preview
❌ 全部用完 → 返回错误(无低价回退)
```
**适用场景**:关键生产代码、复杂重构。
---
### 示例 5:Multi-Subscription(用足所有订阅)
**目标**:在产生额外费用前用足所有订阅。
```
仪表盘 → 组合 → 新建
名称: multi-sub
模型:
1. gc/gemini-3-flash-preview (每月免费 180K)
2. cc/claude-opus-4-5-20251101 (Pro 订阅)
3. cx/gpt-5.2-codex (Plus 订阅)
4. gh/gpt-5 (Copilot 订阅)
5. glm/glm-4.7 (低价备用)
6. if/kimi-k2-thinking (免费应急)
```
**月成本(200M tokens):**
```
50M 通过 Gemini CLI: $0(免费层)
80M 通过 Claude Code: $0(订阅)
40M 通过 Codex: $0(订阅)
20M 通过 Copilot: $0(订阅)
8M 通过 GLM: $4.80
2M 通过 iFlow: $0
合计: $4.80 + 你已有的订阅
```
**结果**:190M tokens 来自订阅,只有 $4.80 额外费用。
---
### 示例 6:配额重置优化
**目标**:根据重置时间分配使用。
```
仪表盘 → 组合 → 新建
名称: reset-optimized
模型:
1. cc/claude-opus-4-5 (5h 重置, 早上用)
2. gc/gemini-3-flash (每日 1K, 下午用)
3. glm/glm-4.7 (每日 10AM 重置, 晚上用)
4. minimax/MiniMax-M2.1 (5h 滚动, 夜里用)
5. if/kimi-k2-thinking (无限, 应急)
```
**日常安排:**
```
08:00 - 13:00: Claude Code(全新 5h 配额)
13:00 - 18:00: Gemini CLI(每日 1K 配额)
18:00 - 22:00: GLM(次日 10AM 重置)
22:00 - 08:00: MiniMax(5h 滚动)或 iFlow
```
**结果**:24/7 编码,成本极低。
---
## 在 CLI 工具中使用组合
### Cursor IDE
```
Settings → Models → Advanced:
OpenAI API Base URL: http://localhost:20128/v1
OpenAI API Key: [从仪表盘获取]
Model: premium-coding
```
### Claude Desktop
编辑 `~/.claude/config.json`:
```json
{
"anthropic_api_base": "http://localhost:20128/v1",
"anthropic_api_key": "your-9router-api-key",
"model": "budget-combo"
}
```
### Codex CLI
```bash
export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-9router-api-key"
codex --model quality-first "your prompt"
```
### Cline / Continue / RooCode
```
Provider: OpenAI Compatible
Base URL: http://localhost:20128/v1
API Key: [从仪表盘获取]
Model: free-combo
```
### API 请求
```bash
curl http://localhost:20128/v1/chat/completions \
-H "Authorization: Bearer your-api-key" \
-H "Content-Type: application/json" \
-d '{
"model": "premium-coding",
"messages": [
{"role": "user", "content": "Write a function to..."}
],
"stream": true
}'
```
---
## 最佳实践
### 1. 总是包含免费层
```
✅ 好:
cc/claude-opus → glm/glm-4.7 → if/kimi-k2-thinking
❌ 不好:
cc/claude-opus → glm/glm-4.7
(无免费回退,可能耗尽配额)
```
**原因**:确保 24/7 可用,绝不会被配额卡住。
### 2. 按成本排序(便宜 → 贵)
```
✅ 好:
glm/glm-4.7 → minimax/MiniMax-M2.1 → cc/claude-opus
❌ 不好:
cc/claude-opus → glm/glm-4.7
(在简单任务上浪费订阅配额)
```
**例外**:如果想充分利用订阅价值,把订阅放在最前面。
### 3. 匹配质量要求
```
生产代码:
cc/claude-opus → cx/gpt-5.2-codex → glm/glm-4.7
简单任务:
glm/glm-4.7 → if/kimi-k2-thinking
试验:
if/kimi-k2-thinking → qw/qwen3-coder-plus
```
### 4. 考虑配额重置时间
```
早上组合(配额刚刷新):
cc/claude-opus → cx/gpt-5.2-codex
晚上组合(配额大概率耗尽):
glm/glm-4.7 → minimax/MiniMax-M2.1 → if/kimi-k2-thinking
```
### 5. 为不同场景创建多个组合
```
premium-coding: 复杂任务
budget-combo: 简单任务
free-combo: 试验
quality-first: 生产代码
```
**根据任务需求切换组合**
### 6. 监控组合性能
```
仪表盘 → 分析 → 组合使用:
premium-coding:
80% 通过 cc/claude-opus(良好,使用订阅)
15% 通过 glm/glm-4.7(可接受备用)
5% 通过 minimax(罕见回退)
```
**优化**:回退使用过多时,提高主配额或重新排序模型。
---
## 高级配置
### 为组合设置预算上限
```
仪表盘 → 组合 → 编辑 → 预算:
每日上限: $5
每月上限: $50
```
达到上限时,9Router 跳过付费模型,仅使用免费层。
### 启用/禁用组合中的模型
```
仪表盘 → 组合 → 编辑 → 模型:
✅ cc/claude-opus-4-5(启用)
❌ glm/glm-4.7(暂时禁用)
✅ if/kimi-k2-thinking(启用)
```
**用途**:暂时禁用昂贵模型而不删除组合。
### 克隆已有组合
```
仪表盘 → 组合 → 克隆 "premium-coding"
→ 生成带 "-copy" 后缀的副本
→ 修改后另存为新组合
```
**用途**:为不同场景创建变体。
---
## 故障排除
**问题:组合未出现在模型列表中**
**方案:**
1. 刷新仪表盘
2. 检查组合已保存(绿色对勾)
3. 重启 CLI 工具以刷新模型列表
**问题:组合总是用最后一个模型(免费层)**
**方案:**
1. 检查主模型的配额(仪表盘 → 配额)
2. 确认 API keys 有效(仪表盘 → 提供商)
3. 检查是否超出预算上限
**问题:组合成本超出预期**
**方案:**
1. 仪表盘 → 分析 → 查看组合使用情况
2. 检查主模型是否配额耗尽
3. 重新排序模型(更便宜的放前面)
4. 设置预算上限
---
## 相关
- [智能路由](./smart-routing.md) - 自动回退如何工作
- [配额跟踪](./quota-tracking.md) - 监控使用与成本