9.8 KiB
9.8 KiB
组合(Combos)- 自定义回退链
创建自定义的模型组合并自动回退。组合让你根据成本、质量和可用性定义自己的路由策略。
什么是组合?
组合是你在仪表盘中创建的 自定义回退链。它不是单一模型,而是定义一组顺序模型,由 9Router 依次尝试。
示例:
组合名: premium-coding
模型:
1. cc/claude-opus-4-5-20251101 (首选)
2. glm/glm-4.7 (#1 配额耗尽时)
3. minimax/MiniMax-M2.1 (#2 配额耗尽时)
CLI 中使用:
Model: premium-coding
9Router 会按顺序自动尝试每个模型,直到成功为止。
为什么使用组合?
1. 最大化订阅价值
cc/claude-opus → glm/glm-4.7 → if/kimi-k2-thinking
→ 先用订阅,低价备用,免费应急
→ 充分利用你已付费的订阅
2. 最小化成本
glm/glm-4.7 → minimax/MiniMax-M2.1 → if/kimi-k2-thinking
→ 从最便宜的付费选项开始(每 1M $0.60)
→ 回退到更便宜的(每 1M $0.20)
→ 应急免费层
→ 总成本: 约 $5-10/月,而 ChatGPT API 需要 $2000
3. 保障 24/7 可用
cc/claude-opus → cx/gpt-5.2-codex → glm/glm-4.7 → if/kimi-k2-thinking
→ 末尾总是放免费层
→ 永不耗尽配额
→ 随时随地编码
4. 质量优化
cc/claude-opus-4-5 → cx/gpt-5.2-codex → gc/gemini-3-pro
→ 优先最好的模型
→ 回退到其他高端模型
→ 整个回退链保持高质量
如何创建组合
步骤 1:打开仪表盘
http://localhost:20128
→ 用密码登录
步骤 2:进入组合页面
仪表盘 → 组合 → 新建组合
步骤 3:配置组合
组合名:
premium-coding
描述(可选):
订阅优先,低价备用,免费应急
选择模型:
1. cc/claude-opus-4-5-20251101
2. glm/glm-4.7
3. minimax/MiniMax-M2.1
拖动排序 - 自上而下表示优先级。
步骤 4:保存
点击 "Save Combo"
→ 组合出现在模型列表中
步骤 5:在 CLI 中使用
Cursor/Cline/任意工具:
Model: premium-coding
示例组合
示例 1:Premium Coding(订阅 → 低价 → 免费)
目标:最大化订阅价值,最小化额外成本。
仪表盘 → 组合 → 新建
名称: premium-coding
模型:
1. cc/claude-opus-4-5-20251101
2. glm/glm-4.7
3. minimax/MiniMax-M2.1
用法:
Cursor IDE:
Model: premium-coding
行为:
早上(全新配额):
请求 → cc/claude-opus-4-5 ✅
下午(Claude 配额用完):
请求 → glm/glm-4.7 ✅ (自动切换)
晚上(GLM 配额用完):
请求 → minimax/MiniMax-M2.1 ✅ (自动切换)
月成本(100M tokens):
80M 通过 Claude Code: $0(订阅)
15M 通过 GLM: $9
5M 通过 MiniMax: $1
合计: $10 + 你的订阅
节省:相比 ChatGPT API($2000)约 99%。
示例 2:Budget Combo(低价 → 免费)
目标:最小化成本,免费层作为备用。
仪表盘 → 组合 → 新建
名称: budget-combo
模型:
1. glm/glm-4.7
2. minimax/MiniMax-M2.1
3. if/kimi-k2-thinking
用法:
Cline:
Provider: OpenAI Compatible
Base URL: http://localhost:20128/v1
Model: budget-combo
行为:
请求 → glm/glm-4.7
✅ 每日配额可用 → 使用 GLM(每 1M $0.60)
❌ 配额耗尽 → 尝试 MiniMax(每 1M $0.20)
❌ MiniMax 配额用完 → 使用 iFlow(免费)
月成本(100M tokens):
70M 通过 GLM: $42
20M 通过 MiniMax: $4
10M 通过 iFlow: $0
合计: $46,而 ChatGPT API 需 $2000
节省:97%。
示例 3:Free Combo(零成本)
目标:100% 免费,永不付费。
仪表盘 → 组合 → 新建
名称: free-combo
模型:
1. if/kimi-k2-thinking
2. qw/qwen3-coder-plus
3. kr/claude-sonnet-4.5
用法:
Claude Desktop:
Model: free-combo
行为:
请求 → if/kimi-k2-thinking
✅ 可用 → 使用 iFlow
❌ 错误 → 尝试 Qwen
❌ 错误 → 尝试 Kiro
月成本:
100M tokens 通过免费提供商: $0
合计: 永远 $0
适用场景:个人项目、学习、试验。
示例 4:Quality First(仅高端模型)
目标:最高质量,无低价回退。
仪表盘 → 组合 → 新建
名称: quality-first
模型:
1. cc/claude-opus-4-5-20251101
2. cx/gpt-5.2-codex
3. gc/gemini-3-pro-preview
用法:
Codex CLI:
export OPENAI_BASE_URL="http://localhost:20128"
Model: quality-first
行为:
请求 → cc/claude-opus-4-5
❌ 配额用完 → cx/gpt-5.2-codex
❌ 配额用完 → gc/gemini-3-pro-preview
❌ 全部用完 → 返回错误(无低价回退)
适用场景:关键生产代码、复杂重构。
示例 5:Multi-Subscription(用足所有订阅)
目标:在产生额外费用前用足所有订阅。
仪表盘 → 组合 → 新建
名称: multi-sub
模型:
1. gc/gemini-3-flash-preview (每月免费 180K)
2. cc/claude-opus-4-5-20251101 (Pro 订阅)
3. cx/gpt-5.2-codex (Plus 订阅)
4. gh/gpt-5 (Copilot 订阅)
5. glm/glm-4.7 (低价备用)
6. if/kimi-k2-thinking (免费应急)
月成本(200M tokens):
50M 通过 Gemini CLI: $0(免费层)
80M 通过 Claude Code: $0(订阅)
40M 通过 Codex: $0(订阅)
20M 通过 Copilot: $0(订阅)
8M 通过 GLM: $4.80
2M 通过 iFlow: $0
合计: $4.80 + 你已有的订阅
结果:190M tokens 来自订阅,只有 $4.80 额外费用。
示例 6:配额重置优化
目标:根据重置时间分配使用。
仪表盘 → 组合 → 新建
名称: reset-optimized
模型:
1. cc/claude-opus-4-5 (5h 重置, 早上用)
2. gc/gemini-3-flash (每日 1K, 下午用)
3. glm/glm-4.7 (每日 10AM 重置, 晚上用)
4. minimax/MiniMax-M2.1 (5h 滚动, 夜里用)
5. if/kimi-k2-thinking (无限, 应急)
日常安排:
08:00 - 13:00: Claude Code(全新 5h 配额)
13:00 - 18:00: Gemini CLI(每日 1K 配额)
18:00 - 22:00: GLM(次日 10AM 重置)
22:00 - 08:00: MiniMax(5h 滚动)或 iFlow
结果:24/7 编码,成本极低。
在 CLI 工具中使用组合
Cursor IDE
Settings → Models → Advanced:
OpenAI API Base URL: http://localhost:20128/v1
OpenAI API Key: [从仪表盘获取]
Model: premium-coding
Claude Desktop
编辑 ~/.claude/config.json:
{
"anthropic_api_base": "http://localhost:20128/v1",
"anthropic_api_key": "your-9router-api-key",
"model": "budget-combo"
}
Codex CLI
export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-9router-api-key"
codex --model quality-first "your prompt"
Cline / Continue / RooCode
Provider: OpenAI Compatible
Base URL: http://localhost:20128/v1
API Key: [从仪表盘获取]
Model: free-combo
API 请求
curl http://localhost:20128/v1/chat/completions \
-H "Authorization: Bearer your-api-key" \
-H "Content-Type: application/json" \
-d '{
"model": "premium-coding",
"messages": [
{"role": "user", "content": "Write a function to..."}
],
"stream": true
}'
最佳实践
1. 总是包含免费层
✅ 好:
cc/claude-opus → glm/glm-4.7 → if/kimi-k2-thinking
❌ 不好:
cc/claude-opus → glm/glm-4.7
(无免费回退,可能耗尽配额)
原因:确保 24/7 可用,绝不会被配额卡住。
2. 按成本排序(便宜 → 贵)
✅ 好:
glm/glm-4.7 → minimax/MiniMax-M2.1 → cc/claude-opus
❌ 不好:
cc/claude-opus → glm/glm-4.7
(在简单任务上浪费订阅配额)
例外:如果想充分利用订阅价值,把订阅放在最前面。
3. 匹配质量要求
生产代码:
cc/claude-opus → cx/gpt-5.2-codex → glm/glm-4.7
简单任务:
glm/glm-4.7 → if/kimi-k2-thinking
试验:
if/kimi-k2-thinking → qw/qwen3-coder-plus
4. 考虑配额重置时间
早上组合(配额刚刷新):
cc/claude-opus → cx/gpt-5.2-codex
晚上组合(配额大概率耗尽):
glm/glm-4.7 → minimax/MiniMax-M2.1 → if/kimi-k2-thinking
5. 为不同场景创建多个组合
premium-coding: 复杂任务
budget-combo: 简单任务
free-combo: 试验
quality-first: 生产代码
根据任务需求切换组合。
6. 监控组合性能
仪表盘 → 分析 → 组合使用:
premium-coding:
80% 通过 cc/claude-opus(良好,使用订阅)
15% 通过 glm/glm-4.7(可接受备用)
5% 通过 minimax(罕见回退)
优化:回退使用过多时,提高主配额或重新排序模型。
高级配置
为组合设置预算上限
仪表盘 → 组合 → 编辑 → 预算:
每日上限: $5
每月上限: $50
达到上限时,9Router 跳过付费模型,仅使用免费层。
启用/禁用组合中的模型
仪表盘 → 组合 → 编辑 → 模型:
✅ cc/claude-opus-4-5(启用)
❌ glm/glm-4.7(暂时禁用)
✅ if/kimi-k2-thinking(启用)
用途:暂时禁用昂贵模型而不删除组合。
克隆已有组合
仪表盘 → 组合 → 克隆 "premium-coding"
→ 生成带 "-copy" 后缀的副本
→ 修改后另存为新组合
用途:为不同场景创建变体。
故障排除
问题:组合未出现在模型列表中
方案:
- 刷新仪表盘
- 检查组合已保存(绿色对勾)
- 重启 CLI 工具以刷新模型列表
问题:组合总是用最后一个模型(免费层)
方案:
- 检查主模型的配额(仪表盘 → 配额)
- 确认 API keys 有效(仪表盘 → 提供商)
- 检查是否超出预算上限
问题:组合成本超出预期
方案:
- 仪表盘 → 分析 → 查看组合使用情况
- 检查主模型是否配额耗尽
- 重新排序模型(更便宜的放前面)
- 设置预算上限