9router/gitbook/content/zh-CN/features/combos.md
2026-05-11 11:50:24 +07:00

9.8 KiB

组合(Combos)- 自定义回退链

创建自定义的模型组合并自动回退。组合让你根据成本、质量和可用性定义自己的路由策略。


什么是组合?

组合是你在仪表盘中创建的 自定义回退链。它不是单一模型,而是定义一组顺序模型,由 9Router 依次尝试。

示例:

组合名: premium-coding
模型:
  1. cc/claude-opus-4-5-20251101 (首选)
  2. glm/glm-4.7 (#1 配额耗尽时)
  3. minimax/MiniMax-M2.1 (#2 配额耗尽时)

CLI 中使用:

Model: premium-coding

9Router 会按顺序自动尝试每个模型,直到成功为止。


为什么使用组合?

1. 最大化订阅价值

cc/claude-opus → glm/glm-4.7 → if/kimi-k2-thinking

→ 先用订阅,低价备用,免费应急
→ 充分利用你已付费的订阅

2. 最小化成本

glm/glm-4.7 → minimax/MiniMax-M2.1 → if/kimi-k2-thinking

→ 从最便宜的付费选项开始(每 1M $0.60)
→ 回退到更便宜的(每 1M $0.20)
→ 应急免费层
→ 总成本: 约 $5-10/月,而 ChatGPT API 需要 $2000

3. 保障 24/7 可用

cc/claude-opus → cx/gpt-5.2-codex → glm/glm-4.7 → if/kimi-k2-thinking

→ 末尾总是放免费层
→ 永不耗尽配额
→ 随时随地编码

4. 质量优化

cc/claude-opus-4-5 → cx/gpt-5.2-codex → gc/gemini-3-pro

→ 优先最好的模型
→ 回退到其他高端模型
→ 整个回退链保持高质量

如何创建组合

步骤 1:打开仪表盘

http://localhost:20128
→ 用密码登录

步骤 2:进入组合页面

仪表盘 → 组合 → 新建组合

步骤 3:配置组合

组合名:

premium-coding

描述(可选):

订阅优先,低价备用,免费应急

选择模型:

1. cc/claude-opus-4-5-20251101
2. glm/glm-4.7
3. minimax/MiniMax-M2.1

拖动排序 - 自上而下表示优先级。

步骤 4:保存

点击 "Save Combo"
→ 组合出现在模型列表中

步骤 5:在 CLI 中使用

Cursor/Cline/任意工具:
  Model: premium-coding

示例组合

示例 1:Premium Coding(订阅 → 低价 → 免费)

目标:最大化订阅价值,最小化额外成本。

仪表盘 → 组合 → 新建

名称: premium-coding
模型:
  1. cc/claude-opus-4-5-20251101
  2. glm/glm-4.7
  3. minimax/MiniMax-M2.1

用法:

Cursor IDE:
  Model: premium-coding

行为:

早上(全新配额):
  请求 → cc/claude-opus-4-5 ✅

下午(Claude 配额用完):
  请求 → glm/glm-4.7 ✅ (自动切换)

晚上(GLM 配额用完):
  请求 → minimax/MiniMax-M2.1 ✅ (自动切换)

月成本(100M tokens):

80M 通过 Claude Code: $0(订阅)
15M 通过 GLM: $9
5M 通过 MiniMax: $1
合计: $10 + 你的订阅

节省:相比 ChatGPT API($2000)约 99%。


示例 2:Budget Combo(低价 → 免费)

目标:最小化成本,免费层作为备用。

仪表盘 → 组合 → 新建

名称: budget-combo
模型:
  1. glm/glm-4.7
  2. minimax/MiniMax-M2.1
  3. if/kimi-k2-thinking

用法:

Cline:
  Provider: OpenAI Compatible
  Base URL: http://localhost:20128/v1
  Model: budget-combo

行为:

请求 → glm/glm-4.7
  ✅ 每日配额可用 → 使用 GLM(每 1M $0.60)
  ❌ 配额耗尽 → 尝试 MiniMax(每 1M $0.20)
  ❌ MiniMax 配额用完 → 使用 iFlow(免费)

月成本(100M tokens):

70M 通过 GLM: $42
20M 通过 MiniMax: $4
10M 通过 iFlow: $0
合计: $46,而 ChatGPT API 需 $2000

节省:97%。


示例 3:Free Combo(零成本)

目标:100% 免费,永不付费。

仪表盘 → 组合 → 新建

名称: free-combo
模型:
  1. if/kimi-k2-thinking
  2. qw/qwen3-coder-plus
  3. kr/claude-sonnet-4.5

用法:

Claude Desktop:
  Model: free-combo

行为:

请求 → if/kimi-k2-thinking
  ✅ 可用 → 使用 iFlow
  ❌ 错误 → 尝试 Qwen
  ❌ 错误 → 尝试 Kiro

月成本:

100M tokens 通过免费提供商: $0
合计: 永远 $0

适用场景:个人项目、学习、试验。


示例 4:Quality First(仅高端模型)

目标:最高质量,无低价回退。

仪表盘 → 组合 → 新建

名称: quality-first
模型:
  1. cc/claude-opus-4-5-20251101
  2. cx/gpt-5.2-codex
  3. gc/gemini-3-pro-preview

用法:

Codex CLI:
  export OPENAI_BASE_URL="http://localhost:20128"
  Model: quality-first

行为:

请求 → cc/claude-opus-4-5
  ❌ 配额用完 → cx/gpt-5.2-codex
  ❌ 配额用完 → gc/gemini-3-pro-preview
  ❌ 全部用完 → 返回错误(无低价回退)

适用场景:关键生产代码、复杂重构。


示例 5:Multi-Subscription(用足所有订阅)

目标:在产生额外费用前用足所有订阅。

仪表盘 → 组合 → 新建

名称: multi-sub
模型:
  1. gc/gemini-3-flash-preview (每月免费 180K)
  2. cc/claude-opus-4-5-20251101 (Pro 订阅)
  3. cx/gpt-5.2-codex (Plus 订阅)
  4. gh/gpt-5 (Copilot 订阅)
  5. glm/glm-4.7 (低价备用)
  6. if/kimi-k2-thinking (免费应急)

月成本(200M tokens):

50M 通过 Gemini CLI: $0(免费层)
80M 通过 Claude Code: $0(订阅)
40M 通过 Codex: $0(订阅)
20M 通过 Copilot: $0(订阅)
8M 通过 GLM: $4.80
2M 通过 iFlow: $0
合计: $4.80 + 你已有的订阅

结果:190M tokens 来自订阅,只有 $4.80 额外费用。


示例 6:配额重置优化

目标:根据重置时间分配使用。

仪表盘 → 组合 → 新建

名称: reset-optimized
模型:
  1. cc/claude-opus-4-5 (5h 重置, 早上用)
  2. gc/gemini-3-flash (每日 1K, 下午用)
  3. glm/glm-4.7 (每日 10AM 重置, 晚上用)
  4. minimax/MiniMax-M2.1 (5h 滚动, 夜里用)
  5. if/kimi-k2-thinking (无限, 应急)

日常安排:

08:00 - 13:00: Claude Code(全新 5h 配额)
13:00 - 18:00: Gemini CLI(每日 1K 配额)
18:00 - 22:00: GLM(次日 10AM 重置)
22:00 - 08:00: MiniMax(5h 滚动)或 iFlow

结果:24/7 编码,成本极低。


在 CLI 工具中使用组合

Cursor IDE

Settings → Models → Advanced:
  OpenAI API Base URL: http://localhost:20128/v1
  OpenAI API Key: [从仪表盘获取]
  Model: premium-coding

Claude Desktop

编辑 ~/.claude/config.json:

{
  "anthropic_api_base": "http://localhost:20128/v1",
  "anthropic_api_key": "your-9router-api-key",
  "model": "budget-combo"
}

Codex CLI

export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-9router-api-key"

codex --model quality-first "your prompt"

Cline / Continue / RooCode

Provider: OpenAI Compatible
Base URL: http://localhost:20128/v1
API Key: [从仪表盘获取]
Model: free-combo

API 请求

curl http://localhost:20128/v1/chat/completions \
  -H "Authorization: Bearer your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "premium-coding",
    "messages": [
      {"role": "user", "content": "Write a function to..."}
    ],
    "stream": true
  }'

最佳实践

1. 总是包含免费层

✅ 好:
cc/claude-opus → glm/glm-4.7 → if/kimi-k2-thinking

❌ 不好:
cc/claude-opus → glm/glm-4.7
(无免费回退,可能耗尽配额)

原因:确保 24/7 可用,绝不会被配额卡住。

2. 按成本排序(便宜 → 贵)

✅ 好:
glm/glm-4.7 → minimax/MiniMax-M2.1 → cc/claude-opus

❌ 不好:
cc/claude-opus → glm/glm-4.7
(在简单任务上浪费订阅配额)

例外:如果想充分利用订阅价值,把订阅放在最前面。

3. 匹配质量要求

生产代码:
cc/claude-opus → cx/gpt-5.2-codex → glm/glm-4.7

简单任务:
glm/glm-4.7 → if/kimi-k2-thinking

试验:
if/kimi-k2-thinking → qw/qwen3-coder-plus

4. 考虑配额重置时间

早上组合(配额刚刷新):
cc/claude-opus → cx/gpt-5.2-codex

晚上组合(配额大概率耗尽):
glm/glm-4.7 → minimax/MiniMax-M2.1 → if/kimi-k2-thinking

5. 为不同场景创建多个组合

premium-coding: 复杂任务
budget-combo: 简单任务
free-combo: 试验
quality-first: 生产代码

根据任务需求切换组合

6. 监控组合性能

仪表盘 → 分析 → 组合使用:
  premium-coding:
    80% 通过 cc/claude-opus(良好,使用订阅)
    15% 通过 glm/glm-4.7(可接受备用)
    5% 通过 minimax(罕见回退)

优化:回退使用过多时,提高主配额或重新排序模型。


高级配置

为组合设置预算上限

仪表盘 → 组合 → 编辑 → 预算:
  每日上限: $5
  每月上限: $50

达到上限时,9Router 跳过付费模型,仅使用免费层。

启用/禁用组合中的模型

仪表盘 → 组合 → 编辑 → 模型:
  ✅ cc/claude-opus-4-5(启用)
  ❌ glm/glm-4.7(暂时禁用)
  ✅ if/kimi-k2-thinking(启用)

用途:暂时禁用昂贵模型而不删除组合。

克隆已有组合

仪表盘 → 组合 → 克隆 "premium-coding"
→ 生成带 "-copy" 后缀的副本
→ 修改后另存为新组合

用途:为不同场景创建变体。


故障排除

问题:组合未出现在模型列表中

方案:

  1. 刷新仪表盘
  2. 检查组合已保存(绿色对勾)
  3. 重启 CLI 工具以刷新模型列表

问题:组合总是用最后一个模型(免费层)

方案:

  1. 检查主模型的配额(仪表盘 → 配额)
  2. 确认 API keys 有效(仪表盘 → 提供商)
  3. 检查是否超出预算上限

问题:组合成本超出预期

方案:

  1. 仪表盘 → 分析 → 查看组合使用情况
  2. 检查主模型是否配额耗尽
  3. 重新排序模型(更便宜的放前面)
  4. 设置预算上限

相关