537 lines
12 KiB
Markdown
537 lines
12 KiB
Markdown
# コンボ - カスタムフォールバックチェーン
|
|
|
|
自動フォールバック付きのカスタムモデル組み合わせを作成。コンボを使って、コスト、品質、可用性に基づく独自のルーティング戦略を定義できます。
|
|
|
|
---
|
|
|
|
## コンボとは?
|
|
|
|
コンボはダッシュボードで作成する**カスタムフォールバックチェーン**です。単一モデルを使う代わりに、9Routerが順番に試すモデルのシーケンスを定義します。
|
|
|
|
**例:**
|
|
```
|
|
コンボ名: premium-coding
|
|
モデル:
|
|
1. cc/claude-opus-4-5-20251101 (最初に試行)
|
|
2. glm/glm-4.7 (#1のクォータ消費時)
|
|
3. minimax/MiniMax-M2.1 (#2のクォータ消費時)
|
|
```
|
|
|
|
**CLIでの使用:**
|
|
```
|
|
Model: premium-coding
|
|
```
|
|
|
|
9Routerは成功するまで各モデルを順番に自動的に試します。
|
|
|
|
---
|
|
|
|
## なぜコンボを使うのか?
|
|
|
|
### 1. サブスクリプション価値を最大化
|
|
```
|
|
cc/claude-opus → glm/glm-4.7 → if/kimi-k2-thinking
|
|
|
|
→ サブスクリプション優先、低価格バックアップ、無料緊急時
|
|
→ すでに支払っているサブスクリプションから完全な価値を得る
|
|
```
|
|
|
|
### 2. コストを最小化
|
|
```
|
|
glm/glm-4.7 → minimax/MiniMax-M2.1 → if/kimi-k2-thinking
|
|
|
|
→ 最安の有料オプションから開始 (100万あたり$0.60)
|
|
→ さらに安いものへフォールバック (100万あたり$0.20)
|
|
→ 緊急時の無料階層
|
|
→ 総コスト: 月$5〜10 vs ChatGPT APIの$2000
|
|
```
|
|
|
|
### 3. 24時間可用性を確保
|
|
```
|
|
cc/claude-opus → cx/gpt-5.2-codex → glm/glm-4.7 → if/kimi-k2-thinking
|
|
|
|
→ 最後に常に無料階層を含める
|
|
→ クォータ切れにならない
|
|
→ いつでもどこでもコーディング
|
|
```
|
|
|
|
### 4. 品質に最適化
|
|
```
|
|
cc/claude-opus-4-5 → cx/gpt-5.2-codex → gc/gemini-3-pro
|
|
|
|
→ 最高のモデルが最初
|
|
→ 他のプレミアムモデルへフォールバック
|
|
→ フォールバックチェーン全体で高品質を維持
|
|
```
|
|
|
|
---
|
|
|
|
## コンボの作成方法
|
|
|
|
### ステップ1: ダッシュボードを開く
|
|
|
|
```
|
|
http://localhost:20128
|
|
→ パスワードでログイン
|
|
```
|
|
|
|
### ステップ2: コンボへ移動
|
|
|
|
```
|
|
Dashboard → Combos → Create New Combo
|
|
```
|
|
|
|
### ステップ3: コンボを設定
|
|
|
|
**コンボ名:**
|
|
```
|
|
premium-coding
|
|
```
|
|
|
|
**説明(任意):**
|
|
```
|
|
サブスクリプション優先、低価格バックアップ、無料緊急時
|
|
```
|
|
|
|
**モデルを選択:**
|
|
```
|
|
1. cc/claude-opus-4-5-20251101
|
|
2. glm/glm-4.7
|
|
3. minimax/MiniMax-M2.1
|
|
```
|
|
|
|
**ドラッグで並べ替え** - 上から下へ優先順位。
|
|
|
|
### ステップ4: 保存
|
|
|
|
```
|
|
「Save Combo」をクリック
|
|
→ コンボがモデルリストに表示
|
|
```
|
|
|
|
### ステップ5: CLIで使用
|
|
|
|
```
|
|
Cursor/Cline/任意のツール:
|
|
Model: premium-coding
|
|
```
|
|
|
|
---
|
|
|
|
## コンボの例
|
|
|
|
### 例1: プレミアムコーディング (サブスク → 低価格 → 無料)
|
|
|
|
**目標**: サブスクリプション価値を最大化、追加コストを最小化。
|
|
|
|
```
|
|
Dashboard → Combos → Create New
|
|
|
|
Name: premium-coding
|
|
Models:
|
|
1. cc/claude-opus-4-5-20251101
|
|
2. glm/glm-4.7
|
|
3. minimax/MiniMax-M2.1
|
|
```
|
|
|
|
**使用法:**
|
|
```
|
|
Cursor IDE:
|
|
Model: premium-coding
|
|
```
|
|
|
|
**動作:**
|
|
```
|
|
朝 (新鮮なクォータ):
|
|
Request → cc/claude-opus-4-5 ✅
|
|
|
|
午後 (Claudeクォータ切れ):
|
|
Request → glm/glm-4.7 ✅ (自動切替)
|
|
|
|
夕方 (GLMクォータ切れ):
|
|
Request → minimax/MiniMax-M2.1 ✅ (自動切替)
|
|
```
|
|
|
|
**月コスト (1億トークン):**
|
|
```
|
|
Claude Code経由で8000万: $0 (サブスクリプション)
|
|
GLM経由で1500万: $9
|
|
MiniMax経由で500万: $1
|
|
合計: $10 + サブスクリプション
|
|
```
|
|
|
|
**節約**: ChatGPT API ($2000) に対して約99%。
|
|
|
|
---
|
|
|
|
### 例2: バジェットコンボ (低価格 → 無料)
|
|
|
|
**目標**: コストを最小化、バックアップに無料階層を使用。
|
|
|
|
```
|
|
Dashboard → Combos → Create New
|
|
|
|
Name: budget-combo
|
|
Models:
|
|
1. glm/glm-4.7
|
|
2. minimax/MiniMax-M2.1
|
|
3. if/kimi-k2-thinking
|
|
```
|
|
|
|
**使用法:**
|
|
```
|
|
Cline:
|
|
Provider: OpenAI Compatible
|
|
Base URL: http://localhost:20128/v1
|
|
Model: budget-combo
|
|
```
|
|
|
|
**動作:**
|
|
```
|
|
Request → glm/glm-4.7
|
|
✅ 日次クォータ利用可 → GLMを使用 (100万あたり$0.60)
|
|
❌ クォータ消費 → MiniMaxを試行 (100万あたり$0.20)
|
|
❌ MiniMaxクォータ切れ → iFlowを使用 (無料)
|
|
```
|
|
|
|
**月コスト (1億トークン):**
|
|
```
|
|
GLM経由で7000万: $42
|
|
MiniMax経由で2000万: $4
|
|
iFlow経由で1000万: $0
|
|
合計: $46 vs ChatGPT APIの$2000
|
|
```
|
|
|
|
**節約**: 97%。
|
|
|
|
---
|
|
|
|
### 例3: フリーコンボ (ゼロコスト)
|
|
|
|
**目標**: 100%無料、コストはゼロ。
|
|
|
|
```
|
|
Dashboard → Combos → Create New
|
|
|
|
Name: free-combo
|
|
Models:
|
|
1. if/kimi-k2-thinking
|
|
2. qw/qwen3-coder-plus
|
|
3. kr/claude-sonnet-4.5
|
|
```
|
|
|
|
**使用法:**
|
|
```
|
|
Claude Desktop:
|
|
Model: free-combo
|
|
```
|
|
|
|
**動作:**
|
|
```
|
|
Request → if/kimi-k2-thinking
|
|
✅ 利用可 → iFlowを使用
|
|
❌ エラー → Qwenを試行
|
|
❌ エラー → Kiroを試行
|
|
```
|
|
|
|
**月コスト:**
|
|
```
|
|
無料プロバイダー経由で1億トークン: $0
|
|
合計: 永久に$0
|
|
```
|
|
|
|
**ユースケース**: 個人プロジェクト、学習、実験。
|
|
|
|
---
|
|
|
|
### 例4: 品質優先 (プレミアムモデルのみ)
|
|
|
|
**目標**: 最高の品質、低価格フォールバックなし。
|
|
|
|
```
|
|
Dashboard → Combos → Create New
|
|
|
|
Name: quality-first
|
|
Models:
|
|
1. cc/claude-opus-4-5-20251101
|
|
2. cx/gpt-5.2-codex
|
|
3. gc/gemini-3-pro-preview
|
|
```
|
|
|
|
**使用法:**
|
|
```
|
|
Codex CLI:
|
|
export OPENAI_BASE_URL="http://localhost:20128"
|
|
Model: quality-first
|
|
```
|
|
|
|
**動作:**
|
|
```
|
|
Request → cc/claude-opus-4-5
|
|
❌ クォータ切れ → cx/gpt-5.2-codex
|
|
❌ クォータ切れ → gc/gemini-3-pro-preview
|
|
❌ すべて切れ → エラーを返す (低価格フォールバックなし)
|
|
```
|
|
|
|
**ユースケース**: クリティカルな本番コード、複雑なリファクタリング。
|
|
|
|
---
|
|
|
|
### 例5: マルチサブスクリプション (すべてを最大化)
|
|
|
|
**目標**: 追加料金前にすべてのサブスクリプションを利用。
|
|
|
|
```
|
|
Dashboard → Combos → Create New
|
|
|
|
Name: multi-sub
|
|
Models:
|
|
1. gc/gemini-3-flash-preview (月18万無料)
|
|
2. cc/claude-opus-4-5-20251101 (Proサブスクリプション)
|
|
3. cx/gpt-5.2-codex (Plusサブスクリプション)
|
|
4. gh/gpt-5 (Copilotサブスクリプション)
|
|
5. glm/glm-4.7 (低価格バックアップ)
|
|
6. if/kimi-k2-thinking (無料緊急時)
|
|
```
|
|
|
|
**月コスト (2億トークン):**
|
|
```
|
|
Gemini CLI経由で5000万: $0 (無料プラン)
|
|
Claude Code経由で8000万: $0 (サブスクリプション)
|
|
Codex経由で4000万: $0 (サブスクリプション)
|
|
Copilot経由で2000万: $0 (サブスクリプション)
|
|
GLM経由で800万: $4.80
|
|
iFlow経由で200万: $0
|
|
合計: $4.80 + 既存サブスクリプション
|
|
```
|
|
|
|
**結果**: サブスクリプションから1.9億トークン使用、わずか$4.80の追加料金。
|
|
|
|
---
|
|
|
|
### 例6: クォータリセット最適化
|
|
|
|
**目標**: リセット時間に基づいて使用量を分散。
|
|
|
|
```
|
|
Dashboard → Combos → Create New
|
|
|
|
Name: reset-optimized
|
|
Models:
|
|
1. cc/claude-opus-4-5 (5時間リセット、朝に使用)
|
|
2. gc/gemini-3-flash (1K/日、午後に使用)
|
|
3. glm/glm-4.7 (毎日午前10時リセット、夕方に使用)
|
|
4. minimax/MiniMax-M2.1 (5時間ローリング、夜に使用)
|
|
5. if/kimi-k2-thinking (無制限、緊急時)
|
|
```
|
|
|
|
**日課:**
|
|
```
|
|
08:00 - 13:00: Claude Code (新鮮な5時間クォータ)
|
|
13:00 - 18:00: Gemini CLI (1K/日クォータ)
|
|
18:00 - 22:00: GLM (翌朝10時リセット)
|
|
22:00 - 08:00: MiniMax (5時間ローリング) または iFlow
|
|
```
|
|
|
|
**結果**: 最小コストで24時間コーディング。
|
|
|
|
---
|
|
|
|
## CLIツールでコンボを使用
|
|
|
|
### Cursor IDE
|
|
|
|
```
|
|
Settings → Models → Advanced:
|
|
OpenAI API Base URL: http://localhost:20128/v1
|
|
OpenAI API Key: [ダッシュボードから取得]
|
|
Model: premium-coding
|
|
```
|
|
|
|
### Claude Desktop
|
|
|
|
`~/.claude/config.json`を編集:
|
|
```json
|
|
{
|
|
"anthropic_api_base": "http://localhost:20128/v1",
|
|
"anthropic_api_key": "your-9router-api-key",
|
|
"model": "budget-combo"
|
|
}
|
|
```
|
|
|
|
### Codex CLI
|
|
|
|
```bash
|
|
export OPENAI_BASE_URL="http://localhost:20128"
|
|
export OPENAI_API_KEY="your-9router-api-key"
|
|
|
|
codex --model quality-first "your prompt"
|
|
```
|
|
|
|
### Cline / Continue / RooCode
|
|
|
|
```
|
|
Provider: OpenAI Compatible
|
|
Base URL: http://localhost:20128/v1
|
|
API Key: [ダッシュボードから取得]
|
|
Model: free-combo
|
|
```
|
|
|
|
### APIリクエスト
|
|
|
|
```bash
|
|
curl http://localhost:20128/v1/chat/completions \
|
|
-H "Authorization: Bearer your-api-key" \
|
|
-H "Content-Type: application/json" \
|
|
-d '{
|
|
"model": "premium-coding",
|
|
"messages": [
|
|
{"role": "user", "content": "Write a function to..."}
|
|
],
|
|
"stream": true
|
|
}'
|
|
```
|
|
|
|
---
|
|
|
|
## ベストプラクティス
|
|
|
|
### 1. 常に無料階層を含める
|
|
|
|
```
|
|
✅ 良い:
|
|
cc/claude-opus → glm/glm-4.7 → if/kimi-k2-thinking
|
|
|
|
❌ 悪い:
|
|
cc/claude-opus → glm/glm-4.7
|
|
(無料フォールバックなし、クォータ切れの可能性)
|
|
```
|
|
|
|
**理由**: 24時間可用性を確保、クォータでブロックされない。
|
|
|
|
### 2. コスト順に並べる (安価→高価)
|
|
|
|
```
|
|
✅ 良い:
|
|
glm/glm-4.7 → minimax/MiniMax-M2.1 → cc/claude-opus
|
|
|
|
❌ 悪い:
|
|
cc/claude-opus → glm/glm-4.7
|
|
(シンプルなタスクにサブスクリプションクォータを浪費)
|
|
```
|
|
|
|
**例外**: サブスクリプション価値を最大化したい場合は、サブスクリプションを最初に。
|
|
|
|
### 3. 品質要件に合わせる
|
|
|
|
```
|
|
本番コードの場合:
|
|
cc/claude-opus → cx/gpt-5.2-codex → glm/glm-4.7
|
|
|
|
クイックタスクの場合:
|
|
glm/glm-4.7 → if/kimi-k2-thinking
|
|
|
|
実験用:
|
|
if/kimi-k2-thinking → qw/qwen3-coder-plus
|
|
```
|
|
|
|
### 4. クォータリセット時間を考慮
|
|
|
|
```
|
|
朝のコンボ (新鮮なクォータ):
|
|
cc/claude-opus → cx/gpt-5.2-codex
|
|
|
|
夕方のコンボ (クォータが消費されている可能性):
|
|
glm/glm-4.7 → minimax/MiniMax-M2.1 → if/kimi-k2-thinking
|
|
```
|
|
|
|
### 5. 異なるユースケース用に複数のコンボを作成
|
|
|
|
```
|
|
premium-coding: 複雑なタスク用
|
|
budget-combo: シンプルなタスク用
|
|
free-combo: 実験用
|
|
quality-first: 本番コード用
|
|
```
|
|
|
|
**タスク要件に基づいてコンボを切り替え**ます。
|
|
|
|
### 6. コンボパフォーマンスをモニター
|
|
|
|
```
|
|
Dashboard → Analytics → Combo Usage:
|
|
premium-coding:
|
|
80% cc/claude-opus経由 (良好、サブスクリプション使用)
|
|
15% glm/glm-4.7経由 (許容バックアップ)
|
|
5% minimax経由 (まれなフォールバック)
|
|
```
|
|
|
|
**最適化**: フォールバック使用が多すぎる場合、プライマリクォータを増やすかモデルを並べ替え。
|
|
|
|
---
|
|
|
|
## 高度な設定
|
|
|
|
### コンボごとに予算上限を設定
|
|
|
|
```
|
|
Dashboard → Combos → Edit → Budget:
|
|
Daily limit: $5
|
|
Monthly limit: $50
|
|
```
|
|
|
|
上限に達すると、9Routerは有料モデルをスキップして無料階層のみを使用。
|
|
|
|
### コンボ内のモデルを有効/無効
|
|
|
|
```
|
|
Dashboard → Combos → Edit → Models:
|
|
✅ cc/claude-opus-4-5 (有効)
|
|
❌ glm/glm-4.7 (一時的に無効)
|
|
✅ if/kimi-k2-thinking (有効)
|
|
```
|
|
|
|
**ユースケース**: コンボを削除せずに高価なモデルを一時的に無効化。
|
|
|
|
### 既存のコンボを複製
|
|
|
|
```
|
|
Dashboard → Combos → Clone "premium-coding"
|
|
→ "-copy" サフィックス付きのコピーを作成
|
|
→ 変更して新しいコンボとして保存
|
|
```
|
|
|
|
**ユースケース**: 異なるシナリオ用のバリエーションを作成。
|
|
|
|
---
|
|
|
|
## トラブルシューティング
|
|
|
|
**問題: コンボがモデルリストに表示されない**
|
|
|
|
**解決策:**
|
|
1. ダッシュボードを更新
|
|
2. コンボが保存されていることを確認 (緑のチェック)
|
|
3. CLIツールを再起動してモデルリストを更新
|
|
|
|
**問題: コンボが常に最後のモデル (無料階層) を使用**
|
|
|
|
**解決策:**
|
|
1. プライマリモデルのクォータを確認 (Dashboard → Quota)
|
|
2. APIキーが有効か確認 (Dashboard → Providers)
|
|
3. 予算上限を超えていないか確認
|
|
|
|
**問題: コンボのコストが予想より高い**
|
|
|
|
**解決策:**
|
|
1. Dashboard → Analytics → コンボ使用量を確認
|
|
2. プライマリモデルがクォータ切れか確認
|
|
3. モデルを並べ替え (安価を先に)
|
|
4. 予算上限を設定
|
|
|
|
---
|
|
|
|
## 関連
|
|
|
|
- [スマートルーティング](./smart-routing.md) - 自動フォールバックの仕組み
|
|
- [クォータトラッキング](./quota-tracking.md) - 使用量とコストを監視
|