# コンボ - カスタムフォールバックチェーン 自動フォールバック付きのカスタムモデル組み合わせを作成。コンボを使って、コスト、品質、可用性に基づく独自のルーティング戦略を定義できます。 --- ## コンボとは? コンボはダッシュボードで作成する**カスタムフォールバックチェーン**です。単一モデルを使う代わりに、9Routerが順番に試すモデルのシーケンスを定義します。 **例:** ``` コンボ名: premium-coding モデル: 1. cc/claude-opus-4-5-20251101 (最初に試行) 2. glm/glm-4.7 (#1のクォータ消費時) 3. minimax/MiniMax-M2.1 (#2のクォータ消費時) ``` **CLIでの使用:** ``` Model: premium-coding ``` 9Routerは成功するまで各モデルを順番に自動的に試します。 --- ## なぜコンボを使うのか? ### 1. サブスクリプション価値を最大化 ``` cc/claude-opus → glm/glm-4.7 → if/kimi-k2-thinking → サブスクリプション優先、低価格バックアップ、無料緊急時 → すでに支払っているサブスクリプションから完全な価値を得る ``` ### 2. コストを最小化 ``` glm/glm-4.7 → minimax/MiniMax-M2.1 → if/kimi-k2-thinking → 最安の有料オプションから開始 (100万あたり$0.60) → さらに安いものへフォールバック (100万あたり$0.20) → 緊急時の無料階層 → 総コスト: 月$5〜10 vs ChatGPT APIの$2000 ``` ### 3. 24時間可用性を確保 ``` cc/claude-opus → cx/gpt-5.2-codex → glm/glm-4.7 → if/kimi-k2-thinking → 最後に常に無料階層を含める → クォータ切れにならない → いつでもどこでもコーディング ``` ### 4. 品質に最適化 ``` cc/claude-opus-4-5 → cx/gpt-5.2-codex → gc/gemini-3-pro → 最高のモデルが最初 → 他のプレミアムモデルへフォールバック → フォールバックチェーン全体で高品質を維持 ``` --- ## コンボの作成方法 ### ステップ1: ダッシュボードを開く ``` http://localhost:20128 → パスワードでログイン ``` ### ステップ2: コンボへ移動 ``` Dashboard → Combos → Create New Combo ``` ### ステップ3: コンボを設定 **コンボ名:** ``` premium-coding ``` **説明(任意):** ``` サブスクリプション優先、低価格バックアップ、無料緊急時 ``` **モデルを選択:** ``` 1. cc/claude-opus-4-5-20251101 2. glm/glm-4.7 3. minimax/MiniMax-M2.1 ``` **ドラッグで並べ替え** - 上から下へ優先順位。 ### ステップ4: 保存 ``` 「Save Combo」をクリック → コンボがモデルリストに表示 ``` ### ステップ5: CLIで使用 ``` Cursor/Cline/任意のツール: Model: premium-coding ``` --- ## コンボの例 ### 例1: プレミアムコーディング (サブスク → 低価格 → 無料) **目標**: サブスクリプション価値を最大化、追加コストを最小化。 ``` Dashboard → Combos → Create New Name: premium-coding Models: 1. cc/claude-opus-4-5-20251101 2. glm/glm-4.7 3. minimax/MiniMax-M2.1 ``` **使用法:** ``` Cursor IDE: Model: premium-coding ``` **動作:** ``` 朝 (新鮮なクォータ): Request → cc/claude-opus-4-5 ✅ 午後 (Claudeクォータ切れ): Request → glm/glm-4.7 ✅ (自動切替) 夕方 (GLMクォータ切れ): Request → minimax/MiniMax-M2.1 ✅ (自動切替) ``` **月コスト (1億トークン):** ``` Claude Code経由で8000万: $0 (サブスクリプション) GLM経由で1500万: $9 MiniMax経由で500万: $1 合計: $10 + サブスクリプション ``` **節約**: ChatGPT API ($2000) に対して約99%。 --- ### 例2: バジェットコンボ (低価格 → 無料) **目標**: コストを最小化、バックアップに無料階層を使用。 ``` Dashboard → Combos → Create New Name: budget-combo Models: 1. glm/glm-4.7 2. minimax/MiniMax-M2.1 3. if/kimi-k2-thinking ``` **使用法:** ``` Cline: Provider: OpenAI Compatible Base URL: http://localhost:20128/v1 Model: budget-combo ``` **動作:** ``` Request → glm/glm-4.7 ✅ 日次クォータ利用可 → GLMを使用 (100万あたり$0.60) ❌ クォータ消費 → MiniMaxを試行 (100万あたり$0.20) ❌ MiniMaxクォータ切れ → iFlowを使用 (無料) ``` **月コスト (1億トークン):** ``` GLM経由で7000万: $42 MiniMax経由で2000万: $4 iFlow経由で1000万: $0 合計: $46 vs ChatGPT APIの$2000 ``` **節約**: 97%。 --- ### 例3: フリーコンボ (ゼロコスト) **目標**: 100%無料、コストはゼロ。 ``` Dashboard → Combos → Create New Name: free-combo Models: 1. if/kimi-k2-thinking 2. qw/qwen3-coder-plus 3. kr/claude-sonnet-4.5 ``` **使用法:** ``` Claude Desktop: Model: free-combo ``` **動作:** ``` Request → if/kimi-k2-thinking ✅ 利用可 → iFlowを使用 ❌ エラー → Qwenを試行 ❌ エラー → Kiroを試行 ``` **月コスト:** ``` 無料プロバイダー経由で1億トークン: $0 合計: 永久に$0 ``` **ユースケース**: 個人プロジェクト、学習、実験。 --- ### 例4: 品質優先 (プレミアムモデルのみ) **目標**: 最高の品質、低価格フォールバックなし。 ``` Dashboard → Combos → Create New Name: quality-first Models: 1. cc/claude-opus-4-5-20251101 2. cx/gpt-5.2-codex 3. gc/gemini-3-pro-preview ``` **使用法:** ``` Codex CLI: export OPENAI_BASE_URL="http://localhost:20128" Model: quality-first ``` **動作:** ``` Request → cc/claude-opus-4-5 ❌ クォータ切れ → cx/gpt-5.2-codex ❌ クォータ切れ → gc/gemini-3-pro-preview ❌ すべて切れ → エラーを返す (低価格フォールバックなし) ``` **ユースケース**: クリティカルな本番コード、複雑なリファクタリング。 --- ### 例5: マルチサブスクリプション (すべてを最大化) **目標**: 追加料金前にすべてのサブスクリプションを利用。 ``` Dashboard → Combos → Create New Name: multi-sub Models: 1. gc/gemini-3-flash-preview (月18万無料) 2. cc/claude-opus-4-5-20251101 (Proサブスクリプション) 3. cx/gpt-5.2-codex (Plusサブスクリプション) 4. gh/gpt-5 (Copilotサブスクリプション) 5. glm/glm-4.7 (低価格バックアップ) 6. if/kimi-k2-thinking (無料緊急時) ``` **月コスト (2億トークン):** ``` Gemini CLI経由で5000万: $0 (無料プラン) Claude Code経由で8000万: $0 (サブスクリプション) Codex経由で4000万: $0 (サブスクリプション) Copilot経由で2000万: $0 (サブスクリプション) GLM経由で800万: $4.80 iFlow経由で200万: $0 合計: $4.80 + 既存サブスクリプション ``` **結果**: サブスクリプションから1.9億トークン使用、わずか$4.80の追加料金。 --- ### 例6: クォータリセット最適化 **目標**: リセット時間に基づいて使用量を分散。 ``` Dashboard → Combos → Create New Name: reset-optimized Models: 1. cc/claude-opus-4-5 (5時間リセット、朝に使用) 2. gc/gemini-3-flash (1K/日、午後に使用) 3. glm/glm-4.7 (毎日午前10時リセット、夕方に使用) 4. minimax/MiniMax-M2.1 (5時間ローリング、夜に使用) 5. if/kimi-k2-thinking (無制限、緊急時) ``` **日課:** ``` 08:00 - 13:00: Claude Code (新鮮な5時間クォータ) 13:00 - 18:00: Gemini CLI (1K/日クォータ) 18:00 - 22:00: GLM (翌朝10時リセット) 22:00 - 08:00: MiniMax (5時間ローリング) または iFlow ``` **結果**: 最小コストで24時間コーディング。 --- ## CLIツールでコンボを使用 ### Cursor IDE ``` Settings → Models → Advanced: OpenAI API Base URL: http://localhost:20128/v1 OpenAI API Key: [ダッシュボードから取得] Model: premium-coding ``` ### Claude Desktop `~/.claude/config.json`を編集: ```json { "anthropic_api_base": "http://localhost:20128/v1", "anthropic_api_key": "your-9router-api-key", "model": "budget-combo" } ``` ### Codex CLI ```bash export OPENAI_BASE_URL="http://localhost:20128" export OPENAI_API_KEY="your-9router-api-key" codex --model quality-first "your prompt" ``` ### Cline / Continue / RooCode ``` Provider: OpenAI Compatible Base URL: http://localhost:20128/v1 API Key: [ダッシュボードから取得] Model: free-combo ``` ### APIリクエスト ```bash curl http://localhost:20128/v1/chat/completions \ -H "Authorization: Bearer your-api-key" \ -H "Content-Type: application/json" \ -d '{ "model": "premium-coding", "messages": [ {"role": "user", "content": "Write a function to..."} ], "stream": true }' ``` --- ## ベストプラクティス ### 1. 常に無料階層を含める ``` ✅ 良い: cc/claude-opus → glm/glm-4.7 → if/kimi-k2-thinking ❌ 悪い: cc/claude-opus → glm/glm-4.7 (無料フォールバックなし、クォータ切れの可能性) ``` **理由**: 24時間可用性を確保、クォータでブロックされない。 ### 2. コスト順に並べる (安価→高価) ``` ✅ 良い: glm/glm-4.7 → minimax/MiniMax-M2.1 → cc/claude-opus ❌ 悪い: cc/claude-opus → glm/glm-4.7 (シンプルなタスクにサブスクリプションクォータを浪費) ``` **例外**: サブスクリプション価値を最大化したい場合は、サブスクリプションを最初に。 ### 3. 品質要件に合わせる ``` 本番コードの場合: cc/claude-opus → cx/gpt-5.2-codex → glm/glm-4.7 クイックタスクの場合: glm/glm-4.7 → if/kimi-k2-thinking 実験用: if/kimi-k2-thinking → qw/qwen3-coder-plus ``` ### 4. クォータリセット時間を考慮 ``` 朝のコンボ (新鮮なクォータ): cc/claude-opus → cx/gpt-5.2-codex 夕方のコンボ (クォータが消費されている可能性): glm/glm-4.7 → minimax/MiniMax-M2.1 → if/kimi-k2-thinking ``` ### 5. 異なるユースケース用に複数のコンボを作成 ``` premium-coding: 複雑なタスク用 budget-combo: シンプルなタスク用 free-combo: 実験用 quality-first: 本番コード用 ``` **タスク要件に基づいてコンボを切り替え**ます。 ### 6. コンボパフォーマンスをモニター ``` Dashboard → Analytics → Combo Usage: premium-coding: 80% cc/claude-opus経由 (良好、サブスクリプション使用) 15% glm/glm-4.7経由 (許容バックアップ) 5% minimax経由 (まれなフォールバック) ``` **最適化**: フォールバック使用が多すぎる場合、プライマリクォータを増やすかモデルを並べ替え。 --- ## 高度な設定 ### コンボごとに予算上限を設定 ``` Dashboard → Combos → Edit → Budget: Daily limit: $5 Monthly limit: $50 ``` 上限に達すると、9Routerは有料モデルをスキップして無料階層のみを使用。 ### コンボ内のモデルを有効/無効 ``` Dashboard → Combos → Edit → Models: ✅ cc/claude-opus-4-5 (有効) ❌ glm/glm-4.7 (一時的に無効) ✅ if/kimi-k2-thinking (有効) ``` **ユースケース**: コンボを削除せずに高価なモデルを一時的に無効化。 ### 既存のコンボを複製 ``` Dashboard → Combos → Clone "premium-coding" → "-copy" サフィックス付きのコピーを作成 → 変更して新しいコンボとして保存 ``` **ユースケース**: 異なるシナリオ用のバリエーションを作成。 --- ## トラブルシューティング **問題: コンボがモデルリストに表示されない** **解決策:** 1. ダッシュボードを更新 2. コンボが保存されていることを確認 (緑のチェック) 3. CLIツールを再起動してモデルリストを更新 **問題: コンボが常に最後のモデル (無料階層) を使用** **解決策:** 1. プライマリモデルのクォータを確認 (Dashboard → Quota) 2. APIキーが有効か確認 (Dashboard → Providers) 3. 予算上限を超えていないか確認 **問題: コンボのコストが予想より高い** **解決策:** 1. Dashboard → Analytics → コンボ使用量を確認 2. プライマリモデルがクォータ切れか確認 3. モデルを並べ替え (安価を先に) 4. 予算上限を設定 --- ## 関連 - [スマートルーティング](./smart-routing.md) - 自動フォールバックの仕組み - [クォータトラッキング](./quota-tracking.md) - 使用量とコストを監視