marketing-shibata50/9router

Fork 0

decolua fd92af77a0 Feat : Gitbook

2026-05-11 11:50:24 +07:00

12 KiB

Raw Blame History

コンボ - カスタムフォールバックチェーン

自動フォールバック付きのカスタムモデル組み合わせを作成。コンボを使って、コスト、品質、可用性に基づく独自のルーティング戦略を定義できます。

コンボとは?

コンボはダッシュボードで作成するカスタムフォールバックチェーンです。単一モデルを使う代わりに、9Routerが順番に試すモデルのシーケンスを定義します。

例:

コンボ名: premium-coding
モデル:
  1. cc/claude-opus-4-5-20251101 (最初に試行)
  2. glm/glm-4.7 (#1のクォータ消費時)
  3. minimax/MiniMax-M2.1 (#2のクォータ消費時)

CLIでの使用:

Model: premium-coding

9Routerは成功するまで各モデルを順番に自動的に試します。

なぜコンボを使うのか?

1. サブスクリプション価値を最大化

cc/claude-opus → glm/glm-4.7 → if/kimi-k2-thinking

→ サブスクリプション優先、低価格バックアップ、無料緊急時
→ すでに支払っているサブスクリプションから完全な価値を得る

2. コストを最小化

glm/glm-4.7 → minimax/MiniMax-M2.1 → if/kimi-k2-thinking

→ 最安の有料オプションから開始 (100万あたり$0.60)
→ さらに安いものへフォールバック (100万あたり$0.20)
→ 緊急時の無料階層
→ 総コスト: 月$5〜10 vs ChatGPT APIの$2000

3. 24時間可用性を確保

cc/claude-opus → cx/gpt-5.2-codex → glm/glm-4.7 → if/kimi-k2-thinking

→ 最後に常に無料階層を含める
→ クォータ切れにならない
→ いつでもどこでもコーディング

4. 品質に最適化

cc/claude-opus-4-5 → cx/gpt-5.2-codex → gc/gemini-3-pro

→ 最高のモデルが最初
→ 他のプレミアムモデルへフォールバック
→ フォールバックチェーン全体で高品質を維持

コンボの作成方法

ステップ1: ダッシュボードを開く

http://localhost:20128
→ パスワードでログイン

ステップ2: コンボへ移動

Dashboard → Combos → Create New Combo

ステップ3: コンボを設定

コンボ名:

premium-coding

説明(任意):

サブスクリプション優先、低価格バックアップ、無料緊急時

モデルを選択:

1. cc/claude-opus-4-5-20251101
2. glm/glm-4.7
3. minimax/MiniMax-M2.1

ドラッグで並べ替え - 上から下へ優先順位。

ステップ4: 保存

「Save Combo」をクリック
→ コンボがモデルリストに表示

ステップ5: CLIで使用

Cursor/Cline/任意のツール:
  Model: premium-coding

コンボの例

例1: プレミアムコーディング (サブスク → 低価格 → 無料)

目標: サブスクリプション価値を最大化、追加コストを最小化。

Dashboard → Combos → Create New

Name: premium-coding
Models:
  1. cc/claude-opus-4-5-20251101
  2. glm/glm-4.7
  3. minimax/MiniMax-M2.1

使用法:

Cursor IDE:
  Model: premium-coding

動作:

朝 (新鮮なクォータ):
  Request → cc/claude-opus-4-5 ✅

午後 (Claudeクォータ切れ):
  Request → glm/glm-4.7 ✅ (自動切替)

夕方 (GLMクォータ切れ):
  Request → minimax/MiniMax-M2.1 ✅ (自動切替)

月コスト (1億トークン):

Claude Code経由で8000万: $0 (サブスクリプション)
GLM経由で1500万: $9
MiniMax経由で500万: $1
合計: $10 + サブスクリプション

節約: ChatGPT API ($2000) に対して約99%。

例2: バジェットコンボ (低価格 → 無料)

目標: コストを最小化、バックアップに無料階層を使用。

Dashboard → Combos → Create New

Name: budget-combo
Models:
  1. glm/glm-4.7
  2. minimax/MiniMax-M2.1
  3. if/kimi-k2-thinking

使用法:

Cline:
  Provider: OpenAI Compatible
  Base URL: http://localhost:20128/v1
  Model: budget-combo

動作:

Request → glm/glm-4.7
  ✅ 日次クォータ利用可 → GLMを使用 (100万あたり$0.60)
  ❌ クォータ消費 → MiniMaxを試行 (100万あたり$0.20)
  ❌ MiniMaxクォータ切れ → iFlowを使用 (無料)

月コスト (1億トークン):

GLM経由で7000万: $42
MiniMax経由で2000万: $4
iFlow経由で1000万: $0
合計: $46 vs ChatGPT APIの$2000

節約: 97%。

例3: フリーコンボ (ゼロコスト)

目標: 100%無料、コストはゼロ。

Dashboard → Combos → Create New

Name: free-combo
Models:
  1. if/kimi-k2-thinking
  2. qw/qwen3-coder-plus
  3. kr/claude-sonnet-4.5

使用法:

Claude Desktop:
  Model: free-combo

動作:

Request → if/kimi-k2-thinking
  ✅ 利用可 → iFlowを使用
  ❌ エラー → Qwenを試行
  ❌ エラー → Kiroを試行

月コスト:

無料プロバイダー経由で1億トークン: $0
合計: 永久に$0

ユースケース: 個人プロジェクト、学習、実験。

例4: 品質優先 (プレミアムモデルのみ)

目標: 最高の品質、低価格フォールバックなし。

Dashboard → Combos → Create New

Name: quality-first
Models:
  1. cc/claude-opus-4-5-20251101
  2. cx/gpt-5.2-codex
  3. gc/gemini-3-pro-preview

使用法:

Codex CLI:
  export OPENAI_BASE_URL="http://localhost:20128"
  Model: quality-first

動作:

Request → cc/claude-opus-4-5
  ❌ クォータ切れ → cx/gpt-5.2-codex
  ❌ クォータ切れ → gc/gemini-3-pro-preview
  ❌ すべて切れ → エラーを返す (低価格フォールバックなし)

ユースケース: クリティカルな本番コード、複雑なリファクタリング。

例5: マルチサブスクリプション (すべてを最大化)

目標: 追加料金前にすべてのサブスクリプションを利用。

Dashboard → Combos → Create New

Name: multi-sub
Models:
  1. gc/gemini-3-flash-preview (月18万無料)
  2. cc/claude-opus-4-5-20251101 (Proサブスクリプション)
  3. cx/gpt-5.2-codex (Plusサブスクリプション)
  4. gh/gpt-5 (Copilotサブスクリプション)
  5. glm/glm-4.7 (低価格バックアップ)
  6. if/kimi-k2-thinking (無料緊急時)

月コスト (2億トークン):

Gemini CLI経由で5000万: $0 (無料プラン)
Claude Code経由で8000万: $0 (サブスクリプション)
Codex経由で4000万: $0 (サブスクリプション)
Copilot経由で2000万: $0 (サブスクリプション)
GLM経由で800万: $4.80
iFlow経由で200万: $0
合計: $4.80 + 既存サブスクリプション

結果: サブスクリプションから1.9億トークン使用、わずか$4.80の追加料金。

例6: クォータリセット最適化

目標: リセット時間に基づいて使用量を分散。

Dashboard → Combos → Create New

Name: reset-optimized
Models:
  1. cc/claude-opus-4-5 (5時間リセット、朝に使用)
  2. gc/gemini-3-flash (1K/日、午後に使用)
  3. glm/glm-4.7 (毎日午前10時リセット、夕方に使用)
  4. minimax/MiniMax-M2.1 (5時間ローリング、夜に使用)
  5. if/kimi-k2-thinking (無制限、緊急時)

日課:

08:00 - 13:00: Claude Code (新鮮な5時間クォータ)
13:00 - 18:00: Gemini CLI (1K/日クォータ)
18:00 - 22:00: GLM (翌朝10時リセット)
22:00 - 08:00: MiniMax (5時間ローリング) または iFlow

結果: 最小コストで24時間コーディング。

CLIツールでコンボを使用

Cursor IDE

Settings → Models → Advanced:
  OpenAI API Base URL: http://localhost:20128/v1
  OpenAI API Key: [ダッシュボードから取得]
  Model: premium-coding

Claude Desktop

~/.claude/config.jsonを編集:

{
  "anthropic_api_base": "http://localhost:20128/v1",
  "anthropic_api_key": "your-9router-api-key",
  "model": "budget-combo"
}

Codex CLI

export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-9router-api-key"

codex --model quality-first "your prompt"

Cline / Continue / RooCode

Provider: OpenAI Compatible
Base URL: http://localhost:20128/v1
API Key: [ダッシュボードから取得]
Model: free-combo

APIリクエスト

curl http://localhost:20128/v1/chat/completions \
  -H "Authorization: Bearer your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "premium-coding",
    "messages": [
      {"role": "user", "content": "Write a function to..."}
    ],
    "stream": true
  }'

ベストプラクティス

1. 常に無料階層を含める

✅ 良い:
cc/claude-opus → glm/glm-4.7 → if/kimi-k2-thinking

❌ 悪い:
cc/claude-opus → glm/glm-4.7
(無料フォールバックなし、クォータ切れの可能性)

理由: 24時間可用性を確保、クォータでブロックされない。

2. コスト順に並べる (安価→高価)

✅ 良い:
glm/glm-4.7 → minimax/MiniMax-M2.1 → cc/claude-opus

❌ 悪い:
cc/claude-opus → glm/glm-4.7
(シンプルなタスクにサブスクリプションクォータを浪費)

例外: サブスクリプション価値を最大化したい場合は、サブスクリプションを最初に。

3. 品質要件に合わせる

本番コードの場合:
cc/claude-opus → cx/gpt-5.2-codex → glm/glm-4.7

クイックタスクの場合:
glm/glm-4.7 → if/kimi-k2-thinking

実験用:
if/kimi-k2-thinking → qw/qwen3-coder-plus

4. クォータリセット時間を考慮

朝のコンボ (新鮮なクォータ):
cc/claude-opus → cx/gpt-5.2-codex

夕方のコンボ (クォータが消費されている可能性):
glm/glm-4.7 → minimax/MiniMax-M2.1 → if/kimi-k2-thinking

5. 異なるユースケース用に複数のコンボを作成

premium-coding: 複雑なタスク用
budget-combo: シンプルなタスク用
free-combo: 実験用
quality-first: 本番コード用

タスク要件に基づいてコンボを切り替えます。

6. コンボパフォーマンスをモニター

Dashboard → Analytics → Combo Usage:
  premium-coding:
    80% cc/claude-opus経由 (良好、サブスクリプション使用)
    15% glm/glm-4.7経由 (許容バックアップ)
    5% minimax経由 (まれなフォールバック)

最適化: フォールバック使用が多すぎる場合、プライマリクォータを増やすかモデルを並べ替え。

高度な設定

コンボごとに予算上限を設定

Dashboard → Combos → Edit → Budget:
  Daily limit: $5
  Monthly limit: $50

上限に達すると、9Routerは有料モデルをスキップして無料階層のみを使用。

コンボ内のモデルを有効/無効

Dashboard → Combos → Edit → Models:
  ✅ cc/claude-opus-4-5 (有効)
  ❌ glm/glm-4.7 (一時的に無効)
  ✅ if/kimi-k2-thinking (有効)

ユースケース: コンボを削除せずに高価なモデルを一時的に無効化。

既存のコンボを複製

Dashboard → Combos → Clone "premium-coding"
→ "-copy" サフィックス付きのコピーを作成
→ 変更して新しいコンボとして保存

ユースケース: 異なるシナリオ用のバリエーションを作成。

トラブルシューティング

問題: コンボがモデルリストに表示されない

解決策:

ダッシュボードを更新
コンボが保存されていることを確認 (緑のチェック)
CLIツールを再起動してモデルリストを更新

問題: コンボが常に最後のモデル (無料階層) を使用

解決策:

プライマリモデルのクォータを確認 (Dashboard → Quota)
APIキーが有効か確認 (Dashboard → Providers)
予算上限を超えていないか確認

問題: コンボのコストが予想より高い

解決策:

Dashboard → Analytics → コンボ使用量を確認
プライマリモデルがクォータ切れか確認
モデルを並べ替え (安価を先に)
予算上限を設定

12 KiB Raw Blame History

コンボ - カスタムフォールバックチェーン

コンボとは?

なぜコンボを使うのか?

1. サブスクリプション価値を最大化

2. コストを最小化

3. 24時間可用性を確保

4. 品質に最適化

コンボの作成方法

ステップ1: ダッシュボードを開く

ステップ2: コンボへ移動

ステップ3: コンボを設定

ステップ4: 保存

ステップ5: CLIで使用

コンボの例

例1: プレミアムコーディング (サブスク → 低価格 → 無料)

例2: バジェットコンボ (低価格 → 無料)

例3: フリーコンボ (ゼロコスト)

例4: 品質優先 (プレミアムモデルのみ)

例5: マルチサブスクリプション (すべてを最大化)

例6: クォータリセット最適化

CLIツールでコンボを使用

Cursor IDE

Claude Desktop

Codex CLI

Cline / Continue / RooCode

APIリクエスト

ベストプラクティス

1. 常に無料階層を含める

2. コスト順に並べる (安価→高価)

3. 品質要件に合わせる

4. クォータリセット時間を考慮

5. 異なるユースケース用に複数のコンボを作成

6. コンボパフォーマンスをモニター

高度な設定

コンボごとに予算上限を設定

コンボ内のモデルを有効/無効

既存のコンボを複製

トラブルシューティング

関連

12 KiB

Raw Blame History