11 KiB
11 KiB
低価格プロバイダー - 超低価格バックアップ
サブスクリプションクォータが切れたら、ドルではなくセント単位で支払い。ChatGPT APIより約90%安い!
概要
低価格階層プロバイダーは、サブスクリプションクォータが消費された時のバックアップ:
- 💰 GLM-4.7 - 100万トークンあたり$0.6/$2.2 (日次リセット)
- 💰 MiniMax M2.1 - 100万トークンあたり$0.2/$1.0 (5時間リセット)
- 💰 Kimi K2 - 月$9固定 (1000万トークン)
戦略: サブスクリプションクォータ切れ後、無料階層前に使用。ChatGPT API (100万あたり$20) に対して大幅なコスト削減。
GLM-4.7 (日次リセット)
料金
| 階層 | 入力 | 出力 | リセット |
|---|---|---|---|
| Standard | $0.60/1M | $2.20/1M | 毎日午前10時 |
| Coding Plan | $0.60/1M | $2.20/1M | 毎日午前10時 (3×クォータ) |
コスト例 (1000万トークン):
- 入力: 1000万 × $0.60 = $6
- 出力: 1000万 × $2.20 = $22
- 合計: $6〜22 vs ChatGPT APIの$200!
セットアップ
ステップ1: サインアップ
- Zhipu AI を訪問
- アカウント作成 (電話認証)
- 同じ価格で3×クォータの Coding Plan を選択
ステップ2: APIキーを取得
Dashboard → API Keys → Create New
→ APIキーをコピー ("zhipu-"で始まる)
ステップ3: 9Routerに追加
9router
# Dashboard → Providers → Add API Key
Provider: glm
API Key: zhipu-your-api-key-here
ステップ4: CLIで使用
Model: glm/glm-4.7
glm/glm-4.6v (vision)
利用可能なモデル
| モデルID | 説明 | コンテキスト | 最適用途 |
|---|---|---|---|
glm/glm-4.7 |
GLM 4.7 | 128K | コーディング、汎用タスク |
glm/glm-4.6v |
GLM 4.6V Vision | 128K | 画像分析 |
プロのヒント
- Coding Plan - 同じ価格で3×クォータ ($0.6/$2.2)
- 日次リセット - 北京時間午前10時に新鮮なクォータ
- コーディングに最適 - コード生成用に最適化
- 128Kコンテキスト - 大きなファイルを処理
クォータリセット
日次リセット: 北京時間午前10時 (UTC+8)
→ UTC午前2時
→ PST午後6時 (前日)
→ EST午後9時 (前日)
リセット時間に合わせて重いタスクを計画!
MiniMax M2.1 (5時間リセット)
料金
| 階層 | 入力 | 出力 | リセット |
|---|---|---|---|
| Standard | $0.20/1M | $1.00/1M | 5時間ローリング |
コスト例 (1000万トークン):
- 入力: 1000万 × $0.20 = $2
- 出力: 1000万 × $1.00 = $10
- 合計: $2〜10 - 最安オプション!
セットアップ
ステップ1: サインアップ
- MiniMax を訪問
- アカウント作成
- メール/電話を認証
ステップ2: APIキーを取得
Dashboard → API Management → Create Key
→ APIキーをコピー
ステップ3: 9Routerに追加
9router
# Dashboard → Providers → Add API Key
Provider: minimax
API Key: your-minimax-api-key
ステップ4: CLIで使用
Model: minimax/MiniMax-M2.1
利用可能なモデル
| モデルID | 説明 | コンテキスト | 最適用途 |
|---|---|---|---|
minimax/MiniMax-M2.1 |
MiniMax M2.1 | 1Mトークン | 長いコンテキスト、コーディング |
プロのヒント
- 最安オプション - 入力100万あたり$0.20 (ChatGPTより90%安い)
- 5時間ローリング - 5時間ごとにクォータリセット
- 1Mコンテキスト - 巨大なコンテキストウィンドウ
- 長いファイルに最適 - コードベース全体を処理
クォータリセット
5時間ローリングウィンドウ:
→ クォータ使用 → 5時間待つ → 新鮮なクォータ
例:
午前10時 - 500万トークン使用
午後3時 - 新鮮なクォータ利用可
午後8時 - 新鮮なクォータ利用可
最小コストで24時間コーディング!
Kimi K2 (月$9固定)
料金
| プラン | 月額コスト | 含まれるトークン | 実効コスト |
|---|---|---|---|
| Subscription | $9 | 1000万トークン | 100万あたり$0.90 |
コスト例:
- 月$9固定
- 1000万トークン含む
- 実効: 100万あたり$0.90 - 一貫した使用に最適の価値!
セットアップ
ステップ1: 購読
- Moonshot AI を訪問
- アカウント作成
- 月$9プランに購読
ステップ2: APIキーを取得
Dashboard → API Keys → Create New
→ APIキーをコピー
ステップ3: 9Routerに追加
9router
# Dashboard → Providers → Add API Key
Provider: kimi
API Key: your-kimi-api-key
ステップ4: CLIで使用
Model: kimi/kimi-latest
利用可能なモデル
| モデルID | 説明 | コンテキスト | 最適用途 |
|---|---|---|---|
kimi/kimi-latest |
Kimi Latest | 200K | 汎用コーディング |
プロのヒント
- 固定コスト - 使用量に関わらず月$9 (1000万まで)
- 一貫した使用に最適 - 月1000万使用なら100万あたりわずか$0.90
- 月次リセット - 1000万トークンが月次リセット
- 予測可能な請求 - 予期しないコストなし
クォータリセット
月次リセット: 各月1日
→ 1000万トークンが更新
月次使用例:
週1: 300万トークン
週2: 200万トークン
週3: 300万トークン
週4: 200万トークン
合計: 1000万トークン = $9固定
料金比較
| プロバイダー | 入力/1M | 出力/1M | リセット | 1000万コスト | 最適用途 |
|---|---|---|---|---|---|
| GLM-4.7 | $0.60 | $2.20 | 毎日午前10時 | $6〜22 | 日次クォータユーザー |
| MiniMax M2.1 | $0.20 | $1.00 | 5時間 | $2〜10 | 最安! |
| Kimi K2 | $0.90 | $0.90 | 月次 | $9固定 | 一貫した使用 |
| ChatGPT API | $20.00 | $20.00 | なし | $200 | ❌ 高価 |
節約: ChatGPT APIより90〜95%安い!
使用例
Cursor IDEセットアップ
Settings → Models → Advanced:
OpenAI API Base URL: http://localhost:20128/v1
OpenAI API Key: [9routerダッシュボードから取得]
Model: glm/glm-4.7
コンボを作成 (推奨)
Dashboard → Combos → Create New
Name: cheap-backup
Models:
1. cc/claude-opus-4-5 (サブスクリプション優先)
2. glm/glm-4.7 (低価格バックアップ、日次リセット)
3. minimax/MiniMax-M2.1 (最安フォールバック)
4. if/kimi-k2-thinking (無料緊急時)
CLIで使用: cheap-backup
結果: サブスクリプション → 低価格 → 最安 → 無料
コスト最適化
戦略1: 日次リセットルーチン
朝 (午前10時): 新鮮なGLMクォータ
→ 重いタスクにGLMを使用
→ サブスクリプションクォータを節約
午後: サブスクリプションクォータ
→ 複雑なタスクにClaude/Codexを使用
夕方: MiniMax (5時間リセット)
→ 遅い作業の低価格フォールバック
夜: 無料階層 (iFlow)
→ ゼロコスト緊急バックアップ
戦略2: 予算優先
月次予算設定: $20
割り当て:
- $9 Kimi K2 (1000万トークン固定)
- $6 GLM日次クォータ (1000万トークン)
- $5 MiniMaxオーバーフロー (2500万トークン)
合計: $20で4500万トークン
vs ChatGPT APIでは$20で100万トークン!
戦略3: サブスクリプションを最初に最大化
優先順位:
1. Gemini CLI (月18万無料)
2. Claude Code (すでに支払っているサブスクリプション)
3. GLM-4.7 (低価格バックアップ、100万あたり$0.6)
4. MiniMax M2.1 (最安、100万あたり$0.2)
5. iFlow (無料緊急時)
月次コスト例 (1億トークン):
- Gemini CLI経由で6000万: $0 (無料)
- Claude Code経由で3000万: $0 (サブスクリプション)
- GLM経由で800万: $4.80
- MiniMax経由で200万: $0.40
合計: 月$5.20!
実例
例1: 重いコーディング月 (1億トークン)
内訳:
- サブスクリプション (Claude/Codex) 経由で6000万: $0追加
- GLM-4.7経由で3000万: $18
- MiniMax M2.1経由で1000万: $2
合計: 月$20
vs ChatGPT APIの$2000!
節約: 99%安い!
例2: バジェットコーダー ($10/月)
戦略:
- $9 Kimi K2 (1000万トークン)
- $1 MiniMaxオーバーフロー (500万トークン)
合計: $10で1500万トークン
vs ChatGPT APIでは$10で50万トークン!
30倍多くのトークン!
例3: フリーランサー (変動使用量)
軽い月 (2000万トークン):
- サブスクリプション経由で1500万: $0
- GLM経由で500万: $3
合計: $3
重い月 (1.5億トークン):
- サブスクリプション経由で6000万: $0
- GLM経由で6000万: $36
- MiniMax経由で3000万: $6
合計: $42
平均: 月$22.50
vs ChatGPT APIの$3400!
ベストプラクティス
1. 日次クォータを追跡
ダッシュボード表示:
- GLMクォータ: 75%使用 (6時間後リセット)
- MiniMaxクォータ: 50%使用 (2時間後リセット)
- Kimiクォータ: 800万/1000万使用 (15日後リセット)
リセット時間に合わせて重いタスクを計画!
2. Coding Planを使用 (GLM)
Standard: 1×クォータ
Coding Plan: 3×クォータ (同じ価格!)
→ 常にCoding Planを選択
3. 無料階層と組み合わせる
コンボ:
1. gc/gemini-3-flash (無料プライマリ)
2. glm/glm-4.7 (低価格バックアップ)
3. minimax/MiniMax-M2.1 (最安)
4. if/kimi-k2-thinking (無料緊急時)
結果: コストを最小化、アップタイムを最大化
4. 予算アラートを設定
Dashboard → Settings → Budget Alerts
日次: $2上限
週次: $10上限
月次: $30上限
→ 上限到達時に自動的に無料階層へ切替
トラブルシューティング
「クォータ消費」
解決策:
- GLM: 北京時間午前10時まで待つ
- MiniMax: 最初の使用から5時間待つ
- Kimi: 翌月1日まで待つ
- 無料階層へのコンボフォールバックを使用
「APIキー無効」
解決策:
- APIキーが正しくコピーされたか確認
- アカウントにクレジットがあるか確認
- 必要に応じてAPIキーを再生成
「高コスト」
解決策:
- ダッシュボードで使用統計を確認
- 予算アラートを設定
- MiniMax (100万あたり$0.2最安) へ切替
- クリティカルでないタスクに無料階層を使用
次のステップ
- 無料フォールバックを追加: 無料プロバイダー
- サブスクリプションをセットアップ: サブスクリプションプロバイダー
- コンボを作成: Dashboard → Combos → Create New