16 KiB
16 KiB
クォータトラッキングと使用量モニタリング
リアルタイムのトークン消費を追跡し、クォータ制限を監視し、コストを見積もり、不足前にアラートを取得。サブスクリプションクォータを無駄にしたり、予算上限を超えたりすることはありません。
概要
9Routerはすべてのプロバイダーに対して包括的なクォータトラッキングを提供:
- リアルタイムトークン消費 - リクエストごとの使用トークンを表示
- クォータ上限と残量 - 使用量 vs 上限を追跡
- リセットカウントダウン - クォータが更新されるタイミング
- コスト見積もり - 有料階層の支出を計算
- 月次レポート - 使用パターンを分析
- アラートと通知 - 上限前に警告を取得
ダッシュボード概要
クォータサマリー
Dashboard → Home → Quota Overview
┌─────────────────────────────────────────────┐
│ Claude Code (cc/) │
│ ████████████░░░░░░░░ 2.5h / 5h (50%) │
│ Resets in: 2h 30m │
│ Cost: $0 (subscription) │
└─────────────────────────────────────────────┘
┌─────────────────────────────────────────────┐
│ Gemini CLI (gc/) │
│ ████████░░░░░░░░░░░░ 450 / 1000 (45%) │
│ Daily reset in: 18h 30m │
│ Monthly: 45K / 180K (25%) │
│ Cost: $0 (free tier) │
└─────────────────────────────────────────────┘
┌─────────────────────────────────────────────┐
│ GLM-4.7 (glm/) │
│ ██████████████░░░░░░ 7M / 10M tokens (70%) │
│ Resets: Daily 10:00 AM (in 5h 35m) │
│ Cost today: $4.20 │
└─────────────────────────────────────────────┘
┌─────────────────────────────────────────────┐
│ MiniMax M2.1 (minimax/) │
│ ████████████████░░░░ 4M / 5M tokens (80%) │
│ Rolling 5h window │
│ Cost (5h): $0.80 │
└─────────────────────────────────────────────┘
┌─────────────────────────────────────────────┐
│ iFlow (if/) │
│ ████████████████████ Unlimited │
│ Cost: $0 (free forever) │
└─────────────────────────────────────────────┘
リアルタイムトークン消費
リクエストごとのトラッキング
各リクエストに詳細なトークン使用量が表示されます:
Dashboard → Activity → Recent Requests
Request #1234
Model: cc/claude-opus-4-5-20251101
Timestamp: 2026-02-04 04:15:32
Tokens:
Input: 1,250 tokens
Output: 850 tokens
Total: 2,100 tokens
Cost: $0 (subscription quota)
Duration: 3.2s
Status: ✅ Success
ライブ使用量モニター
Dashboard → Live Monitor
Current request:
Model: glm/glm-4.7
Tokens streamed: 450 / ~800 estimated
Cost so far: $0.0009
Duration: 1.8s
モデル別のトークン内訳
Dashboard → Analytics → Token Usage
Today (Feb 4, 2026):
cc/claude-opus-4-5: 15M tokens ($0, subscription)
glm/glm-4.7: 8M tokens ($4.80)
if/kimi-k2-thinking: 3M tokens ($0, free)
Total: 26M tokens
Cost: $4.80
クォータ上限とリセット時間
サブスクリプションプロバイダー
Claude Code (Pro/Max)
クォータタイプ: 時間ベース (5時間ローリング)
上限: 5時間の使用
リセット: 5時間ローリングウィンドウ + 週次更新
追跡: モデルごとの使用時間
ダッシュボード表示:
Opus: 2.5h / 5h 使用
Sonnet: 1.2h / 5h 使用
Haiku: 0.8h / 5h 使用
週次リセット: 毎週月曜00:00 UTC
OpenAI Codex (Plus/Pro)
クォータタイプ: 時間ベース (5時間ローリング)
上限: 5時間 (Plus) / 10時間 (Pro)
リセット: 5時間ローリングウィンドウ + 週次更新
ダッシュボード表示:
GPT-5.2 Codex: 3.5h / 5h 使用
Resets in: 1h 30m
Gemini CLI (無料)
クォータタイプ: リクエスト数 + 月次トークン
日次上限: 1,000 リクエスト
月次上限: 180,000 コンプリーション
リセット: 日次 00:00 UTC + 月次 1日
ダッシュボード表示:
Today: 450 / 1,000 requests (45%)
This month: 45K / 180K completions (25%)
Daily reset in: 18h 30m
Monthly reset in: 26 days
GitHub Copilot
クォータタイプ: 月次使用量
上限: プランによる
リセット: 各月1日
ダッシュボード表示:
Usage: 60% of monthly quota
Resets: March 1, 2026 (in 25 days)
低価格プロバイダー
GLM-4.7
クォータタイプ: 日次トークン上限
上限: 10Mトークン/日 (Coding Plan)
リセット: 毎日午前10時 北京時間 (UTC+8)
ダッシュボード表示:
Used: 7M / 10M tokens (70%)
Remaining: 3M tokens
Resets in: 5h 35m
Cost today: $4.20
MiniMax M2.1
クォータタイプ: 5時間ローリングウィンドウ
上限: 5時間あたり5Mトークン
リセット: 連続ローリングウィンドウ
ダッシュボード表示:
Used (5h): 4M / 5M tokens (80%)
Oldest usage expires in: 45m
Cost (5h): $0.80
Kimi K2
クォータタイプ: 月次サブスクリプション
上限: 10Mトークン/月 ($9固定)
リセット: サブスクリプション日に月次
ダッシュボード表示:
Used: 6M / 10M tokens (60%)
Resets: Feb 15, 2026 (in 11 days)
Cost: $9/month (prepaid)
無料プロバイダー
iFlow / Qwen / Kiro
クォータタイプ: 無制限 (レート制限)
上限: ハード制限なし
リセット: なし
ダッシュボード表示:
Used today: 5M tokens
Cost: $0 (free forever)
Status: ✅ Available
コスト見積もり
リアルタイムコストトラッキング
Dashboard → Costs → Today
Subscription providers: $0
Claude Code: 15M tokens ($0, included)
Gemini CLI: 3M tokens ($0, free tier)
Paid providers: $4.80
GLM-4.7: 8M tokens ($4.80)
Input: 6M × $0.60/1M = $3.60
Output: 2M × $2.20/1M = $4.40
Total: $4.80
Free providers: $0
iFlow: 3M tokens ($0)
Total today: $4.80
月次支出レポート
Dashboard → Costs → This Month (February 2026)
Week 1 (Feb 1-7):
Subscription: $0 (80M tokens)
Paid: $15.20 (25M tokens)
Free: $0 (10M tokens)
Total: $15.20
Week 2 (Feb 8-14):
Subscription: $0 (75M tokens)
Paid: $12.80 (20M tokens)
Free: $0 (8M tokens)
Total: $12.80
Month to date: $28.00
Projected (30 days): ~$120
Breakdown by provider:
GLM-4.7: $22.00 (78%)
MiniMax M2.1: $6.00 (22%)
Average cost per 1M tokens: $0.62
Savings vs ChatGPT API: 97% ($4,000 → $120)
コスト予測
Dashboard → Costs → Projections
Based on last 7 days usage:
Daily average: 50M tokens
Daily cost: $4.50
Monthly projection:
Tokens: 1,500M (1.5B)
Cost: $135
Breakdown:
Subscription: 900M tokens ($0)
GLM-4.7: 450M tokens ($90)
MiniMax: 120M tokens ($24)
Free: 30M tokens ($0)
Budget status:
Daily limit: $5 → 90% used today
Monthly limit: $150 → 90% projected
⚠️ Warning: May exceed monthly budget
使用量ダッシュボード
概要統計
Dashboard → Analytics → Overview
Today (Feb 4, 2026):
Requests: 1,234
Tokens: 26M
Cost: $4.80
Avg response time: 2.1s
This week:
Requests: 8,456
Tokens: 180M
Cost: $28.00
Success rate: 99.2%
This month:
Requests: 15,234
Tokens: 320M
Cost: $52.00
Top model: cc/claude-opus-4-5 (45%)
モデル別使用量
Dashboard → Analytics → Models
Top models (this month):
1. cc/claude-opus-4-5: 145M tokens (45%)
2. glm/glm-4.7: 95M tokens (30%)
3. if/kimi-k2-thinking: 50M tokens (16%)
4. minimax/MiniMax-M2.1: 20M tokens (6%)
5. gc/gemini-3-flash: 10M tokens (3%)
Cost breakdown:
cc/claude-opus: $0 (subscription)
glm/glm-4.7: $45.00
if/kimi-k2-thinking: $0 (free)
minimax/MiniMax-M2.1: $7.00
gc/gemini-3-flash: $0 (free)
時間別使用量
Dashboard → Analytics → Timeline
Hourly usage (today):
00:00 - 01:00: 0.5M tokens
01:00 - 02:00: 0.2M tokens
...
08:00 - 09:00: 3.2M tokens (peak)
09:00 - 10:00: 2.8M tokens
...
23:00 - 00:00: 0.8M tokens
Peak hours: 08:00 - 12:00 (morning coding)
Low hours: 00:00 - 06:00 (night)
コンボ別使用量
Dashboard → Analytics → Combos
premium-coding:
Requests: 456
Tokens: 12M
Cost: $2.40
Breakdown:
cc/claude-opus: 8M tokens (67%, $0)
glm/glm-4.7: 3M tokens (25%, $1.80)
minimax/MiniMax-M2.1: 1M tokens (8%, $0.20)
budget-combo:
Requests: 234
Tokens: 6M
Cost: $1.20
Breakdown:
glm/glm-4.7: 4M tokens (67%, $2.40)
if/kimi-k2-thinking: 2M tokens (33%, $0)
アラートと通知
クォータアラート
Dashboard → Settings → Alerts
Quota warnings:
✅ Alert at 80% quota used
✅ Alert at 90% quota used
✅ Alert when quota exhausted
✅ Notify when quota resets
Delivery:
✅ Dashboard notification
✅ Email (optional)
✅ Webhook (optional)
通知例:
⚠️ Claude Code quota 80% used
2.5h remaining (resets in 1h 30m)
⚠️ GLM-4.7 quota 90% used
1M tokens remaining (resets in 5h)
✅ Gemini CLI quota reset
1,000 requests available (daily limit)
予算アラート
Dashboard → Settings → Budget Alerts
Daily budget: $5
✅ Alert at 80% ($4)
✅ Alert at 100% ($5)
✅ Auto-switch to free tier when exceeded
Monthly budget: $150
✅ Alert at 50% ($75)
✅ Alert at 80% ($120)
✅ Alert at 100% ($150)
通知例:
⚠️ Daily budget 80% used
$4.00 / $5.00 spent today
⚠️ Monthly budget 50% reached
$75 / $150 spent this month
Projected: $135 (within budget)
🚨 Daily budget exceeded
$5.20 / $5.00 spent today
Auto-switched to free tier
コスト異常検知
Dashboard → Settings → Anomaly Detection
✅ Detect unusual spending patterns
✅ Alert on cost spikes (>2× daily average)
✅ Warn on quota exhaustion patterns
Example alert:
⚠️ Cost spike detected
Today: $12.50 (2.5× daily average)
Reason: High GLM-4.7 usage (20M tokens)
Suggestion: Check if primary models quota-exhausted
ベストプラクティス
1. クォータを毎日モニター
日課:
1. ダッシュボードクォータ概要を確認 (30秒)
2. リセット時間を確認
3. クォータ可用性に合わせて使用量を計画
例:
朝の確認:
✅ Claude Code: 5時間利用可 (新鮮なリセット)
✅ Gemini CLI: 1Kリクエスト利用可
⚠️ GLM-4.7: 2Mトークン残 (午前10時リセット)
アクション: 朝の作業にClaude Codeを使用
2. 予算上限を設定
Dashboard → Settings → Budget:
Daily: $5 (使いすぎ防止)
Monthly: $150 (予算に整合)
結果: 上限到達時に自動的に無料階層へ切替。
3. コンボ使用を最適化
Dashboard → Analytics → Combos:
どのモデルが最もよく使われているか確認
コストを最小化するためにコンボ順序を調整
例:
現在: cc/claude-opus → glm/glm-4.7
80% Claude経由 (良好)
20% GLM経由 ($12/月)
最適化後: gc/gemini-3-flash → cc/claude-opus → glm/glm-4.7
50% Gemini経由 (無料)
40% Claude経由 (サブスクリプション)
10% GLM経由 ($6/月)
節約: $6/月
4. リセット時間を追跡
Dashboard → Quota → Reset Schedule:
Claude Code: 5時間ローリング + 週次月曜
Gemini CLI: 日次 00:00 UTC + 月次 1日
GLM-4.7: 毎日午前10時 北京時間
MiniMax: 5時間ローリングウィンドウ
戦略: クォータが新鮮な時にプロバイダーを使用。
5. 月次レポートを確認
Dashboard → Analytics → Monthly Report:
Total tokens: 1.5B
Total cost: $120
Savings: 97% vs ChatGPT API
インサイト:
- 60% サブスクリプション経由の使用 ($0)
- 30% GLM経由 ($90)
- 10% 無料階層経由 ($0)
最適化:
- Gemini CLI使用を増やす (無料)
- GLM使用を減らす (高価)
APIアクセス
クォータステータスを取得
GET http://localhost:20128/api/quota
Authorization: Bearer your-api-key
Response:
{
"providers": [
{
"id": "cc",
"name": "Claude Code",
"quota": {
"used": 2.5,
"limit": 5,
"unit": "hours",
"percentage": 50
},
"reset": {
"type": "rolling",
"window": "5h",
"nextReset": "2026-02-04T06:45:00Z"
},
"cost": {
"today": 0,
"month": 0,
"currency": "USD"
}
},
{
"id": "glm",
"name": "GLM-4.7",
"quota": {
"used": 7000000,
"limit": 10000000,
"unit": "tokens",
"percentage": 70
},
"reset": {
"type": "daily",
"time": "10:00 AM UTC+8",
"nextReset": "2026-02-04T10:00:00+08:00"
},
"cost": {
"today": 4.20,
"month": 52.00,
"currency": "USD"
}
}
]
}
使用統計を取得
GET http://localhost:20128/api/usage?period=today
Authorization: Bearer your-api-key
Response:
{
"period": "today",
"date": "2026-02-04",
"summary": {
"requests": 1234,
"tokens": 26000000,
"cost": 4.80
},
"byModel": [
{
"model": "cc/claude-opus-4-5",
"requests": 456,
"tokens": 15000000,
"cost": 0
},
{
"model": "glm/glm-4.7",
"requests": 234,
"tokens": 8000000,
"cost": 4.80
}
]
}
トラブルシューティング
問題: クォータが0%を表示するがリクエストが失敗
解決策:
- プロバイダー接続を確認 (Dashboard → Providers)
- APIキーが有効か確認
- プロバイダーがダウンしているか確認 (ステータスページ)
- OAuthプロバイダーを再接続してみる
問題: コスト見積もりが正しくない
解決策:
- Dashboard → Settings → Pricing
- プロバイダーごとの料金が現在のレートと一致するか確認
- プロバイダーがレートを変更した場合は料金を更新
- 不一致が続く場合はサポートに連絡
問題: リセット時間が更新されない
解決策:
- ダッシュボードを更新 (F5)
- システム時刻が正しいか確認
- タイムゾーン設定を確認
- 問題が続く場合は9Routerを再起動
問題: アラートが受信されない
解決策:
- Dashboard → Settings → Alerts
- メールアドレスが正しいか確認
- スパムフォルダを確認
- 通知をテスト (Send Testボタン)
関連
- スマートルーティング - クォータに基づく自動フォールバック
- コンボ - カスタムフォールバックチェーンを作成