687 lines
16 KiB
Markdown
687 lines
16 KiB
Markdown
# クォータトラッキングと使用量モニタリング
|
||
|
||
リアルタイムのトークン消費を追跡し、クォータ制限を監視し、コストを見積もり、不足前にアラートを取得。サブスクリプションクォータを無駄にしたり、予算上限を超えたりすることはありません。
|
||
|
||
---
|
||
|
||
## 概要
|
||
|
||
9Routerはすべてのプロバイダーに対して包括的なクォータトラッキングを提供:
|
||
|
||
- **リアルタイムトークン消費** - リクエストごとの使用トークンを表示
|
||
- **クォータ上限と残量** - 使用量 vs 上限を追跡
|
||
- **リセットカウントダウン** - クォータが更新されるタイミング
|
||
- **コスト見積もり** - 有料階層の支出を計算
|
||
- **月次レポート** - 使用パターンを分析
|
||
- **アラートと通知** - 上限前に警告を取得
|
||
|
||
---
|
||
|
||
## ダッシュボード概要
|
||
|
||
### クォータサマリー
|
||
|
||
```
|
||
Dashboard → Home → Quota Overview
|
||
|
||
┌─────────────────────────────────────────────┐
|
||
│ Claude Code (cc/) │
|
||
│ ████████████░░░░░░░░ 2.5h / 5h (50%) │
|
||
│ Resets in: 2h 30m │
|
||
│ Cost: $0 (subscription) │
|
||
└─────────────────────────────────────────────┘
|
||
|
||
┌─────────────────────────────────────────────┐
|
||
│ Gemini CLI (gc/) │
|
||
│ ████████░░░░░░░░░░░░ 450 / 1000 (45%) │
|
||
│ Daily reset in: 18h 30m │
|
||
│ Monthly: 45K / 180K (25%) │
|
||
│ Cost: $0 (free tier) │
|
||
└─────────────────────────────────────────────┘
|
||
|
||
┌─────────────────────────────────────────────┐
|
||
│ GLM-4.7 (glm/) │
|
||
│ ██████████████░░░░░░ 7M / 10M tokens (70%) │
|
||
│ Resets: Daily 10:00 AM (in 5h 35m) │
|
||
│ Cost today: $4.20 │
|
||
└─────────────────────────────────────────────┘
|
||
|
||
┌─────────────────────────────────────────────┐
|
||
│ MiniMax M2.1 (minimax/) │
|
||
│ ████████████████░░░░ 4M / 5M tokens (80%) │
|
||
│ Rolling 5h window │
|
||
│ Cost (5h): $0.80 │
|
||
└─────────────────────────────────────────────┘
|
||
|
||
┌─────────────────────────────────────────────┐
|
||
│ iFlow (if/) │
|
||
│ ████████████████████ Unlimited │
|
||
│ Cost: $0 (free forever) │
|
||
└─────────────────────────────────────────────┘
|
||
```
|
||
|
||
---
|
||
|
||
## リアルタイムトークン消費
|
||
|
||
### リクエストごとのトラッキング
|
||
|
||
各リクエストに詳細なトークン使用量が表示されます:
|
||
|
||
```
|
||
Dashboard → Activity → Recent Requests
|
||
|
||
Request #1234
|
||
Model: cc/claude-opus-4-5-20251101
|
||
Timestamp: 2026-02-04 04:15:32
|
||
|
||
Tokens:
|
||
Input: 1,250 tokens
|
||
Output: 850 tokens
|
||
Total: 2,100 tokens
|
||
|
||
Cost: $0 (subscription quota)
|
||
Duration: 3.2s
|
||
Status: ✅ Success
|
||
```
|
||
|
||
### ライブ使用量モニター
|
||
|
||
```
|
||
Dashboard → Live Monitor
|
||
|
||
Current request:
|
||
Model: glm/glm-4.7
|
||
Tokens streamed: 450 / ~800 estimated
|
||
Cost so far: $0.0009
|
||
Duration: 1.8s
|
||
```
|
||
|
||
### モデル別のトークン内訳
|
||
|
||
```
|
||
Dashboard → Analytics → Token Usage
|
||
|
||
Today (Feb 4, 2026):
|
||
cc/claude-opus-4-5: 15M tokens ($0, subscription)
|
||
glm/glm-4.7: 8M tokens ($4.80)
|
||
if/kimi-k2-thinking: 3M tokens ($0, free)
|
||
|
||
Total: 26M tokens
|
||
Cost: $4.80
|
||
```
|
||
|
||
---
|
||
|
||
## クォータ上限とリセット時間
|
||
|
||
### サブスクリプションプロバイダー
|
||
|
||
**Claude Code (Pro/Max)**
|
||
```
|
||
クォータタイプ: 時間ベース (5時間ローリング)
|
||
上限: 5時間の使用
|
||
リセット: 5時間ローリングウィンドウ + 週次更新
|
||
追跡: モデルごとの使用時間
|
||
|
||
ダッシュボード表示:
|
||
Opus: 2.5h / 5h 使用
|
||
Sonnet: 1.2h / 5h 使用
|
||
Haiku: 0.8h / 5h 使用
|
||
|
||
週次リセット: 毎週月曜00:00 UTC
|
||
```
|
||
|
||
**OpenAI Codex (Plus/Pro)**
|
||
```
|
||
クォータタイプ: 時間ベース (5時間ローリング)
|
||
上限: 5時間 (Plus) / 10時間 (Pro)
|
||
リセット: 5時間ローリングウィンドウ + 週次更新
|
||
|
||
ダッシュボード表示:
|
||
GPT-5.2 Codex: 3.5h / 5h 使用
|
||
Resets in: 1h 30m
|
||
```
|
||
|
||
**Gemini CLI (無料)**
|
||
```
|
||
クォータタイプ: リクエスト数 + 月次トークン
|
||
日次上限: 1,000 リクエスト
|
||
月次上限: 180,000 コンプリーション
|
||
リセット: 日次 00:00 UTC + 月次 1日
|
||
|
||
ダッシュボード表示:
|
||
Today: 450 / 1,000 requests (45%)
|
||
This month: 45K / 180K completions (25%)
|
||
Daily reset in: 18h 30m
|
||
Monthly reset in: 26 days
|
||
```
|
||
|
||
**GitHub Copilot**
|
||
```
|
||
クォータタイプ: 月次使用量
|
||
上限: プランによる
|
||
リセット: 各月1日
|
||
|
||
ダッシュボード表示:
|
||
Usage: 60% of monthly quota
|
||
Resets: March 1, 2026 (in 25 days)
|
||
```
|
||
|
||
### 低価格プロバイダー
|
||
|
||
**GLM-4.7**
|
||
```
|
||
クォータタイプ: 日次トークン上限
|
||
上限: 10Mトークン/日 (Coding Plan)
|
||
リセット: 毎日午前10時 北京時間 (UTC+8)
|
||
|
||
ダッシュボード表示:
|
||
Used: 7M / 10M tokens (70%)
|
||
Remaining: 3M tokens
|
||
Resets in: 5h 35m
|
||
Cost today: $4.20
|
||
```
|
||
|
||
**MiniMax M2.1**
|
||
```
|
||
クォータタイプ: 5時間ローリングウィンドウ
|
||
上限: 5時間あたり5Mトークン
|
||
リセット: 連続ローリングウィンドウ
|
||
|
||
ダッシュボード表示:
|
||
Used (5h): 4M / 5M tokens (80%)
|
||
Oldest usage expires in: 45m
|
||
Cost (5h): $0.80
|
||
```
|
||
|
||
**Kimi K2**
|
||
```
|
||
クォータタイプ: 月次サブスクリプション
|
||
上限: 10Mトークン/月 ($9固定)
|
||
リセット: サブスクリプション日に月次
|
||
|
||
ダッシュボード表示:
|
||
Used: 6M / 10M tokens (60%)
|
||
Resets: Feb 15, 2026 (in 11 days)
|
||
Cost: $9/month (prepaid)
|
||
```
|
||
|
||
### 無料プロバイダー
|
||
|
||
**iFlow / Qwen / Kiro**
|
||
```
|
||
クォータタイプ: 無制限 (レート制限)
|
||
上限: ハード制限なし
|
||
リセット: なし
|
||
|
||
ダッシュボード表示:
|
||
Used today: 5M tokens
|
||
Cost: $0 (free forever)
|
||
Status: ✅ Available
|
||
```
|
||
|
||
---
|
||
|
||
## コスト見積もり
|
||
|
||
### リアルタイムコストトラッキング
|
||
|
||
```
|
||
Dashboard → Costs → Today
|
||
|
||
Subscription providers: $0
|
||
Claude Code: 15M tokens ($0, included)
|
||
Gemini CLI: 3M tokens ($0, free tier)
|
||
|
||
Paid providers: $4.80
|
||
GLM-4.7: 8M tokens ($4.80)
|
||
Input: 6M × $0.60/1M = $3.60
|
||
Output: 2M × $2.20/1M = $4.40
|
||
Total: $4.80
|
||
|
||
Free providers: $0
|
||
iFlow: 3M tokens ($0)
|
||
|
||
Total today: $4.80
|
||
```
|
||
|
||
### 月次支出レポート
|
||
|
||
```
|
||
Dashboard → Costs → This Month (February 2026)
|
||
|
||
Week 1 (Feb 1-7):
|
||
Subscription: $0 (80M tokens)
|
||
Paid: $15.20 (25M tokens)
|
||
Free: $0 (10M tokens)
|
||
Total: $15.20
|
||
|
||
Week 2 (Feb 8-14):
|
||
Subscription: $0 (75M tokens)
|
||
Paid: $12.80 (20M tokens)
|
||
Free: $0 (8M tokens)
|
||
Total: $12.80
|
||
|
||
Month to date: $28.00
|
||
Projected (30 days): ~$120
|
||
|
||
Breakdown by provider:
|
||
GLM-4.7: $22.00 (78%)
|
||
MiniMax M2.1: $6.00 (22%)
|
||
|
||
Average cost per 1M tokens: $0.62
|
||
Savings vs ChatGPT API: 97% ($4,000 → $120)
|
||
```
|
||
|
||
### コスト予測
|
||
|
||
```
|
||
Dashboard → Costs → Projections
|
||
|
||
Based on last 7 days usage:
|
||
Daily average: 50M tokens
|
||
Daily cost: $4.50
|
||
|
||
Monthly projection:
|
||
Tokens: 1,500M (1.5B)
|
||
Cost: $135
|
||
|
||
Breakdown:
|
||
Subscription: 900M tokens ($0)
|
||
GLM-4.7: 450M tokens ($90)
|
||
MiniMax: 120M tokens ($24)
|
||
Free: 30M tokens ($0)
|
||
|
||
Budget status:
|
||
Daily limit: $5 → 90% used today
|
||
Monthly limit: $150 → 90% projected
|
||
⚠️ Warning: May exceed monthly budget
|
||
```
|
||
|
||
---
|
||
|
||
## 使用量ダッシュボード
|
||
|
||
### 概要統計
|
||
|
||
```
|
||
Dashboard → Analytics → Overview
|
||
|
||
Today (Feb 4, 2026):
|
||
Requests: 1,234
|
||
Tokens: 26M
|
||
Cost: $4.80
|
||
Avg response time: 2.1s
|
||
|
||
This week:
|
||
Requests: 8,456
|
||
Tokens: 180M
|
||
Cost: $28.00
|
||
Success rate: 99.2%
|
||
|
||
This month:
|
||
Requests: 15,234
|
||
Tokens: 320M
|
||
Cost: $52.00
|
||
Top model: cc/claude-opus-4-5 (45%)
|
||
```
|
||
|
||
### モデル別使用量
|
||
|
||
```
|
||
Dashboard → Analytics → Models
|
||
|
||
Top models (this month):
|
||
1. cc/claude-opus-4-5: 145M tokens (45%)
|
||
2. glm/glm-4.7: 95M tokens (30%)
|
||
3. if/kimi-k2-thinking: 50M tokens (16%)
|
||
4. minimax/MiniMax-M2.1: 20M tokens (6%)
|
||
5. gc/gemini-3-flash: 10M tokens (3%)
|
||
|
||
Cost breakdown:
|
||
cc/claude-opus: $0 (subscription)
|
||
glm/glm-4.7: $45.00
|
||
if/kimi-k2-thinking: $0 (free)
|
||
minimax/MiniMax-M2.1: $7.00
|
||
gc/gemini-3-flash: $0 (free)
|
||
```
|
||
|
||
### 時間別使用量
|
||
|
||
```
|
||
Dashboard → Analytics → Timeline
|
||
|
||
Hourly usage (today):
|
||
00:00 - 01:00: 0.5M tokens
|
||
01:00 - 02:00: 0.2M tokens
|
||
...
|
||
08:00 - 09:00: 3.2M tokens (peak)
|
||
09:00 - 10:00: 2.8M tokens
|
||
...
|
||
23:00 - 00:00: 0.8M tokens
|
||
|
||
Peak hours: 08:00 - 12:00 (morning coding)
|
||
Low hours: 00:00 - 06:00 (night)
|
||
```
|
||
|
||
### コンボ別使用量
|
||
|
||
```
|
||
Dashboard → Analytics → Combos
|
||
|
||
premium-coding:
|
||
Requests: 456
|
||
Tokens: 12M
|
||
Cost: $2.40
|
||
|
||
Breakdown:
|
||
cc/claude-opus: 8M tokens (67%, $0)
|
||
glm/glm-4.7: 3M tokens (25%, $1.80)
|
||
minimax/MiniMax-M2.1: 1M tokens (8%, $0.20)
|
||
|
||
budget-combo:
|
||
Requests: 234
|
||
Tokens: 6M
|
||
Cost: $1.20
|
||
|
||
Breakdown:
|
||
glm/glm-4.7: 4M tokens (67%, $2.40)
|
||
if/kimi-k2-thinking: 2M tokens (33%, $0)
|
||
```
|
||
|
||
---
|
||
|
||
## アラートと通知
|
||
|
||
### クォータアラート
|
||
|
||
```
|
||
Dashboard → Settings → Alerts
|
||
|
||
Quota warnings:
|
||
✅ Alert at 80% quota used
|
||
✅ Alert at 90% quota used
|
||
✅ Alert when quota exhausted
|
||
✅ Notify when quota resets
|
||
|
||
Delivery:
|
||
✅ Dashboard notification
|
||
✅ Email (optional)
|
||
✅ Webhook (optional)
|
||
```
|
||
|
||
**通知例:**
|
||
```
|
||
⚠️ Claude Code quota 80% used
|
||
2.5h remaining (resets in 1h 30m)
|
||
|
||
⚠️ GLM-4.7 quota 90% used
|
||
1M tokens remaining (resets in 5h)
|
||
|
||
✅ Gemini CLI quota reset
|
||
1,000 requests available (daily limit)
|
||
```
|
||
|
||
### 予算アラート
|
||
|
||
```
|
||
Dashboard → Settings → Budget Alerts
|
||
|
||
Daily budget: $5
|
||
✅ Alert at 80% ($4)
|
||
✅ Alert at 100% ($5)
|
||
✅ Auto-switch to free tier when exceeded
|
||
|
||
Monthly budget: $150
|
||
✅ Alert at 50% ($75)
|
||
✅ Alert at 80% ($120)
|
||
✅ Alert at 100% ($150)
|
||
```
|
||
|
||
**通知例:**
|
||
```
|
||
⚠️ Daily budget 80% used
|
||
$4.00 / $5.00 spent today
|
||
|
||
⚠️ Monthly budget 50% reached
|
||
$75 / $150 spent this month
|
||
Projected: $135 (within budget)
|
||
|
||
🚨 Daily budget exceeded
|
||
$5.20 / $5.00 spent today
|
||
Auto-switched to free tier
|
||
```
|
||
|
||
### コスト異常検知
|
||
|
||
```
|
||
Dashboard → Settings → Anomaly Detection
|
||
|
||
✅ Detect unusual spending patterns
|
||
✅ Alert on cost spikes (>2× daily average)
|
||
✅ Warn on quota exhaustion patterns
|
||
|
||
Example alert:
|
||
⚠️ Cost spike detected
|
||
Today: $12.50 (2.5× daily average)
|
||
Reason: High GLM-4.7 usage (20M tokens)
|
||
Suggestion: Check if primary models quota-exhausted
|
||
```
|
||
|
||
---
|
||
|
||
## ベストプラクティス
|
||
|
||
### 1. クォータを毎日モニター
|
||
|
||
```
|
||
日課:
|
||
1. ダッシュボードクォータ概要を確認 (30秒)
|
||
2. リセット時間を確認
|
||
3. クォータ可用性に合わせて使用量を計画
|
||
```
|
||
|
||
**例:**
|
||
```
|
||
朝の確認:
|
||
✅ Claude Code: 5時間利用可 (新鮮なリセット)
|
||
✅ Gemini CLI: 1Kリクエスト利用可
|
||
⚠️ GLM-4.7: 2Mトークン残 (午前10時リセット)
|
||
|
||
アクション: 朝の作業にClaude Codeを使用
|
||
```
|
||
|
||
### 2. 予算上限を設定
|
||
|
||
```
|
||
Dashboard → Settings → Budget:
|
||
Daily: $5 (使いすぎ防止)
|
||
Monthly: $150 (予算に整合)
|
||
```
|
||
|
||
**結果**: 上限到達時に自動的に無料階層へ切替。
|
||
|
||
### 3. コンボ使用を最適化
|
||
|
||
```
|
||
Dashboard → Analytics → Combos:
|
||
どのモデルが最もよく使われているか確認
|
||
コストを最小化するためにコンボ順序を調整
|
||
```
|
||
|
||
**例:**
|
||
```
|
||
現在: cc/claude-opus → glm/glm-4.7
|
||
80% Claude経由 (良好)
|
||
20% GLM経由 ($12/月)
|
||
|
||
最適化後: gc/gemini-3-flash → cc/claude-opus → glm/glm-4.7
|
||
50% Gemini経由 (無料)
|
||
40% Claude経由 (サブスクリプション)
|
||
10% GLM経由 ($6/月)
|
||
|
||
節約: $6/月
|
||
```
|
||
|
||
### 4. リセット時間を追跡
|
||
|
||
```
|
||
Dashboard → Quota → Reset Schedule:
|
||
Claude Code: 5時間ローリング + 週次月曜
|
||
Gemini CLI: 日次 00:00 UTC + 月次 1日
|
||
GLM-4.7: 毎日午前10時 北京時間
|
||
MiniMax: 5時間ローリングウィンドウ
|
||
```
|
||
|
||
**戦略**: クォータが新鮮な時にプロバイダーを使用。
|
||
|
||
### 5. 月次レポートを確認
|
||
|
||
```
|
||
Dashboard → Analytics → Monthly Report:
|
||
Total tokens: 1.5B
|
||
Total cost: $120
|
||
Savings: 97% vs ChatGPT API
|
||
|
||
インサイト:
|
||
- 60% サブスクリプション経由の使用 ($0)
|
||
- 30% GLM経由 ($90)
|
||
- 10% 無料階層経由 ($0)
|
||
|
||
最適化:
|
||
- Gemini CLI使用を増やす (無料)
|
||
- GLM使用を減らす (高価)
|
||
```
|
||
|
||
---
|
||
|
||
## APIアクセス
|
||
|
||
### クォータステータスを取得
|
||
|
||
```bash
|
||
GET http://localhost:20128/api/quota
|
||
Authorization: Bearer your-api-key
|
||
|
||
Response:
|
||
{
|
||
"providers": [
|
||
{
|
||
"id": "cc",
|
||
"name": "Claude Code",
|
||
"quota": {
|
||
"used": 2.5,
|
||
"limit": 5,
|
||
"unit": "hours",
|
||
"percentage": 50
|
||
},
|
||
"reset": {
|
||
"type": "rolling",
|
||
"window": "5h",
|
||
"nextReset": "2026-02-04T06:45:00Z"
|
||
},
|
||
"cost": {
|
||
"today": 0,
|
||
"month": 0,
|
||
"currency": "USD"
|
||
}
|
||
},
|
||
{
|
||
"id": "glm",
|
||
"name": "GLM-4.7",
|
||
"quota": {
|
||
"used": 7000000,
|
||
"limit": 10000000,
|
||
"unit": "tokens",
|
||
"percentage": 70
|
||
},
|
||
"reset": {
|
||
"type": "daily",
|
||
"time": "10:00 AM UTC+8",
|
||
"nextReset": "2026-02-04T10:00:00+08:00"
|
||
},
|
||
"cost": {
|
||
"today": 4.20,
|
||
"month": 52.00,
|
||
"currency": "USD"
|
||
}
|
||
}
|
||
]
|
||
}
|
||
```
|
||
|
||
### 使用統計を取得
|
||
|
||
```bash
|
||
GET http://localhost:20128/api/usage?period=today
|
||
Authorization: Bearer your-api-key
|
||
|
||
Response:
|
||
{
|
||
"period": "today",
|
||
"date": "2026-02-04",
|
||
"summary": {
|
||
"requests": 1234,
|
||
"tokens": 26000000,
|
||
"cost": 4.80
|
||
},
|
||
"byModel": [
|
||
{
|
||
"model": "cc/claude-opus-4-5",
|
||
"requests": 456,
|
||
"tokens": 15000000,
|
||
"cost": 0
|
||
},
|
||
{
|
||
"model": "glm/glm-4.7",
|
||
"requests": 234,
|
||
"tokens": 8000000,
|
||
"cost": 4.80
|
||
}
|
||
]
|
||
}
|
||
```
|
||
|
||
---
|
||
|
||
## トラブルシューティング
|
||
|
||
**問題: クォータが0%を表示するがリクエストが失敗**
|
||
|
||
**解決策:**
|
||
1. プロバイダー接続を確認 (Dashboard → Providers)
|
||
2. APIキーが有効か確認
|
||
3. プロバイダーがダウンしているか確認 (ステータスページ)
|
||
4. OAuthプロバイダーを再接続してみる
|
||
|
||
**問題: コスト見積もりが正しくない**
|
||
|
||
**解決策:**
|
||
1. Dashboard → Settings → Pricing
|
||
2. プロバイダーごとの料金が現在のレートと一致するか確認
|
||
3. プロバイダーがレートを変更した場合は料金を更新
|
||
4. 不一致が続く場合はサポートに連絡
|
||
|
||
**問題: リセット時間が更新されない**
|
||
|
||
**解決策:**
|
||
1. ダッシュボードを更新 (F5)
|
||
2. システム時刻が正しいか確認
|
||
3. タイムゾーン設定を確認
|
||
4. 問題が続く場合は9Routerを再起動
|
||
|
||
**問題: アラートが受信されない**
|
||
|
||
**解決策:**
|
||
1. Dashboard → Settings → Alerts
|
||
2. メールアドレスが正しいか確認
|
||
3. スパムフォルダを確認
|
||
4. 通知をテスト (Send Testボタン)
|
||
|
||
---
|
||
|
||
## 関連
|
||
|
||
- [スマートルーティング](./smart-routing.md) - クォータに基づく自動フォールバック
|
||
- [コンボ](./combos.md) - カスタムフォールバックチェーンを作成
|