9router/gitbook/content/ja/features/quota-tracking.md
2026-05-11 11:50:24 +07:00

687 lines
16 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# クォータトラッキングと使用量モニタリング
リアルタイムのトークン消費を追跡し、クォータ制限を監視し、コストを見積もり、不足前にアラートを取得。サブスクリプションクォータを無駄にしたり、予算上限を超えたりすることはありません。
---
## 概要
9Routerはすべてのプロバイダーに対して包括的なクォータトラッキングを提供:
- **リアルタイムトークン消費** - リクエストごとの使用トークンを表示
- **クォータ上限と残量** - 使用量 vs 上限を追跡
- **リセットカウントダウン** - クォータが更新されるタイミング
- **コスト見積もり** - 有料階層の支出を計算
- **月次レポート** - 使用パターンを分析
- **アラートと通知** - 上限前に警告を取得
---
## ダッシュボード概要
### クォータサマリー
```
Dashboard → Home → Quota Overview
┌─────────────────────────────────────────────┐
│ Claude Code (cc/) │
│ ████████████░░░░░░░░ 2.5h / 5h (50%) │
│ Resets in: 2h 30m │
│ Cost: $0 (subscription) │
└─────────────────────────────────────────────┘
┌─────────────────────────────────────────────┐
│ Gemini CLI (gc/) │
│ ████████░░░░░░░░░░░░ 450 / 1000 (45%) │
│ Daily reset in: 18h 30m │
│ Monthly: 45K / 180K (25%) │
│ Cost: $0 (free tier) │
└─────────────────────────────────────────────┘
┌─────────────────────────────────────────────┐
│ GLM-4.7 (glm/) │
│ ██████████████░░░░░░ 7M / 10M tokens (70%) │
│ Resets: Daily 10:00 AM (in 5h 35m) │
│ Cost today: $4.20 │
└─────────────────────────────────────────────┘
┌─────────────────────────────────────────────┐
│ MiniMax M2.1 (minimax/) │
│ ████████████████░░░░ 4M / 5M tokens (80%) │
│ Rolling 5h window │
│ Cost (5h): $0.80 │
└─────────────────────────────────────────────┘
┌─────────────────────────────────────────────┐
│ iFlow (if/) │
│ ████████████████████ Unlimited │
│ Cost: $0 (free forever) │
└─────────────────────────────────────────────┘
```
---
## リアルタイムトークン消費
### リクエストごとのトラッキング
各リクエストに詳細なトークン使用量が表示されます:
```
Dashboard → Activity → Recent Requests
Request #1234
Model: cc/claude-opus-4-5-20251101
Timestamp: 2026-02-04 04:15:32
Tokens:
Input: 1,250 tokens
Output: 850 tokens
Total: 2,100 tokens
Cost: $0 (subscription quota)
Duration: 3.2s
Status: ✅ Success
```
### ライブ使用量モニター
```
Dashboard → Live Monitor
Current request:
Model: glm/glm-4.7
Tokens streamed: 450 / ~800 estimated
Cost so far: $0.0009
Duration: 1.8s
```
### モデル別のトークン内訳
```
Dashboard → Analytics → Token Usage
Today (Feb 4, 2026):
cc/claude-opus-4-5: 15M tokens ($0, subscription)
glm/glm-4.7: 8M tokens ($4.80)
if/kimi-k2-thinking: 3M tokens ($0, free)
Total: 26M tokens
Cost: $4.80
```
---
## クォータ上限とリセット時間
### サブスクリプションプロバイダー
**Claude Code (Pro/Max)**
```
クォータタイプ: 時間ベース (5時間ローリング)
上限: 5時間の使用
リセット: 5時間ローリングウィンドウ + 週次更新
追跡: モデルごとの使用時間
ダッシュボード表示:
Opus: 2.5h / 5h 使用
Sonnet: 1.2h / 5h 使用
Haiku: 0.8h / 5h 使用
週次リセット: 毎週月曜00:00 UTC
```
**OpenAI Codex (Plus/Pro)**
```
クォータタイプ: 時間ベース (5時間ローリング)
上限: 5時間 (Plus) / 10時間 (Pro)
リセット: 5時間ローリングウィンドウ + 週次更新
ダッシュボード表示:
GPT-5.2 Codex: 3.5h / 5h 使用
Resets in: 1h 30m
```
**Gemini CLI (無料)**
```
クォータタイプ: リクエスト数 + 月次トークン
日次上限: 1,000 リクエスト
月次上限: 180,000 コンプリーション
リセット: 日次 00:00 UTC + 月次 1日
ダッシュボード表示:
Today: 450 / 1,000 requests (45%)
This month: 45K / 180K completions (25%)
Daily reset in: 18h 30m
Monthly reset in: 26 days
```
**GitHub Copilot**
```
クォータタイプ: 月次使用量
上限: プランによる
リセット: 各月1日
ダッシュボード表示:
Usage: 60% of monthly quota
Resets: March 1, 2026 (in 25 days)
```
### 低価格プロバイダー
**GLM-4.7**
```
クォータタイプ: 日次トークン上限
上限: 10Mトークン/日 (Coding Plan)
リセット: 毎日午前10時 北京時間 (UTC+8)
ダッシュボード表示:
Used: 7M / 10M tokens (70%)
Remaining: 3M tokens
Resets in: 5h 35m
Cost today: $4.20
```
**MiniMax M2.1**
```
クォータタイプ: 5時間ローリングウィンドウ
上限: 5時間あたり5Mトークン
リセット: 連続ローリングウィンドウ
ダッシュボード表示:
Used (5h): 4M / 5M tokens (80%)
Oldest usage expires in: 45m
Cost (5h): $0.80
```
**Kimi K2**
```
クォータタイプ: 月次サブスクリプション
上限: 10Mトークン/月 ($9固定)
リセット: サブスクリプション日に月次
ダッシュボード表示:
Used: 6M / 10M tokens (60%)
Resets: Feb 15, 2026 (in 11 days)
Cost: $9/month (prepaid)
```
### 無料プロバイダー
**iFlow / Qwen / Kiro**
```
クォータタイプ: 無制限 (レート制限)
上限: ハード制限なし
リセット: なし
ダッシュボード表示:
Used today: 5M tokens
Cost: $0 (free forever)
Status: ✅ Available
```
---
## コスト見積もり
### リアルタイムコストトラッキング
```
Dashboard → Costs → Today
Subscription providers: $0
Claude Code: 15M tokens ($0, included)
Gemini CLI: 3M tokens ($0, free tier)
Paid providers: $4.80
GLM-4.7: 8M tokens ($4.80)
Input: 6M × $0.60/1M = $3.60
Output: 2M × $2.20/1M = $4.40
Total: $4.80
Free providers: $0
iFlow: 3M tokens ($0)
Total today: $4.80
```
### 月次支出レポート
```
Dashboard → Costs → This Month (February 2026)
Week 1 (Feb 1-7):
Subscription: $0 (80M tokens)
Paid: $15.20 (25M tokens)
Free: $0 (10M tokens)
Total: $15.20
Week 2 (Feb 8-14):
Subscription: $0 (75M tokens)
Paid: $12.80 (20M tokens)
Free: $0 (8M tokens)
Total: $12.80
Month to date: $28.00
Projected (30 days): ~$120
Breakdown by provider:
GLM-4.7: $22.00 (78%)
MiniMax M2.1: $6.00 (22%)
Average cost per 1M tokens: $0.62
Savings vs ChatGPT API: 97% ($4,000 → $120)
```
### コスト予測
```
Dashboard → Costs → Projections
Based on last 7 days usage:
Daily average: 50M tokens
Daily cost: $4.50
Monthly projection:
Tokens: 1,500M (1.5B)
Cost: $135
Breakdown:
Subscription: 900M tokens ($0)
GLM-4.7: 450M tokens ($90)
MiniMax: 120M tokens ($24)
Free: 30M tokens ($0)
Budget status:
Daily limit: $5 → 90% used today
Monthly limit: $150 → 90% projected
⚠️ Warning: May exceed monthly budget
```
---
## 使用量ダッシュボード
### 概要統計
```
Dashboard → Analytics → Overview
Today (Feb 4, 2026):
Requests: 1,234
Tokens: 26M
Cost: $4.80
Avg response time: 2.1s
This week:
Requests: 8,456
Tokens: 180M
Cost: $28.00
Success rate: 99.2%
This month:
Requests: 15,234
Tokens: 320M
Cost: $52.00
Top model: cc/claude-opus-4-5 (45%)
```
### モデル別使用量
```
Dashboard → Analytics → Models
Top models (this month):
1. cc/claude-opus-4-5: 145M tokens (45%)
2. glm/glm-4.7: 95M tokens (30%)
3. if/kimi-k2-thinking: 50M tokens (16%)
4. minimax/MiniMax-M2.1: 20M tokens (6%)
5. gc/gemini-3-flash: 10M tokens (3%)
Cost breakdown:
cc/claude-opus: $0 (subscription)
glm/glm-4.7: $45.00
if/kimi-k2-thinking: $0 (free)
minimax/MiniMax-M2.1: $7.00
gc/gemini-3-flash: $0 (free)
```
### 時間別使用量
```
Dashboard → Analytics → Timeline
Hourly usage (today):
00:00 - 01:00: 0.5M tokens
01:00 - 02:00: 0.2M tokens
...
08:00 - 09:00: 3.2M tokens (peak)
09:00 - 10:00: 2.8M tokens
...
23:00 - 00:00: 0.8M tokens
Peak hours: 08:00 - 12:00 (morning coding)
Low hours: 00:00 - 06:00 (night)
```
### コンボ別使用量
```
Dashboard → Analytics → Combos
premium-coding:
Requests: 456
Tokens: 12M
Cost: $2.40
Breakdown:
cc/claude-opus: 8M tokens (67%, $0)
glm/glm-4.7: 3M tokens (25%, $1.80)
minimax/MiniMax-M2.1: 1M tokens (8%, $0.20)
budget-combo:
Requests: 234
Tokens: 6M
Cost: $1.20
Breakdown:
glm/glm-4.7: 4M tokens (67%, $2.40)
if/kimi-k2-thinking: 2M tokens (33%, $0)
```
---
## アラートと通知
### クォータアラート
```
Dashboard → Settings → Alerts
Quota warnings:
✅ Alert at 80% quota used
✅ Alert at 90% quota used
✅ Alert when quota exhausted
✅ Notify when quota resets
Delivery:
✅ Dashboard notification
✅ Email (optional)
✅ Webhook (optional)
```
**通知例:**
```
⚠️ Claude Code quota 80% used
2.5h remaining (resets in 1h 30m)
⚠️ GLM-4.7 quota 90% used
1M tokens remaining (resets in 5h)
✅ Gemini CLI quota reset
1,000 requests available (daily limit)
```
### 予算アラート
```
Dashboard → Settings → Budget Alerts
Daily budget: $5
✅ Alert at 80% ($4)
✅ Alert at 100% ($5)
✅ Auto-switch to free tier when exceeded
Monthly budget: $150
✅ Alert at 50% ($75)
✅ Alert at 80% ($120)
✅ Alert at 100% ($150)
```
**通知例:**
```
⚠️ Daily budget 80% used
$4.00 / $5.00 spent today
⚠️ Monthly budget 50% reached
$75 / $150 spent this month
Projected: $135 (within budget)
🚨 Daily budget exceeded
$5.20 / $5.00 spent today
Auto-switched to free tier
```
### コスト異常検知
```
Dashboard → Settings → Anomaly Detection
✅ Detect unusual spending patterns
✅ Alert on cost spikes (>2× daily average)
✅ Warn on quota exhaustion patterns
Example alert:
⚠️ Cost spike detected
Today: $12.50 (2.5× daily average)
Reason: High GLM-4.7 usage (20M tokens)
Suggestion: Check if primary models quota-exhausted
```
---
## ベストプラクティス
### 1. クォータを毎日モニター
```
日課:
1. ダッシュボードクォータ概要を確認 (30秒)
2. リセット時間を確認
3. クォータ可用性に合わせて使用量を計画
```
**例:**
```
朝の確認:
✅ Claude Code: 5時間利用可 (新鮮なリセット)
✅ Gemini CLI: 1Kリクエスト利用可
⚠️ GLM-4.7: 2Mトークン残 (午前10時リセット)
アクション: 朝の作業にClaude Codeを使用
```
### 2. 予算上限を設定
```
Dashboard → Settings → Budget:
Daily: $5 (使いすぎ防止)
Monthly: $150 (予算に整合)
```
**結果**: 上限到達時に自動的に無料階層へ切替。
### 3. コンボ使用を最適化
```
Dashboard → Analytics → Combos:
どのモデルが最もよく使われているか確認
コストを最小化するためにコンボ順序を調整
```
**例:**
```
現在: cc/claude-opus → glm/glm-4.7
80% Claude経由 (良好)
20% GLM経由 ($12/月)
最適化後: gc/gemini-3-flash → cc/claude-opus → glm/glm-4.7
50% Gemini経由 (無料)
40% Claude経由 (サブスクリプション)
10% GLM経由 ($6/月)
節約: $6/月
```
### 4. リセット時間を追跡
```
Dashboard → Quota → Reset Schedule:
Claude Code: 5時間ローリング + 週次月曜
Gemini CLI: 日次 00:00 UTC + 月次 1日
GLM-4.7: 毎日午前10時 北京時間
MiniMax: 5時間ローリングウィンドウ
```
**戦略**: クォータが新鮮な時にプロバイダーを使用。
### 5. 月次レポートを確認
```
Dashboard → Analytics → Monthly Report:
Total tokens: 1.5B
Total cost: $120
Savings: 97% vs ChatGPT API
インサイト:
- 60% サブスクリプション経由の使用 ($0)
- 30% GLM経由 ($90)
- 10% 無料階層経由 ($0)
最適化:
- Gemini CLI使用を増やす (無料)
- GLM使用を減らす (高価)
```
---
## APIアクセス
### クォータステータスを取得
```bash
GET http://localhost:20128/api/quota
Authorization: Bearer your-api-key
Response:
{
"providers": [
{
"id": "cc",
"name": "Claude Code",
"quota": {
"used": 2.5,
"limit": 5,
"unit": "hours",
"percentage": 50
},
"reset": {
"type": "rolling",
"window": "5h",
"nextReset": "2026-02-04T06:45:00Z"
},
"cost": {
"today": 0,
"month": 0,
"currency": "USD"
}
},
{
"id": "glm",
"name": "GLM-4.7",
"quota": {
"used": 7000000,
"limit": 10000000,
"unit": "tokens",
"percentage": 70
},
"reset": {
"type": "daily",
"time": "10:00 AM UTC+8",
"nextReset": "2026-02-04T10:00:00+08:00"
},
"cost": {
"today": 4.20,
"month": 52.00,
"currency": "USD"
}
}
]
}
```
### 使用統計を取得
```bash
GET http://localhost:20128/api/usage?period=today
Authorization: Bearer your-api-key
Response:
{
"period": "today",
"date": "2026-02-04",
"summary": {
"requests": 1234,
"tokens": 26000000,
"cost": 4.80
},
"byModel": [
{
"model": "cc/claude-opus-4-5",
"requests": 456,
"tokens": 15000000,
"cost": 0
},
{
"model": "glm/glm-4.7",
"requests": 234,
"tokens": 8000000,
"cost": 4.80
}
]
}
```
---
## トラブルシューティング
**問題: クォータが0%を表示するがリクエストが失敗**
**解決策:**
1. プロバイダー接続を確認 (Dashboard → Providers)
2. APIキーが有効か確認
3. プロバイダーがダウンしているか確認 (ステータスページ)
4. OAuthプロバイダーを再接続してみる
**問題: コスト見積もりが正しくない**
**解決策:**
1. Dashboard → Settings → Pricing
2. プロバイダーごとの料金が現在のレートと一致するか確認
3. プロバイダーがレートを変更した場合は料金を更新
4. 不一致が続く場合はサポートに連絡
**問題: リセット時間が更新されない**
**解決策:**
1. ダッシュボードを更新 (F5)
2. システム時刻が正しいか確認
3. タイムゾーン設定を確認
4. 問題が続く場合は9Routerを再起動
**問題: アラートが受信されない**
**解決策:**
1. Dashboard → Settings → Alerts
2. メールアドレスが正しいか確認
3. スパムフォルダを確認
4. 通知をテスト (Send Testボタン)
---
## 関連
- [スマートルーティング](./smart-routing.md) - クォータに基づく自動フォールバック
- [コンボ](./combos.md) - カスタムフォールバックチェーンを作成