marketing-shibata50/9router

Fork 0

decolua fd92af77a0 Feat : Gitbook

2026-05-11 11:50:24 +07:00

16 KiB

Raw Blame History

クォータトラッキングと使用量モニタリング

リアルタイムのトークン消費を追跡し、クォータ制限を監視し、コストを見積もり、不足前にアラートを取得。サブスクリプションクォータを無駄にしたり、予算上限を超えたりすることはありません。

概要

9Routerはすべてのプロバイダーに対して包括的なクォータトラッキングを提供:

リアルタイムトークン消費 - リクエストごとの使用トークンを表示
クォータ上限と残量 - 使用量 vs 上限を追跡
リセットカウントダウン - クォータが更新されるタイミング
コスト見積もり - 有料階層の支出を計算
月次レポート - 使用パターンを分析
アラートと通知 - 上限前に警告を取得

ダッシュボード概要

クォータサマリー

Dashboard → Home → Quota Overview

┌─────────────────────────────────────────────┐
│ Claude Code (cc/)                           │
│ ████████████░░░░░░░░ 2.5h / 5h (50%)       │
│ Resets in: 2h 30m                           │
│ Cost: $0 (subscription)                     │
└─────────────────────────────────────────────┘

┌─────────────────────────────────────────────┐
│ Gemini CLI (gc/)                            │
│ ████████░░░░░░░░░░░░ 450 / 1000 (45%)      │
│ Daily reset in: 18h 30m                     │
│ Monthly: 45K / 180K (25%)                   │
│ Cost: $0 (free tier)                        │
└─────────────────────────────────────────────┘

┌─────────────────────────────────────────────┐
│ GLM-4.7 (glm/)                              │
│ ██████████████░░░░░░ 7M / 10M tokens (70%)  │
│ Resets: Daily 10:00 AM (in 5h 35m)         │
│ Cost today: $4.20                           │
└─────────────────────────────────────────────┘

┌─────────────────────────────────────────────┐
│ MiniMax M2.1 (minimax/)                     │
│ ████████████████░░░░ 4M / 5M tokens (80%)   │
│ Rolling 5h window                           │
│ Cost (5h): $0.80                            │
└─────────────────────────────────────────────┘

┌─────────────────────────────────────────────┐
│ iFlow (if/)                                 │
│ ████████████████████ Unlimited              │
│ Cost: $0 (free forever)                     │
└─────────────────────────────────────────────┘

リアルタイムトークン消費

リクエストごとのトラッキング

各リクエストに詳細なトークン使用量が表示されます:

Dashboard → Activity → Recent Requests

Request #1234
Model: cc/claude-opus-4-5-20251101
Timestamp: 2026-02-04 04:15:32

Tokens:
  Input: 1,250 tokens
  Output: 850 tokens
  Total: 2,100 tokens

Cost: $0 (subscription quota)
Duration: 3.2s
Status: ✅ Success

ライブ使用量モニター

Dashboard → Live Monitor

Current request:
  Model: glm/glm-4.7
  Tokens streamed: 450 / ~800 estimated
  Cost so far: $0.0009
  Duration: 1.8s

モデル別のトークン内訳

Dashboard → Analytics → Token Usage

Today (Feb 4, 2026):
  cc/claude-opus-4-5: 15M tokens ($0, subscription)
  glm/glm-4.7: 8M tokens ($4.80)
  if/kimi-k2-thinking: 3M tokens ($0, free)
  
Total: 26M tokens
Cost: $4.80

クォータ上限とリセット時間

サブスクリプションプロバイダー

Claude Code (Pro/Max)

クォータタイプ: 時間ベース (5時間ローリング)
上限: 5時間の使用
リセット: 5時間ローリングウィンドウ + 週次更新
追跡: モデルごとの使用時間

ダッシュボード表示:
  Opus: 2.5h / 5h 使用
  Sonnet: 1.2h / 5h 使用
  Haiku: 0.8h / 5h 使用
  
週次リセット: 毎週月曜00:00 UTC

OpenAI Codex (Plus/Pro)

クォータタイプ: 時間ベース (5時間ローリング)
上限: 5時間 (Plus) / 10時間 (Pro)
リセット: 5時間ローリングウィンドウ + 週次更新

ダッシュボード表示:
  GPT-5.2 Codex: 3.5h / 5h 使用
  Resets in: 1h 30m

Gemini CLI (無料)

クォータタイプ: リクエスト数 + 月次トークン
日次上限: 1,000 リクエスト
月次上限: 180,000 コンプリーション
リセット: 日次 00:00 UTC + 月次 1日

ダッシュボード表示:
  Today: 450 / 1,000 requests (45%)
  This month: 45K / 180K completions (25%)
  Daily reset in: 18h 30m
  Monthly reset in: 26 days

GitHub Copilot

クォータタイプ: 月次使用量
上限: プランによる
リセット: 各月1日

ダッシュボード表示:
  Usage: 60% of monthly quota
  Resets: March 1, 2026 (in 25 days)

低価格プロバイダー

GLM-4.7

クォータタイプ: 日次トークン上限
上限: 10Mトークン/日 (Coding Plan)
リセット: 毎日午前10時 北京時間 (UTC+8)

ダッシュボード表示:
  Used: 7M / 10M tokens (70%)
  Remaining: 3M tokens
  Resets in: 5h 35m
  Cost today: $4.20

MiniMax M2.1

クォータタイプ: 5時間ローリングウィンドウ
上限: 5時間あたり5Mトークン
リセット: 連続ローリングウィンドウ

ダッシュボード表示:
  Used (5h): 4M / 5M tokens (80%)
  Oldest usage expires in: 45m
  Cost (5h): $0.80

Kimi K2

クォータタイプ: 月次サブスクリプション
上限: 10Mトークン/月 ($9固定)
リセット: サブスクリプション日に月次

ダッシュボード表示:
  Used: 6M / 10M tokens (60%)
  Resets: Feb 15, 2026 (in 11 days)
  Cost: $9/month (prepaid)

無料プロバイダー

iFlow / Qwen / Kiro

クォータタイプ: 無制限 (レート制限)
上限: ハード制限なし
リセット: なし

ダッシュボード表示:
  Used today: 5M tokens
  Cost: $0 (free forever)
  Status: ✅ Available

コスト見積もり

リアルタイムコストトラッキング

Dashboard → Costs → Today

Subscription providers: $0
  Claude Code: 15M tokens ($0, included)
  Gemini CLI: 3M tokens ($0, free tier)

Paid providers: $4.80
  GLM-4.7: 8M tokens ($4.80)
    Input: 6M × $0.60/1M = $3.60
    Output: 2M × $2.20/1M = $4.40
    Total: $4.80

Free providers: $0
  iFlow: 3M tokens ($0)

Total today: $4.80

月次支出レポート

Dashboard → Costs → This Month (February 2026)

Week 1 (Feb 1-7):
  Subscription: $0 (80M tokens)
  Paid: $15.20 (25M tokens)
  Free: $0 (10M tokens)
  Total: $15.20

Week 2 (Feb 8-14):
  Subscription: $0 (75M tokens)
  Paid: $12.80 (20M tokens)
  Free: $0 (8M tokens)
  Total: $12.80

Month to date: $28.00
Projected (30 days): ~$120

Breakdown by provider:
  GLM-4.7: $22.00 (78%)
  MiniMax M2.1: $6.00 (22%)
  
Average cost per 1M tokens: $0.62
Savings vs ChatGPT API: 97% ($4,000 → $120)

コスト予測

Dashboard → Costs → Projections

Based on last 7 days usage:
  Daily average: 50M tokens
  Daily cost: $4.50

Monthly projection:
  Tokens: 1,500M (1.5B)
  Cost: $135
  
Breakdown:
  Subscription: 900M tokens ($0)
  GLM-4.7: 450M tokens ($90)
  MiniMax: 120M tokens ($24)
  Free: 30M tokens ($0)

Budget status:
  Daily limit: $5 → 90% used today
  Monthly limit: $150 → 90% projected
  ⚠️ Warning: May exceed monthly budget

使用量ダッシュボード

概要統計

Dashboard → Analytics → Overview

Today (Feb 4, 2026):
  Requests: 1,234
  Tokens: 26M
  Cost: $4.80
  Avg response time: 2.1s

This week:
  Requests: 8,456
  Tokens: 180M
  Cost: $28.00
  Success rate: 99.2%

This month:
  Requests: 15,234
  Tokens: 320M
  Cost: $52.00
  Top model: cc/claude-opus-4-5 (45%)

モデル別使用量

Dashboard → Analytics → Models

Top models (this month):
1. cc/claude-opus-4-5: 145M tokens (45%)
2. glm/glm-4.7: 95M tokens (30%)
3. if/kimi-k2-thinking: 50M tokens (16%)
4. minimax/MiniMax-M2.1: 20M tokens (6%)
5. gc/gemini-3-flash: 10M tokens (3%)

Cost breakdown:
  cc/claude-opus: $0 (subscription)
  glm/glm-4.7: $45.00
  if/kimi-k2-thinking: $0 (free)
  minimax/MiniMax-M2.1: $7.00
  gc/gemini-3-flash: $0 (free)

時間別使用量

Dashboard → Analytics → Timeline

Hourly usage (today):
00:00 - 01:00: 0.5M tokens
01:00 - 02:00: 0.2M tokens
...
08:00 - 09:00: 3.2M tokens (peak)
09:00 - 10:00: 2.8M tokens
...
23:00 - 00:00: 0.8M tokens

Peak hours: 08:00 - 12:00 (morning coding)
Low hours: 00:00 - 06:00 (night)

コンボ別使用量

Dashboard → Analytics → Combos

premium-coding:
  Requests: 456
  Tokens: 12M
  Cost: $2.40
  
  Breakdown:
    cc/claude-opus: 8M tokens (67%, $0)
    glm/glm-4.7: 3M tokens (25%, $1.80)
    minimax/MiniMax-M2.1: 1M tokens (8%, $0.20)

budget-combo:
  Requests: 234
  Tokens: 6M
  Cost: $1.20
  
  Breakdown:
    glm/glm-4.7: 4M tokens (67%, $2.40)
    if/kimi-k2-thinking: 2M tokens (33%, $0)

アラートと通知

クォータアラート

Dashboard → Settings → Alerts

Quota warnings:
  ✅ Alert at 80% quota used
  ✅ Alert at 90% quota used
  ✅ Alert when quota exhausted
  ✅ Notify when quota resets

Delivery:
  ✅ Dashboard notification
  ✅ Email (optional)
  ✅ Webhook (optional)

通知例:

⚠️ Claude Code quota 80% used
   2.5h remaining (resets in 1h 30m)
   
⚠️ GLM-4.7 quota 90% used
   1M tokens remaining (resets in 5h)
   
✅ Gemini CLI quota reset
   1,000 requests available (daily limit)

予算アラート

Dashboard → Settings → Budget Alerts

Daily budget: $5
  ✅ Alert at 80% ($4)
  ✅ Alert at 100% ($5)
  ✅ Auto-switch to free tier when exceeded

Monthly budget: $150
  ✅ Alert at 50% ($75)
  ✅ Alert at 80% ($120)
  ✅ Alert at 100% ($150)

通知例:

⚠️ Daily budget 80% used
   $4.00 / $5.00 spent today
   
⚠️ Monthly budget 50% reached
   $75 / $150 spent this month
   Projected: $135 (within budget)
   
🚨 Daily budget exceeded
   $5.20 / $5.00 spent today
   Auto-switched to free tier

コスト異常検知

Dashboard → Settings → Anomaly Detection

✅ Detect unusual spending patterns
✅ Alert on cost spikes (>2× daily average)
✅ Warn on quota exhaustion patterns

Example alert:
⚠️ Cost spike detected
   Today: $12.50 (2.5× daily average)
   Reason: High GLM-4.7 usage (20M tokens)
   Suggestion: Check if primary models quota-exhausted

ベストプラクティス

1. クォータを毎日モニター

日課:
1. ダッシュボードクォータ概要を確認 (30秒)
2. リセット時間を確認
3. クォータ可用性に合わせて使用量を計画

例:

朝の確認:
  ✅ Claude Code: 5時間利用可 (新鮮なリセット)
  ✅ Gemini CLI: 1Kリクエスト利用可
  ⚠️ GLM-4.7: 2Mトークン残 (午前10時リセット)
  
アクション: 朝の作業にClaude Codeを使用

2. 予算上限を設定

Dashboard → Settings → Budget:
  Daily: $5 (使いすぎ防止)
  Monthly: $150 (予算に整合)

結果: 上限到達時に自動的に無料階層へ切替。

3. コンボ使用を最適化

Dashboard → Analytics → Combos:
  どのモデルが最もよく使われているか確認
  コストを最小化するためにコンボ順序を調整

例:

現在: cc/claude-opus → glm/glm-4.7
  80% Claude経由 (良好)
  20% GLM経由 ($12/月)

最適化後: gc/gemini-3-flash → cc/claude-opus → glm/glm-4.7
  50% Gemini経由 (無料)
  40% Claude経由 (サブスクリプション)
  10% GLM経由 ($6/月)
  
節約: $6/月

4. リセット時間を追跡

Dashboard → Quota → Reset Schedule:
  Claude Code: 5時間ローリング + 週次月曜
  Gemini CLI: 日次 00:00 UTC + 月次 1日
  GLM-4.7: 毎日午前10時 北京時間
  MiniMax: 5時間ローリングウィンドウ

戦略: クォータが新鮮な時にプロバイダーを使用。

5. 月次レポートを確認

Dashboard → Analytics → Monthly Report:
  Total tokens: 1.5B
  Total cost: $120
  Savings: 97% vs ChatGPT API
  
インサイト:
  - 60% サブスクリプション経由の使用 ($0)
  - 30% GLM経由 ($90)
  - 10% 無料階層経由 ($0)
  
最適化:
  - Gemini CLI使用を増やす (無料)
  - GLM使用を減らす (高価)

APIアクセス

クォータステータスを取得

GET http://localhost:20128/api/quota
Authorization: Bearer your-api-key

Response:
{
  "providers": [
    {
      "id": "cc",
      "name": "Claude Code",
      "quota": {
        "used": 2.5,
        "limit": 5,
        "unit": "hours",
        "percentage": 50
      },
      "reset": {
        "type": "rolling",
        "window": "5h",
        "nextReset": "2026-02-04T06:45:00Z"
      },
      "cost": {
        "today": 0,
        "month": 0,
        "currency": "USD"
      }
    },
    {
      "id": "glm",
      "name": "GLM-4.7",
      "quota": {
        "used": 7000000,
        "limit": 10000000,
        "unit": "tokens",
        "percentage": 70
      },
      "reset": {
        "type": "daily",
        "time": "10:00 AM UTC+8",
        "nextReset": "2026-02-04T10:00:00+08:00"
      },
      "cost": {
        "today": 4.20,
        "month": 52.00,
        "currency": "USD"
      }
    }
  ]
}

使用統計を取得

GET http://localhost:20128/api/usage?period=today
Authorization: Bearer your-api-key

Response:
{
  "period": "today",
  "date": "2026-02-04",
  "summary": {
    "requests": 1234,
    "tokens": 26000000,
    "cost": 4.80
  },
  "byModel": [
    {
      "model": "cc/claude-opus-4-5",
      "requests": 456,
      "tokens": 15000000,
      "cost": 0
    },
    {
      "model": "glm/glm-4.7",
      "requests": 234,
      "tokens": 8000000,
      "cost": 4.80
    }
  ]
}

トラブルシューティング

問題: クォータが0%を表示するがリクエストが失敗

解決策:

プロバイダー接続を確認 (Dashboard → Providers)
APIキーが有効か確認
プロバイダーがダウンしているか確認 (ステータスページ)
OAuthプロバイダーを再接続してみる

問題: コスト見積もりが正しくない

解決策:

Dashboard → Settings → Pricing
プロバイダーごとの料金が現在のレートと一致するか確認
プロバイダーがレートを変更した場合は料金を更新
不一致が続く場合はサポートに連絡

問題: リセット時間が更新されない

解決策:

ダッシュボードを更新 (F5)
システム時刻が正しいか確認
タイムゾーン設定を確認
問題が続く場合は9Routerを再起動

問題: アラートが受信されない

解決策:

Dashboard → Settings → Alerts
メールアドレスが正しいか確認
スパムフォルダを確認
通知をテスト (Send Testボタン)

16 KiB Raw Blame History Unescape Escape

クォータトラッキングと使用量モニタリング

概要

ダッシュボード概要

クォータサマリー

リアルタイムトークン消費

リクエストごとのトラッキング

ライブ使用量モニター

モデル別のトークン内訳

クォータ上限とリセット時間

サブスクリプションプロバイダー

低価格プロバイダー

無料プロバイダー

コスト見積もり

リアルタイムコストトラッキング

月次支出レポート

コスト予測

使用量ダッシュボード

概要統計

モデル別使用量

時間別使用量

コンボ別使用量

アラートと通知

クォータアラート

予算アラート

コスト異常検知

ベストプラクティス

1. クォータを毎日モニター

2. 予算上限を設定

3. コンボ使用を最適化

4. リセット時間を追跡

5. 月次レポートを確認

APIアクセス

クォータステータスを取得

使用統計を取得

トラブルシューティング

関連

16 KiB

Raw Blame History