release: v3.29.1 - Git MCP + GitHub MCP catalog entries

Add Git MCP Server (12 tools, uvx setup) and GitHub MCP Server
(Issues/PRs/Projects, remote Copilot + self-hosted PAT-only) to §8.2
MCP Server Catalog. Document real-world fix for Incompatible auth
server error via gh auth token + manual header injection.

Also ships: CC v2.1.63 tracking, HTTP hooks, observability quality
patterns, config lifecycle §9.23, terminal personalization, tool
comparison table extensions, MCP server 3 new tools.

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
This commit is contained in:
Florian BRUNIAUX 2026-03-02 16:10:19 +01:00
parent 155b07a589
commit 252148fe75
20 changed files with 1802 additions and 34 deletions

View file

@ -0,0 +1,126 @@
# Évaluation Ressource: Signaux communautaires Claude Code — JanvierFévrier 2026
**Source type**: Texte copié — synthèse manuelle multi-sources (GitHub Issues API, Reddit, X/Twitter, HN, presse)
**Période couverte**: 2026-01-29 → 2026-02-28
**Date d'évaluation**: 2026-03-02
**Évaluateur**: Claude Sonnet 4.6 + technical-writer challenge agent
---
## Résumé du contenu
- **977 issues GitHub** créées sur 30 jours (616 bugs / 242 FRs / 205 dups). Median time-to-close ≈ 1h — principalement auto-fermeture de dups, pas indicatif de vraie résolution.
- **Top 5 pain points** convergents multi-canaux : pannes 500 backend, Remote Control immature (gating Pro/Max + bugs UX), quotas opaques, corruption `.claude.json` en multi-instances, onboarding/auth Windows fragmenté.
- **Top 5 feature requests** : CRUD sessions complet, onboarding + doc plus clairs, hooks/permissions expressifs, packs MCP officiels out-of-the-box, patterns workflows GitHub/Discord/Slack officiels.
- **Adoption forte** malgré les bugs : product-market fit net chez les power users, threads Reddit très positifs sur productivité. Run-rate estimé $2.5B ARR par sources tierces (⚠️ non vérifiable).
- **Signaux faibles** : sécurité (CVE + preview "Claude Code Security"), rôle "AI orchestrator" en mutation, coding from anywhere, monitoring de quotas comme sous-écosystème tiers, plateformisation CLI → plateforme.
---
## Score de pertinence
**Score: 4/5** — Très pertinent, amélioration significative
Trois pain points (500 errors, `.claude.json` corruption multi-instances, Remote Control) ont une couverture nulle ou quasi-nulle dans `guide/ultimate-guide.md` (confirmé par grepai). Score abaissé de 5 à 4 suite challenge du technical-writer : biais de sélection communautaire structurel + stats GitHub non re-vérifiées + CVEs suspects + recommandations sans stratégie de maintenance.
---
## Comparatif
| Pain point / FR | Cette synthèse | Guide actuel |
|-----------------|----------------|--------------|
| Pannes 500 / runbook outage | Identifié + recommandations | ❌ Absent |
| Remote Control limitations + workarounds | UX, gating, stack Tailscale/Tmux | ❌ Quasi-absent |
| Quotas / rolling window / impact features | Structuré par plan | ⚠️ Partiel (resource-evals, pas guide principal) |
| `.claude.json` corruption multi-instances | Identifié comme P1 | ❌ Absent |
| Onboarding / auth Windows | Microsoft Store, API keys, rôles | ⚠️ Partiel |
| Security / CVE | CVEs récents + Code Security preview | ✅ Couvert (`security-hardening.md`, `threat-db.yaml`) |
| AI orchestrators / multi-agent | Rôle émergent décrit | ✅ Bien couvert (`agent-teams.md`) |
| MCP intégrations out-of-the-box | FR dominant identifié | ⚠️ API couverte, exemples incomplets |
| Hooks / permissions configurables | FR articulé | ⚠️ Hooks shell couverts, policies moins |
---
## Recommandations d'intégration
### À intégrer — gaps réels confirmés (priorité haute)
**1. Troubleshooting 500 errors**
- Fichier: `guide/ultimate-guide.md` (nouvelle sous-section "Troubleshooting" ou `guide/troubleshooting.md`)
- Contenu: distinction erreur serveur vs config locale, lien `status.anthropic.com`, bonnes pratiques de reprise, fallback Bedrock/Vertex avec config minimale
- **Marquer volatile** — sera périmé si Anthropic améliore la fiabilité backend
**2. `.claude.json` corruption et multi-instances**
- Fichier: `guide/ultimate-guide.md` (section Configuration) + lien depuis `known-issues.md`
- Contenu: risques de writes concurrents, patterns recommandés (un worktree par instance, gitignore local de `.claude.json`, backup régulier), lien avec `examples/scripts/sync-claude-config.sh`
**3. Remote Control — documentation + limitations**
- Fichier: `guide/ultimate-guide.md` (section Remote/Mobile ou nouvelle section)
- Contenu: tableau plans supportés, limitations UX connues (interruption, déconnexions), workaround Tailscale + Tmux pour power users
- **Marquer beta** — feature active en développement au moment du rapport
### À intégrer — compléments utiles (priorité moyenne)
**4. Quotas transparency + ccusage**
- Enrichir section pricing/limits avec tableau Opus vs Sonnet vs Haiku par plan, impact auto-memory / plan mode / subagents
- Mentionner `ccusage` (outil communautaire de monitoring) — déjà signalé par @claude_code officiel
**5. CVEs 2025 manquants dans threat-db**
- CVE-2025-59536 à vérifier (séquence haute, non dans notre threat-db) → ajouter si confirmé sur NVD
### Ne pas intégrer
- CVE-2026-21852 → format suspect (⚠️ voir fact-check), ne pas intégrer sans confirmation NVD
- "Claude Code Security" preview → source LinkedIn secondaire non officielle, attendre annonce Anthropic
- Run-rate $2.5B ARR → estimation tiers non vérifiable, hors scope guide technique
- "Playbook communauté officiel" → rôle d'Anthropic, pas du guide tiers
- "Known issues this month" dynamique → maintenance impossible à notre niveau
---
## Challenge (technical-writer agent)
**Score ajusté**: 4/5 maintenu
**Points critiques soulevés :**
- **Biais de sélection structurel** : 977 issues sur-représentent les power users articulés. Le churn silencieux des utilisateurs qui abandonnent l'outil n'apparaît jamais dans GitHub Issues. Ne pas traiter ces signaux comme représentatifs de la base totale.
- 4 recommandations sur 6 sont **défensives** — les quick wins (workarounds validés pour quotas, patterns anti-corruption `.claude.json`) ont plus de valeur immédiate que les runbooks.
- Le runbook 500 errors a **impact marginal faible** : les utilisateurs expérimentés savent utiliser `status.anthropic.com`. Prioriser `.claude.json` et Remote Control.
- Remote Control "immature" est un jugement sans repère — documenter la date de GA de la feature pour contextualiser les limitations.
- Recommandation "patterns GitHub/Discord/Slack officiels" → confond le rôle du guide avec l'animation communauté Anthropic.
**Risques réels de non-intégration :**
- Érosion de crédibilité du guide si les workarounds communautaires les plus utilisés n'y figurent pas
- Utilisateurs perdant du travail sur corruption `.claude.json` sans documentation de recovery
---
## Fact-Check
| Affirmation | Vérifiée | Notes |
|-------------|----------|-------|
| 977 issues / 616 bugs / 242 FRs / 205 dups | ⚠️ Non re-vérifiée | Présentée comme extraite via GitHub API. Plausible, mais non confirmée ici via `gh api`. |
| Median time-to-close ≈ 1h | ⚠️ Biais probable | Expliqué en grande partie par l'auto-fermeture des 205 duplicatas. Ne reflète pas la résolution réelle. |
| CVE-2025-59536 (CVSS 8.7) | ⚠️ Partielle | CVE-2025-53109/53110 (EscapeRoute) confirmé dans `security-hardening.md`. CVE-2025-59536 absent de notre threat-db — sequence très haute pour 2025, à vérifier sur NVD. |
| CVE-2026-21852 | ❌ Suspect | Format inhabituel. CVEs 2026 extrêmement rares à cette date. Non trouvé dans nos sources. Ne pas intégrer. |
| "Claude Code Security" preview (Anthropic fév 2026) | ⚠️ Non confirmée | Source: LinkedIn post tiers. Pas d'annonce officielle Anthropic trouvée. |
| Run-rate $2.5B ARR | ❌ Non vérifiable | Source: albertoai.substack (tiers). Non confirmé par Anthropic. Écarté. |
| "25% des signalements DownDetector = Claude Code" (25 fév) | ⚠️ Partielle | Source: Hindustan Times. Anecdotique pour un guide technique. |
| Opus 4.6 token consumption > 4.5 | ✅ Cohérent | Confirmé par la hiérarchie de pricing Anthropic. |
| r/ClaudeCode "≈ 12k contributions hebdo" | ⚠️ Non vérifiée | Plausible mais non confirmé ici. |
**Corrections appliquées**: CVE-2026-21852 et "Claude Code Security preview" exclus du plan d'intégration. $2.5B ARR écarté.
---
## Décision finale
- **Score final**: 4/5
- **Action**: Intégrer partiellement (troubleshooting 500, `.claude.json` multi-instances, Remote Control, quotas + ccusage)
- **Confiance**: Moyenne (stats GitHub non re-vérifiées, CVEs suspects, biais de sélection communautaire)
- **Prochaine étape recommandée**: Vérifier CVE-2025-59536 via NVD avant intégration dans `threat-db.yaml`
---
*Évaluation réalisée le 2026-03-02 | Claude Sonnet 4.6 + technical-writer agent*

View file

@ -0,0 +1,106 @@
# Resource Evaluation: MCP Servers Veille (March 2026)
**Date**: 2026-03-02
**Type**: Copied text (veille / research report)
**Language**: French
**Source**: Internal research by Perplexity, covers servers: `github/github-mcp-server`, `exa-labs/exa-mcp-server`, `rawr-ai/mcp-graphiti`
---
## Summary
A research report evaluating 3 open-source MCP servers for Claude Code development workflows, applying criteria: ≥50 stars, recent release (<3 months), clear README, tests/CI, specific use case.
Key findings from the veille:
- **GitHub MCP Server** (`github/github-mcp-server`): 27.1k stars, release v0.31.0 Feb 19 2026, official GitHub, Go, remote MCP at `api.githubcopilot.com/mcp/`, OAuth 2.1 + PAT, covers Issues/PRs/Projects/Enterprise
- **Exa MCP Server** (`exa-labs/exa-mcp-server`): claimed 3.1k stars (unverified — see fact-check), no formal GitHub releases, TypeScript, key feature `get_code_context_exa` for dev-focused code search
- **Graphiti MCP Server** (`rawr-ai/mcp-graphiti`): 74 stars, multi-project knowledge graph on Neo4j + Docker, Python/pipx, CLI (`graphiti compose`, `graphiti up`), early-stage project
---
## Score de pertinence
| Server | Initial Score | Challenge | Final Score |
|--------|--------------|-----------|-------------|
| GitHub MCP | 5/5 | -1 (missing privacy warning, missing Git MCP comparison) | **4/5** |
| Exa MCP | 4-5/5 | -2 (unverified stars, no formal releases, WebSearch native covers use case) | **2/5** |
| Graphiti MCP | 3.5/5 | -1.5 (74 stars, Kairn already in guide, stack too heavy) | **2/5** |
---
## Comparatif
| Aspect | GitHub MCP | Our Guide (pre-integration) |
|--------|-----------|---------------------------|
| GitHub Issues/PRs/Projects | Full coverage | Missing |
| Local Git operations | Partial (GitHub only) | Missing (→ Git MCP fills this) |
| Remote HTTP MCP transport | Yes | Not documented |
| Privacy warning (remote mode) | Needs documentation | Missing |
| Exa code search | Claimed 3.1k stars | WebSearch (built-in) covers basic need |
| Knowledge graphs | Heavy stack | Kairn (already documented) |
---
## Challenge (technical-writer agent)
**GitHub MCP — points manqués**:
- Missing: privacy warning for remote `api.githubcopilot.com` mode (sends data to GitHub servers)
- Missing: explicit comparison with Git MCP Server (two complementary layers: local vs cloud)
- Missing: recommendation to check existing `git-mcp-server-evaluation.md` (5/5 CRITICAL, never integrated)
- Score adjusted: 4/5 (not 5/5)
**Exa MCP — points manqués**:
- Star count unverifiable: veille claims 3.1k, Perplexity search found ~220 stars
- No formal GitHub releases — versioning via npm only, recency criterion relaxed without clear evidence
- Native WebSearch in Claude Code covers basic web/code search use case without extra SaaS dependency
- Score adjusted: 2/5 (reject)
**Graphiti MCP — points manqués**:
- 74 stars barely clears the threshold; project maturity uncertain
- Kairn (already in guide §8.2) covers the persistent memory / knowledge graph use case for Claude Code workflows
- Neo4j + Docker + LLM API dependency is heavy for most users
- Score adjusted: 2/5 (reject)
**Risques de non-intégration (GitHub MCP)**:
- Guide users miss the most useful GitHub automation MCP for Claude Code
- No differentiation between Git (local) and GitHub (cloud) — common confusion point
- Git MCP evaluation was 5/5 CRITICAL but never integrated — oversight corrected simultaneously
---
## Fact-Check
| Claim | Verified | Notes |
|-------|----------|-------|
| GitHub MCP: 27.1k stars | ✅ (approximate) | Perplexity: "20k+" — compatible |
| GitHub MCP: release v0.31.0 Feb 19 2026 | ✅ | 54 total releases confirmed |
| GitHub MCP: Go implementation | ✅ | Confirmed |
| GitHub MCP: OAuth 2.1 + PKCE | ✅ | Confirmed in GitHub changelog |
| Exa: 3.1k stars | ❌ | Perplexity found ~220 stars — major discrepancy, not published |
| Exa: no formal GitHub releases | ✅ | Confirmed — npm + hosted endpoint only |
| Graphiti: 74 stars | ✅ | Approximately verified |
| Graphiti: Neo4j + Docker dependency | ✅ | Confirmed in README |
| Firecrawl: last release Sep 26 2025 | ✅ | v3.2.1 confirmed |
| Chrome MCP: last release Jul 9 2025 | ✅ | v0.0.6 confirmed |
---
## Decision
| Server | Decision | Reason |
|--------|----------|--------|
| **GitHub MCP** | ✅ Integrated | Score 4/5, real gap in guide, official GitHub project, active maintenance |
| **Git MCP** | ✅ Integrated | Pre-existing evaluation 5/5 CRITICAL (`git-mcp-server-evaluation.md`), never integrated — added simultaneously |
| **Exa MCP** | ❌ Rejected | Score 2/5, unverified star count, WebSearch native covers the need, SaaS dependency |
| **Graphiti MCP** | ❌ Rejected | Score 2/5, 74 stars, Kairn already in guide, heavy stack |
**Integration location**: `guide/ultimate-guide.md` §8.2 MCP Server Catalog, before `</details>` closing tag (~line 10625 pre-edit)
**Confidence**: High (facts verified for accepted servers, Exa stars discrepancy flagged)
---
## Related Files
- `docs/resource-evaluations/git-mcp-server-evaluation.md` — Pre-existing 5/5 evaluation for Git MCP (Feb 2026)

View file

@ -0,0 +1,141 @@
# Resource Evaluation: Benchmark Comparatif AI Coding Tools (Feb 2026)
**Date**: 2026-03-02
**Evaluator**: Claude Sonnet 4.6
**Source**: Texte copié (pas d'URL — auteur inconnu)
**Type**: Benchmark comparatif (Claude Code vs Cursor vs Windsurf vs Zed vs Copilot Workspace)
**Périmètre temporel revendiqué**: Fin février 2026
---
## Executive Summary
**Score**: 3/5 (Pertinent — Complément utile)
**Decision**: Intégration sélective (2 apports nets identifiés)
**Confidence**: Moyenne (claims non vérifiables sans URL source)
Benchmark structuré comparant 5 outils d'agentic coding avec des tableaux détaillés, un focus Claude Code et 6 recommandations documentaires. Apport réel sur deux angles manquants dans le guide : quotas précis par plan (Pro/Max) et couverture Windsurf/Zed aujourd'hui absente. Le reste chevauche des sections existantes ou est non vérifiable.
---
## Résumé du contenu
- **5 outils comparés** : Claude Code (CLI-first + sub-agents + hooks), Cursor (IDE fork VS Code, Tab, Composer), Windsurf (Cascade multi-agents, Wave 13), Zed (Rust natif, Ollama local), Copilot Workspace (GitHub-centré, issue → PR)
- **Breaking news** : Sonnet 4.6 lancé "15 fév 2026" avec 1M context (beta), modèle par défaut Pro/Free ; extension VS Code GA ; nouveaux docs Hooks (26 fév)
- **Quotas Claude Code** : Pro ≈ 10-40 prompts/5h, Max 5x = 50-200/5h, Max 20x = 200-800/5h, cap ~50 fenêtres/mois
- **Différenciation Claude Code** : points forts = CLI + Git + sub-agents + checkpoints + CLAUDE.md/init ; points faibles = pas d'autocomplétion inline, quotas Pro serrés sur sessions intensives
- **6 recommandations documentaires** : (1) cadrage modèles/contexte, (2) page quotas devs, (3) stack agentique, (4) comparaison IDE, (5) CLAUDE.md pédagogie, (6) VS Code flows
---
## Score de pertinence (1-5)
| Score | Signification |
|-------|---------------|
| 5 | Essentiel - Gap majeur dans le guide |
| 4 | Très pertinent - Amélioration significative |
| **3** | **Pertinent - Complément utile** |
| 2 | Marginal - Info secondaire |
| 1 | Hors scope - Non pertinent |
**Score: 3/5**
**Justification** : Deux apports nets confirmés après vérification du guide, mais le reste est soit déjà couvert, soit invérifiable sans URL source. La source inconnue (texte copié, auteur non identifié) empêche un score plus élevé — standard appliqué de façon cohérente avec les évaluations précédentes.
---
## Comparatif
| Aspect | Cette ressource | Notre guide |
|--------|----------------|-------------|
| Cursor comparison | Benchmark détaillé (UX, pricing, limites) | ✅ Couvert (ligne 885, 947 — migration guide) |
| Windsurf | Couvert (Wave 13, Cascade, pricing) | ⚠️ Mentions passantes (~6 lignes) |
| Zed AI | Couvert (Rust natif, Ollama, token pricing) | ❌ Absent (pas de section dédiée) |
| Copilot Workspace | Couvert (issue → PR workflow) | ⚠️ Mentionné en liste, pas comparé |
| Quotas Pro/Max précis | Chiffres précis par plan et par fenêtre | ⚠️ Existe mais éparpillé (ultime-guide + known-issues) |
| Sonnet 4.6 comme défaut | Documenté avec benchmarks préférences | ✅ Déjà dans guide (releases tracking) |
| Stack agentique hooks | Recommandation de regroupement | ✅ Couvert mais fragmenté |
| CLAUDE.md /init | Recommandation tutoriel pas-à-pas | ✅ Couvert (plusieurs sections) |
| VS Code flows prédéfinis | Recommandation workflows | ✅ Couvert (extension doc) |
---
## Recommandations d'intégration
### Apport #1 — Quotas précis par plan (PRIORITÉ HAUTE)
- **Gap réel** : Les chiffres existent dans le guide mais sont éparpillés entre `ultimate-guide.md` et `guide/known-issues.md`. Pas de tableau synthétique "Pro / Max 5x / Max 20x" avec les intervalles réels par fenêtre 5h.
- **Où** : `guide/ultimate-guide.md` section pricing/limits (~ligne 1951-2013) + potentiellement `guide/architecture.md`
- **Comment** : Tableau unique "Plan → prompts Claude Code/5h → Sonnet heures/semaine → cap mensuel" avec note sur sub-agents et 1M context comme multiplicateurs de consommation
- **Caveat** : Les chiffres du benchmark (10-40 / 50-200 / 200-800) sont des fourchettes communautaires, pas des SLAs officiels Anthropic. Sourcer depuis GitHub issues anthropics/claude-code ou docs officielles avant d'intégrer.
### Apport #2 — Section Windsurf + Zed dans le comparatif outils (PRIORITÉ MOYENNE)
- **Gap réel** : Le tableau comparatif ligne 885 couvre Copilot/Cursor/Claude Code. Windsurf et Zed sont absents du comparatif principal malgré leur adoption croissante.
- **Où** : Section Migration/Comparison (~ligne 881), étendre le tableau existant
- **Comment** : Ajouter 2 colonnes (Windsurf + Zed) + une ligne "Copilot Workspace" avec positionnement court (50-100 mots par outil). Utiliser le benchmark comme base, vérifier contre docs officielles.
- **Attention** : Windsurf Wave 13 + SWE-1.5 et Zed token pricing (+10%) sont des claims spécifiques à vérifier contre windsurf.com/changelog et zed.dev/blog avant intégration.
### À ne pas intégrer
- Recommandations 3, 5, 6 (stack agentique, CLAUDE.md, VS Code flows) : déjà couverts dans le guide, intégration = duplication sans valeur ajoutée.
- Rec 4 (page dédiée "comparaison IDE") : pertinente sur le principe mais le guide n'est pas une page marketing Anthropic — garder le focus pédagogique.
---
## Challenge (technical-writer)
**Score ajusté : 3/5** (downgrade depuis 4/5 initial)
**Points du challenge :**
- La source inconnue (texte sans URL, auteur non identifié) est un disqualificateur partiel — les évaluations précédentes de sources anonymes sans vérifiabilité finissent systématiquement en dessous de 4
- Le lancement Sonnet 4.6 "15 fév 2026" est un claim daté précis qui mérite vérification contre `llms-full.txt` avant de s'appuyer dessus
- Les 6 recommandations ne sont pas équivalentes : 2 adressent des gaps réels, 4 sont du polish sur ce qui existe — une évaluation rigoureuse les sépare
- L'absence de Windsurf/Zed dans le guide est une lacune réelle mais non critique pour l'audience cible (devs CLI qui ne cherchent pas de comparatif marketing)
**Risques de non-intégration :**
- Faibles à court terme : le comparatif existant (3 outils) couvre les besoins d'une majorité de lecteurs
- Moyen terme : si Windsurf/Zed continuent de monter, l'absence dans le guide crée un angle mort de crédibilité
---
## Fact-Check
| Affirmation | Vérifiée | Source | Notes |
|-------------|----------|--------|-------|
| Sonnet 4.6 lancé "15 fév 2026" | ⚠️ PARTIELLE | llms-full.txt à croiser | Date précise non vérifiée dans cette évaluation |
| Sonnet 4.6 = modèle par défaut Pro/Free | ✅ PROBABLE | Cohérent avec releases tracking guide | Vérifier contre anthropic.com/news |
| Quotas Pro 10-40 prompts/5h | ⚠️ COMMUNAUTAIRE | GitHub issues #6611 cité dans texte | Fourchette observée, pas SLA officiel |
| Max 5x = 50-200 prompts/5h | ⚠️ COMMUNAUTAIRE | Même source | Idem |
| Windsurf Wave 13 : multi-agents parallèles | ⚠️ NON VÉRIFIÉE | windsurf.com/changelog (non fetchable ici) | Crédible mais non confirmé |
| Zed Pro = $10/mo + $5 tokens | ⚠️ NON VÉRIFIÉE | zed.dev/blog/pricing... (non fetchable) | Crédible mais non confirmé |
| Cursor Bugbot Autofix ~35% merges directs | ⚠️ NON VÉRIFIÉE | cursor.com/changelog (non fetchable) | Chiffre spécifique, vérifier |
| Extension VS Code Claude Code en GA | ✅ CONFIRMÉE | code.claude.com/docs (dans guide) | Documenté dans releases tracking |
| Docs Hooks Claude Code (26 fév) | ✅ PROBABLE | code.claude.com/docs/en/hooks | Cohérent avec état actuel |
**Corrections apportées** : Aucune donnée intégrée sans vérification. Claims marqués ⚠️ doivent être vérifiés avant intégration dans le guide.
**Stats nécessitant recherche externe avant intégration** :
- Quotas Pro/Max précis → chercher dans GitHub issues anthropics/claude-code ou docs officielles
- Windsurf Wave 13 features → vérifier windsurf.com/changelog
- Zed token pricing → vérifier zed.dev/blog
---
## Décision finale
- **Score final** : 3/5 (Pertinent)
- **Action** : Intégration sélective — 2 apports sur 6
- **Confidence** : Moyenne (source anonyme, claims communautaires non tous vérifiables)
### Prochaines étapes
1. **Vérifier Sonnet 4.6 date** : `https://code.claude.com/docs/llms-full.txt` ou Perplexity
2. **Vérifier quotas précis** : GitHub issues anthropics/claude-code (chercher #6611)
3. **Si vérifiés** : Intégrer tableau quotas + étendre comparatif outils (Windsurf + Zed)
4. **Priorité** : Moyenne (amélioration utile, non bloquante)
---
*Fichier* : `docs/resource-evaluations/benchmark-ai-coding-tools-feb2026.md`
*Prochaine révision* : 2026-06-02 (pricing et modèles évoluent vite dans ce secteur)

View file

@ -0,0 +1,103 @@
# Évaluation Ressource: The Great Transition — Unsupervised Learning Podcast
**Source**: https://omny.fm/shows/unsupervised-learning/the-great-transition
**Type**: Podcast — framework conceptuel macro-tendances IA (84 min)
**Auteur**: Daniel Miessler (cybersecurity/AI analyst, Unsupervised Learning)
**Date de publication**: 2026-02-28
**Date d'évaluation**: 2026-03-02
**Évaluateur**: Claude Sonnet 4.6
**Reviewer**: technical-writer agent
---
## 📄 Résumé du contenu
5 points clés:
- **Framework "8 transitions simultanées"** pour naviguer l'ère IA, présenté comme modèle unifié réduisant l'anxiété face aux changements technologiques rapides
- **Software → APIs for AI agents**: les apps à interface humaine disparaissent au profit d'APIs orchestrées par des assistants personnels IA — le SEO/marketing s'adresse aux agents, pas aux humains
- **Enterprise as AI-Run Graph**: les entreprises deviennent des graphes d'algorithmes/SOPs pilotés par IA, le software se sélectionne automatiquement sur métriques de performance
- **Cybersecurity AI vs AI**: bataille machine-speed entre stacks défensifs et offensifs, asset management temps réel = priorité #1
- **Ideal State Management** présenté comme "plus grand use case IA": définir l'état idéal, l'IA évalue l'état actuel et exécute en continu pour combler le gap (individus comme entreprises)
Les 3 autres transitions: Knowledge Private → Public (expertise absorbée par modèles IA via skills/markdown), Automation → Zero Employees (l'automatisation vise l'absence totale de salariés), Human 3.0 (travail décentralisé, individus broadcastent leurs compétences, agents les recrutent on-demand), Custom Everything (logiciels bespoke générés par IA, fragmentation des réalités).
---
## 🎯 Score de pertinence
**Score: 2/5** — Marginal (Watch list)
### Justification
**Audience mismatch principal**: le guide sert des développeurs configurant Claude Code CLI au quotidien. Ce podcast cible des macroéconomistes de l'IA cherchant un cadre conceptuel global. Ces deux audiences ne se superposent pas utilement.
**Ratio signal/effort**: 84 minutes pour 0 insight technique extractable absent du guide. Le guide *implémente* ce que Miessler *nomme* (skills = externalized knowledge, agents orchestrating APIs, ideal state via hooks/memory).
**Durée de vie des contenus**: les prédictions futurologiques (zero employees, fragmented realities, Human 3.0) ont une demi-vie de 12-18 mois. Le guide vise la durabilité sur plusieurs années.
---
## ⚖️ Comparatif
| Aspect | Ce podcast | Notre guide |
|--------|------------|-------------|
| Skills = externalisation du savoir | Framing conceptuel ("pourquoi") | ✅ Implémentation concrète (SKILL.md, skills/) |
| Agents orchestrant des APIs | Tendance prédite | ✅ Documenté (multi-agent, MCP, orchestration) |
| Ideal State Management | Concept nommé | ✅ Couvert via hooks, memory, continuous agents |
| Cybersecurity AI vs AI | Direction prospective | ✅ security-hardening.md, threat-db.yaml |
| Future of Work / Human 3.0 | Couvert en profondeur | ❌ Absent — délibérément hors scope guide technique |
| Zero employees trajectory | Couvert en profondeur | ❌ Absent — hors scope, contenu daté |
---
## 📍 Recommandation
**Ne pas intégrer.** Ni mention directe, ni section dédiée.
**Seule ouverture partielle envisageable** (future): si une section "Pourquoi soigner sa configuration Claude Code" voit le jour, la Transition #8 (Ideal State Management) pourrait servir d'une phrase de framing philosophique avec lien vers le podcast. Pas dans l'état actuel du guide.
**Watchlist**: réévaluer si dans 6-12 mois la communauté Claude Code adopte massivement le paradigme "Ideal State" comme framing pour structurer ses agents/hooks. Dans ce cas, chercher une source plus technique comme point d'entrée.
---
## 🔥 Challenge (technical-writer agent)
**Score confirmé: 2/5.**
Points clés:
- L'argument "pas actionnable pour CLI" est trop vague — le vrai motif est l'*audience mismatch*
- Transition #8 (Ideal State) et Transition #1 (skills = externalized knowledge) ont une résonance réelle avec le guide, mais le guide les traite mieux depuis l'angle pratique
- Aucun insight technique unique présent dans cette ressource
- Intégration partielle possible théoriquement mais sans utilité concrète aujourd'hui
- Le ratio signal/effort est indépendamment disqualifiant: 84 min pour 0 extraction actionnable
---
## ✅ Fact-Check
| Affirmation | Vérifiée | Source |
|-------------|----------|--------|
| Auteur: Daniel Miessler | ✅ | Page Omny officielle |
| Date: 2026-02-28 | ✅ | Page Omny officielle |
| Durée: 84 min (5,060s) | ✅ | Page Omny officielle |
| Podcast couvre cybersecurity/AI/tech | ✅ | Description officielle |
| Contenu des 8 transitions | ⚠️ | Basé sur résumé utilisateur — transcript non accessible via fetch |
| Stats spécifiques | N/A | Aucune stat citée dans le résumé |
**Note**: le transcript est signalé disponible sur Omny mais non accessible publiquement via WebFetch. Le résumé utilisateur est cohérent avec la description officielle et le style habituel de Miessler.
---
## 🎯 Décision finale
| | |
|---|---|
| **Score final** | 2/5 |
| **Action** | Ne pas intégrer — mettre en watchlist |
| **Confiance** | Haute |
| **Motif principal** | Audience mismatch + ratio signal/effort + durée de vie courte des prédictions |
---
*Évaluation v1.0 — 2026-03-02*

View file

@ -0,0 +1,132 @@
# Évaluation Ressource: Veille hebdomadaire Anthropic/Claude Code — Semaine W09 2026
**Source**: Texte copié (rapport de veille interne)
**Type**: Rapport de veille structuré — 6 sujets, sources multi-canaux
**Période couverte**: 24 février 1er mars 2026
**Canaux**: GitHub anthropics/claude-code, blog Anthropic, docs/release notes, X @AnthropicAI
**Date d'évaluation**: 2026-03-02
**Évaluateur**: Claude Sonnet 4.6
**Reviewer**: technical-writer agent
---
## 📄 Résumé du contenu
- **Claude Code v2.1.63** (27 fév): nouvelles slash commands bundlées `/simplify` + `/batch`, HTTP hooks (POST JSON → URL), partage config/auto-memory entre worktrees du même repo, nouvel env var `ENABLE_CLAUDEAI_MCP_SERVERS=false`, série de fixes memory leaks critiques
- **Model deprecations urgentes**: `claude-3-haiku-20240307` deprecated le 19 fév, retirement API le **20 avril 2026** (7 semaines), replacement recommandé: `claude-haiku-4-5-20251001`
- **Acquisition Vercept** (24 fév): startup vision/GUI automation, équipe rejoint Anthropic pour renforcer computer use — contextuel, pas de changement API immédiat
- **Opus 3 deprecation update**: Opus 3 reste accessible via canal dédié + Substack "Claude's Corner" — anecdotique pour le guide
- **Anthropic vs Department of War**: lignes rouges (pas de surveillance masse, pas d'armes autonomes) — hors scope technique
- **Cowork: plugins + tâches planifiées** (24-25 fév): marketplace plugins, contrôles admin, scheduled tasks — audience non-dev, hors scope
---
## 🎯 Score de pertinence: 4/5
**Score initial préliminaire**: 4/5
**Score challenge agent**: 3/5 (report complet), 5/5 (v2.1.63 isolé)
**Score final retenu**: **4/5** — le rapport contient 2 éléments haute valeur + 1 urgence deadline
**Justification**: Le rapport agrège des infos de valeurs très différentes. Si on exclut les 50% hors scope (Cowork, DoW, Opus 3 Substack), les items techniques restants justifient une intégration active:
- HTTP hooks = **gap réel** dans le guide (section hooks ne couvre que shell scripts)
- v2.1.63 release tracking = mise à jour mécanique du YAML + MD
- Haiku 3 retirement le 20/04/2026 = **urgence actionnable dans 7 semaines**
---
## ⚖️ Comparatif
| Aspect | Ce rapport | Guide actuel |
|--------|-----------|--------------|
| HTTP hooks (nouveau type) | ✅ Documenté + exemple config | ❌ Absent — seulement hooks shell |
| v2.1.63 dans release tracking | ✅ Détails CHANGELOG | ❌ Dernier tracké = 2.1.59 |
| Worktree config sharing | ✅ Confirmé | ⚠️ Worktrees couverts mais pas ce détail |
| Haiku 3 retirement deadline | ✅ Date précise (20/04/2026) | ❌ Absent ou non à jour |
| Bundled `/simplify` + `/batch` | ✅ Confirmé | ⚠️ `/simplify` existe comme skill custom — confusion possible |
| Cowork features | ✅ Couvert | ✅ Hors scope volontairement |
| DoW/Vercept/Opus 3 Substack | ✅ Couvert | ✅ Hors scope technique |
---
## 📍 Recommandations
### Items à intégrer (score ≥ 4/5 individuel)
**1. Claude Code v2.1.63 → Release tracking**
- Fichiers: `machine-readable/claude-code-releases.yaml` + `guide/claude-code-releases.md`
- Action: Ajouter versions 2.1.60 → 2.1.63 (le script `./scripts/update-cc-releases.sh` a déjà les données)
- Priorité: **Haute** (release récente, notre tracking a 4 versions de retard)
**2. HTTP hooks → Section Hooks du guide**
- Fichier: `guide/ultimate-guide.md` (section 7.x Hooks)
- Action: Ajouter sous-section "HTTP Hooks" avec config et cas d'usage (intégrations CI/CD, webhooks)
- Priorité: **Haute** (nouveau type de hook, absent du guide, pertinent pour intégrations enterprise)
- Config minimal documentée:
```json
{ "type": "http", "url": "https://...", "allowedEnvVars": ["MY_TOKEN"] }
```
**3. Haiku 3 API retirement → Section modèles**
- Fichier: `guide/ultimate-guide.md` (section modèles) + potentiellement dans la section entreprise/API
- Action: Note avec deadline `claude-3-haiku-20240307` → retirement 20/04/2026, migration vers `claude-haiku-4-5-20251001`
- Priorité: **Urgente** (deadline < 7 semaines au moment de l'évaluation)
### Items à rejeter (hors scope)
- Cowork plugins/scheduled tasks: audience non-dev, hors périmètre
- Acquisition Vercept: contextuel, pas d'impact technique sur CC
- DoW statements: politique/gouvernance, hors scope guide technique
- Opus 3 + Claude's Corner: anecdotique pour guide développeurs
---
## 🔥 Challenge (technical-writer)
**Points clés du challenge agent**:
- Score révisé à la baisse pour le rapport entier (3/5), mais 5/5 pour les items extraits
- **Avertissement principal**: la fiabilité de v2.1.63 était à vérifier — script `update-cc-releases.sh` a confirmé que la version est réelle avec le CHANGELOG officiel ✅
- HTTP hooks = item le plus intéressant, gap réel confirmé par grepai search
- **Haiku 3 deadline sous-priorisée** dans l'évaluation initiale — urgence réelle à 7 semaines
- Recommande exclusion explicite des 50% hors scope avec justification
**Score ajusté**: 4/5 maintenu (le challenge agent score 3/5 pour le rapport brut, mais 4/5 après extraction des items pertinents)
---
## ✅ Fact-Check
| Affirmation | Vérifiée | Source |
|-------------|----------|--------|
| v2.1.63 publiée le 27 fév 2026 | ✅ | CHANGELOG officiel via `./scripts/update-cc-releases.sh` |
| `/simplify` et `/batch` bundlées dans 2.1.63 | ✅ | CHANGELOG officiel: "Added /simplify and /batch bundled slash commands" |
| HTTP hooks dans v2.1.63 | ✅ | CHANGELOG officiel: "Added HTTP hooks, which can POST JSON to a URL and receive JSON" |
| Worktree config sharing dans v2.1.63 | ✅ | CHANGELOG officiel: "Project configs & auto memory now shared across git worktrees" |
| `ENABLE_CLAUDEAI_MCP_SERVERS` env var | ✅ | CHANGELOG officiel |
| Memory leak fixes (liste longue) | ✅ | CHANGELOG officiel (12+ fixes distincts) |
| "Task tool replaced by Agent tool" | ❌ | NON présent dans le CHANGELOG v2.1.63 — info probablement fausse ou mal attribuée par la source Reddit |
| Haiku 3 retirement le 20 avril 2026 | ⚠️ | Sourced depuis docs officielles platform.claude.com — non re-vérifié directement ici |
| Python SDK v0.72.0 dernière version | ⚠️ | Suspect (date octobre 2025) — SDK a probablement évolué depuis |
| Acquisition Vercept (24 fév 2026) | ⚠️ | Multi-sources presse (Forbes, MLQ, TechCrunch) — vraisemblable mais pas vérifié blog officiel |
**Corrections apportées**:
- "Task tool replaced by Agent tool" retiré du plan d'intégration (non confirmé CHANGELOG officiel)
- Python SDK info ignorée (non pertinente pour le guide + données potentiellement obsolètes)
---
## 🎯 Décision finale
- **Score final**: 4/5
- **Action**: Intégrer (3 items ciblés: v2.1.63 tracking, HTTP hooks section, Haiku 3 deadline)
- **Confiance**: Haute pour items CC (CHANGELOG officiel vérifié) / Moyenne pour model deprecations
### Prochaines actions prioritaires
1. `./scripts/update-cc-releases.sh` → intégrer v2.1.60 à 2.1.63 dans le YAML + MD
2. Section HTTP hooks dans `guide/ultimate-guide.md` §7 (Hooks)
3. Note urgente Haiku 3 retirement (20/04/2026) dans section modèles
---
*Évaluation réalisée le 2026-03-02 | Claude Sonnet 4.6 | Challenge: technical-writer agent*