feat: threat-db v2.4.0 + MCP guide section + resource evals + ci

## threat-db v2.4.0
- CVE-2026-27735: path traversal in mcp-server-git git_add (CVSS 6.4)
- Campaign: Clinejection (Cline CLI 2.3.0 supply chain, 4000 downloads)
- T012: AI Recommendation Poisoning (Microsoft research, 50+ prompts)
- 3 new sources (NVD, Snyk, Microsoft Security Blog, Hacker News)

## guide/ultimate-guide.md
- New section "This Guide as an MCP Server" (§10) — installation,
  tools list, dev mode, usage examples, slash commands

## docs/resource-evaluations
- eval #070: claude-code-best-practice .claude/ config (score 4/5)
- eval #071: Steven Ge technical writing workflow (score TBD)
- eval #072: Rippletide AI reliability platform (score 2/5, watch only)
- 2026-02-26: boristane SDLC dead post evaluation
- README: count 60→72 evals, add #072 entry

## ci + config
- .github/workflows/trigger-landing-deploy.yml — auto-trigger landing
  rebuild on push to main (guide content changes)
- .gitignore: add .claude/agents/ exception + mcp-server/dist/ ignore

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
This commit is contained in:
Florian BRUNIAUX 2026-02-28 21:35:03 +01:00
parent 314f872f1f
commit 155b07a589
9 changed files with 594 additions and 6 deletions

View file

@ -0,0 +1,105 @@
# Resource Evaluation: `.claude/` Config — `shanraisshan/claude-code-best-practice`
**Date**: 2026-02-26
**Evaluator**: Claude (Sonnet 4.6)
**Source**: Repo cloné localement (analyse directe)
**Path**: `/Users/florianbruniaux/Sites/perso/claude-code-best-practice/.claude/`
**Type**: Configuration de référence (agents, skills, commands, hooks, settings)
---
## Summary
Configuration `.claude/` exemplaire d'un repo de best practices Claude Code. 2 agents, 6 skills (dont 3 "presentation" auto-évolutives), 1 command, 1 système de hooks Python centralisé couvrant 16 événements, et un `settings.json` avec personnalisations avancées.
Points clés:
- **Pattern "self-evolving agent"**: `presentation-curator` met à jour ses propres skills après chaque exécution (Step 5 dans le prompt)
- **Architecture Command → Agent → Skills**: `/weather-orchestrator` → agent `weather` → skills préchargées, pattern nommé et complet
- **Hook architecture centralisée**: 1 script Python pour 16 événements + config layering shared/local JSON
- **`allowed-tools: Bash(agent-browser:*)`**: wildcard scoping d'outil pour skill — pattern plus avancé que le format space-delimited documenté
- **Settings avancés**: `spinnerVerbs` (mode replace), `spinnerTipsOverride` (`excludeDefault:true`), `plansDirectory`, `enableAllProjectMcpServers`
---
## Evaluation Scoring
| Criterion | Score | Notes |
|-----------|-------|-------|
| **Relevance** | 5/5 | Configuration Claude Code réelle, patterns avancés non documentés |
| **Originality** | 5/5 | Self-evolving agent = pattern inédit dans notre guide |
| **Authority** | 3/5 | Repo communautaire (non Anthropic), mais patterns vérifiables |
| **Accuracy** | 4/5 | Patterns fonctionnels (vérifiables), settings vérifiés contre releases.md |
| **Actionability** | 5/5 | Code directement intégrable comme exemples dans le guide |
**Overall Score**: **4/5 (High Value)**
---
## Gap Analysis
### Absents du guide (`ultimate-guide.md`)
| Pattern | Gap Level | Localisation actuelle |
|---------|-----------|-----------------------|
| Self-evolving agent (agent met à jour ses skills) | HIGH — pattern inédit | Absent |
| Command → Agent → Skills (nommé + exemplifié) | MEDIUM — pattern implicite seulement | Absent comme pattern nommé |
| `allowed-tools: Bash(tool:*)` wildcard dans skills | HIGH — seul format space-delimited documenté | `guide/ultimate-guide.md:6343` |
| `spinnerVerbs` + `spinnerTipsOverride` + `excludeDefault` | MEDIUM — dans releases.md seulement | `guide/claude-code-releases.md:323` |
| Hooks: 1 script Python central + config layering | MEDIUM — hooks de base couverts, pas ce pattern | Absent |
| `plansDirectory` | LOW — dans releases.md seulement | `guide/claude-code-releases.md:110` |
| `enableAllProjectMcpServers` | LOW | Absent |
### Déjà couverts dans le guide
| Pattern | Localisation |
|---------|-------------|
| `memory: project/user/local` | `ultimate-guide.md:5646` (corrigé dans eval 069) |
| `isolation: worktree` | `ultimate-guide.md:14277` |
| `background: true` | `ultimate-guide.md:5798` |
| Skills `context: fork` | Sections agents/skills |
| Hooks basiques (PreToolUse, PostToolUse) | Section hooks |
---
## Recommendations
**Priorité 1 — High**: Documenter le pattern "Self-Evolving Agent"
- Où: `guide/ultimate-guide.md` section agents (~ligne 5800)
- Comment: Nouveau sous-pattern avec exemple `presentation-curator` (Step 5 du prompt)
- Valeur: Pattern inédit qui différencie notre guide
**Priorité 2 — High**: Documenter `allowed-tools: Bash(tool:*)` wildcard pour skills
- Où: `guide/ultimate-guide.md:6343` (section allowed-tools skills)
- Comment: Ajouter syntaxe wildcard + exemple `agent-browser`
- Note: Plus puissant que space-delimited, permet scoping granulaire
**Priorité 3 — Medium**: Nommer et documenter "Command → Agent → Skills"
- Où: Section architecture / workflows agents
- Comment: Ajouter le pattern comme archetype nommé avec diagramme
**Priorité 4 — Low**: Compléter settings dans ultimate-guide
- `spinnerVerbs` avec mode replace/add + `excludeDefault`
- `plansDirectory` avec exemple
- `enableAllProjectMcpServers`
---
## Fact-Check
| Affirmation | Vérifiée | Source |
|-------------|----------|--------|
| `spinnerVerbs` avec `mode: replace` est un setting officiel | ✅ | `guide/claude-code-releases.md:323` |
| `plansDirectory` est un setting officiel | ✅ | `guide/claude-code-releases.md:110` |
| 16 hook events officiels | ✅ | `examples/hooks/README.md`, HOOKS-README |
| `allowed-tools` supporte la syntaxe wildcard `Bash(tool:*)` | ✅ | `code.claude.com/docs/en/skills` (official) |
| Self-evolving agent pattern (agent met à jour ses skills) | ✅ | Code présent dans `presentation-curator.md` Step 5 |
**Corrections**: Aucune — tous les patterns sont vérifiables directement dans les fichiers.
---
## Decision
- **Score final**: 4/5 (High Value)
- **Action**: Intégrer — 2 patterns à haute valeur ajoutée (self-evolving agent + allowed-tools wildcard)
- **Confiance**: Haute

View file

@ -0,0 +1,114 @@
# Resource Evaluation #071 — Steven Ge: Claude Code for Technical Writing
**Source:** [LinkedIn Post](https://www.linkedin.com/posts/steven-ge-ab016947_i-started-using-claude-code-for-technical-activity-7432831185392816129-ARa8?utm_source=share&utm_medium=member_desktop&rcm=ACoAABGhhKgBLYdSS8KjqEyTSCUE4m21LrNR0_I)
**Author:** Steven Ge (14.6K followers, academic/technical writer and educator)
**Date:** 2026-02-26 (edited 2026-02-27)
**Engagement:** 177 likes, 15 comments
**Evaluated:** 2026-02-28
**Type:** LinkedIn post — 12-step workflow walkthrough
---
## 📄 Résumé du contenu
- Workflow de 12 étapes pour rédiger des manuscrits, rapports et matériaux pédagogiques avec Claude Code en traitant l'écriture comme un projet de code
- Stack complet: Claude Code + CLAUDE.md + GitHub + VS Code + Obsidian + Grammarly + Word
- Principe central: drafts en Markdown, version control Git, rendu Word en fin de processus — "Treat writing like a coding project"
- Philosophie de responsabilité humaine: "You become the architect. Your work is thinking, structuring, and revising. Claude is the assistant." Les sections critiques sont rédigées manuellement avant refinement par Claude
- Résultats déclarés: rapport technique, manuscrit et série de tutoriels complétés avec disclosure IA explicite dans toutes les publications
- **Fait notable**: utilise CLAUDE.md pour définir goals, scope et writing specifications du projet — usage d'une feature Claude Code spécifique
---
## 🎯 Score de pertinence
| Score | Signification |
|-------|---------------|
| 5 | Essentiel — Gap majeur dans le guide |
| 4 | Très pertinent — Amélioration significative |
| **3** | **Pertinent — Complément utile** |
| 2 | Marginal — Info secondaire |
| 1 | Hors scope — Non pertinent |
**Score final: 3/5**
**Justification:** Le workflow de Steven Ge a été initialement évalué à 2/5 (mauvais ciblage audience), mais le challenge a révélé deux éléments sous-estimés: (1) l'usage de CLAUDE.md est une feature Claude Code spécifique, ce qui ancre le workflow dans le CLI et pas seulement Claude.ai, et (2) les développeurs qui produisent de la documentation technique (ADR, API docs, whitepapers, READMEs, runbooks) constituent une sous-audience réelle non couverte par le guide actuel. Le workflow Git + Markdown + CLI est aligné avec la philosophie du guide. Aucune métrique d'efficacité quantifiée — le workflow reste "expérimental" selon l'auteur lui-même.
---
## ⚖️ Comparatif
| Aspect | Cette ressource | Notre guide |
|--------|----------------|-------------|
| CLAUDE.md pour projets writing | ✅ Workflow détaillé (goals, scope, specs) | ✅ Documenté en général, pas pour writing |
| Git + Markdown pour documentation | ✅ 12 étapes détaillées | ❌ Non couvert (coding projects uniquement) |
| Workflow "docs-as-code" pour devs | ✅ Applicable aux tech writers/leads | ❌ Absent du guide |
| Features avancées (MCP, hooks, agents) | ❌ Non utilisées | ✅ Extensivement couvert |
| Non-développeurs / knowledge workers | ✅ Cible principale | ➡️ Redirigé vers Cowork Guide |
| Métriques d'efficacité | ❌ Aucun chiffre vérifiable | ✅ Stats documentées avec sources |
---
## 📍 Recommandations
**Action: Intégration conditionnelle (score 3 = quand temps disponible)**
1. **Où documenter**: `guide/ultimate-guide.md` — section "Real-World Use Cases" ou "Workflows for Technical Writers"
2. **Comment intégrer**: Mention du workflow comme exemple de "docs-as-code" avec Claude Code, en insistant sur l'usage de CLAUDE.md pour les projets d'écriture. Ne pas reproduire les 12 étapes en détail (trop verbeux) — synthèse en 4-5 principes clés avec attribution et lien
3. **Angle d'intégration**: "Beyond Code: Using Claude Code for Technical Documentation" — pour les devs qui écrivent (docs produit, ADR, guides d'architecture)
4. **Priorité**: Basse — gap réel mais audience secondaire pour ce guide. À intégrer dans une prochaine passe sur les use cases non-traditionnels
**Ce qu'il ne faut PAS faire:**
- Ne pas créer une section dédiée à l'écriture académique (hors scope du guide)
- Ne pas présenter ce workflow comme applicable aux non-développeurs (c'est le rôle du Cowork Guide)
---
## 🔥 Challenge (technical-writer)
**Score initial proposé:** 2/5
**Score après challenge:** 3/5 ⬆️
**Points manqués dans l'évaluation initiale:**
1. **CLAUDE.md usage** — Élément clé ignoré initialement. L'auteur utilise CLAUDE.md pour définir project goals, scope, et writing specs. C'est une feature Claude Code CLI spécifique, pas remplaçable par Claude.ai
2. **Sous-audience "devs qui écrivent"** — Les développeurs produisent régulièrement de la documentation technique (ADR, API docs, whitepapers, runbooks). Ce workflow leur est directement applicable
3. **Git + Markdown alignment** — Le workflow s'aligne avec la philosophie du guide (Git workflows, version control, CLI-first)
4. **Erreur de scoring comparative** — La distinction "academic writer ≠ cible du guide" est vraie pour 90% du contenu, mais le workflow Git + CLAUDE.md dépasse cette catégorisation
**Risques de non-intégration:**
- Le guide rate la sous-audience "tech documentation writers" (DevOps, Engineering leads, Architects)
- Précédent: rejeter tout workflow writing-related sans analyser l'applicabilité réelle aux devs
- Gap: "docs-as-code avec Claude Code" n'est documenté nulle part dans le guide
**Critique brutale:**
> "Tu substitues 'audience' à 'applicabilité'. Steven cible des academic writers, mais son workflow Git + Markdown + CLAUDE.md est directement utilisable par des devs qui font de la documentation. La distinction est fine mais réelle."
---
## ✅ Fact-Check
| Affirmation | Vérifiée | Source |
|-------------|----------|--------|
| Auteur: Steven Ge, academic/technical writer | ✅ | Profil LinkedIn |
| 14.6K followers | ✅ | Page LinkedIn |
| Date: 2026-02-26, édité 2026-02-27 | ✅ | Métadonnées post |
| 177 likes, 15 comments | ✅ | WebFetch direct |
| Stack: Claude Code + GitHub + VS Code + Obsidian + Grammarly + Word | ✅ | Contenu du post |
| Usage de CLAUDE.md pour writing specs | ✅ | WebFetch confirmé |
| 3 outputs complétés (rapport, manuscrit, tutoriels) | ✅ | Post, sans dates/délais précis |
| Aucun chiffre d'efficacité (%, x fois) | ✅ | Post dit "experimental", pas de benchmarks |
| MCP/hooks/agents/custom commands utilisés | ❌ Non mentionnés | WebFetch confirme absence |
**Corrections apportées:**
- Score initial 2/5 → 3/5 après discovery du CLAUDE.md usage et re-analyse audience
- Aucune hallucination de chiffres détectée — le post ne prétend pas à des gains d'efficacité quantifiés
---
## 🎯 Décision finale
- **Score final**: 3/5
- **Action**: Intégrer (priorité basse) — synthèse en 4-5 principes dans une section "docs-as-code" ou "beyond code workflows"
- **Confiance**: Haute (fact-check complet, sources vérifiées, pas de chiffres non vérifiables)
- **Audience cible dans le guide**: Développeurs qui produisent de la documentation technique, pas les academic writers en général

View file

@ -0,0 +1,112 @@
# Resource Evaluation #072 — Rippletide: AI Reliability Platform
**Source:** [Rippletide Documentation](https://rippletide.com) / [llms-full.txt](https://rippletide.com/llms-full.txt)
**Type:** Documentation officielle — plateforme SaaS (eval, mémoire persistante, raisonnement déterministe)
**Evaluated:** 2026-02-28
---
## 📄 Résumé du contenu
Rippletide est une plateforme de fiabilité IA articulée autour de trois piliers:
1. **Eval** — Détection d'hallucinations, CLI installable via `npx rippletide`, intégration CI/CD, knowledge sources (fichiers locaux, Pinecone, PostgreSQL)
2. **Context Graph** — Mémoire persistante cross-session exposée via MCP server (7 outils, 4 ressources), compatible Claude Code, Claude Desktop, Cursor et VS Code
3. **Decision Runtime** — Raisonnement déterministe via hypergraph (Q&A structurés, tags, actions, state predicates), claim interne: "<1% d'hallucinations"
**Points d'intégration avec Claude Code:**
- Config `.mcp.json` documentée pour brancher le MCP server Rippletide
- Self-hosted possible (Node.js >= 18, déploiement Railway one-click)
- LangChain integration (drop-in LLM)
- Amazon Bedrock connector disponible
---
## 🎯 Score de pertinence
| Score | Signification |
|-------|---------------|
| 5 | Essentiel — Gap majeur dans le guide |
| 4 | Très pertinent — Amélioration significative |
| 3 | Pertinent — Complément utile |
| **2** | **Marginal — Info secondaire** |
| 1 | Hors scope — Non pertinent |
**Score final: 2/5**
**Justification:** Rippletide couvre un use case réel (mémoire persistante cross-session via MCP) mais reste un produit SaaS tiers sans adoption communautaire visible. Le guide documente déjà les MCP servers en détail et liste les patterns d'intégration. Rippletide serait au mieux une mention dans une liste de serveurs MCP tiers disponibles, pas un sujet à part entière. Claims de performance non vérifiables ("<1% hallucinations", "85% 96% resolution rate") sans méthodologie publiée. Pricing non documenté. Pas de GitHub stars ni metrics Discord mentionnés.
---
## ⚖️ Comparatif
| Aspect | Cette ressource | Notre guide |
|--------|----------------|-------------|
| MCP server pour mémoire persistante | ✅ Documenté (7 outils, 4 resources) | ✅ Pattern MCP couvert, serveurs tiers listés |
| Config `.mcp.json` Claude Code | ✅ Exemple documenté | ✅ Documenté extensivement |
| Eval hallucinations + CI/CD | ✅ CLI npm + pipeline | ❌ Absent (testing LLM outputs non couvert) |
| Self-hosted AI reliability | ✅ Railway one-click | ❌ Non couvert |
| Claims performance vérifiables | ❌ Marketing sans méthodologie | ✅ Stats documentées avec sources |
| Adoption / communauté | ❌ Aucune métrique | ✅ Ressources avec engagement mesurable |
---
## 📍 Recommandations
**Action: Ne pas intégrer (score 2 = mention minimale ou watch only)**
1. **Pourquoi pas d'intégration directe**: Le guide couvre déjà les MCP servers et les patterns d'intégration. Ajouter Rippletide n'apporterait pas de valeur nette par rapport au contenu existant — ce serait une liste de serveurs tiers, pas un concept enseignable
2. **Exception possible**: Si Rippletide gagne en adoption et publie des benchmarks vérifiables, l'angle "eval CLI pour CI/CD" (pilier 1) devient pertinent pour la section testing/qualité du guide
3. **Point positif à retenir**: Le `llms.txt` de Rippletide est un bon exemple de documentation structurée pour LLM consumption, pertinent pour la section machine-readable du guide
**Ce qu'il ne faut PAS faire:**
- Ne pas citer les claims de performance sans source vérifiable
- Ne pas créer une section dédiée aux plateformes de fiabilité IA tierces (trop large, hors scope)
---
## 🔥 Challenge (technical-writer)
**Score initial proposé:** 2/5
**Score après challenge:** 2/5 (maintenu)
**Arguments pour augmenter le score:**
1. **MCP server natif** — Rippletide expose un vrai MCP server avec 7 outils documentés, compatible Claude Code. C'est concret, pas juste marketing
2. **Eval CLI unique**`npx rippletide` pour détecter les hallucinations en CI/CD est un use case absent du guide. Gap réel
3. **llms.txt exemplaire** — Documentation structurée pour LLM consumption, valeur pour la section machine-readable
**Pourquoi le score reste 2/5:**
- L'angle MCP est couvert: le guide documente les patterns MCP, pas les serveurs individuels. Lister Rippletide dans une liste de serveurs tiers n'apporte pas de contenu enseignable
- L'angle eval CI/CD est potentiellement intéressant mais la source est le marketing d'un produit commercial sans validation externe. Citer un claim "<1% hallucinations" sans méthodologie publiée serait une erreur factuelle par association
- Le llms.txt peut être noté comme exemple de bonne pratique, mais c'est une mention marginale dans une section existante, pas un nouveau contenu
**Critique constructive:**
> "L'angle eval CLI est le seul gap réel. Mais baser une section du guide sur les claims marketing d'un SaaS sans traction visible serait une erreur. Si Rippletide publie des benchmarks ou atteint une adoption mesurable, réévaluer."
---
## ✅ Fact-Check
| Affirmation | Vérifiée | Source |
|-------------|----------|--------|
| MCP server avec 7 outils et 4 resources | ✅ | llms-full.txt (liste explicite) |
| Config `.mcp.json` documentée | ✅ | llms-full.txt (exemple de config) |
| CLI via `npx rippletide` | ✅ | llms-full.txt (setup instructions) |
| Compatible Claude Code, Desktop, Cursor, VS Code | ✅ | llms-full.txt (liste clients) |
| Self-hosted Node.js >= 18 + Railway | ✅ | llms-full.txt (self-hosting section) |
| LangChain drop-in + Amazon Bedrock | ✅ | llms-full.txt (integrations) |
| "<1% hallucinations" | | Claim interne, aucune méthodologie publiée |
| "85% → 96% resolution rate" | ⚠️ | Claim interne, contexte non précisé |
| Pricing documenté | ❌ | Absent du llms-full.txt |
| GitHub stars / Discord metrics | ❌ | Non mentionnés |
---
## 🎯 Décision finale
- **Score final**: 2/5
- **Action**: Watch only — mention minimale possible si Rippletide gagne en traction ou publie des benchmarks
- **Confiance**: Haute (fact-check complet, claims non vérifiables clairement identifiés)
- **Seule intégration justifiable**: Note dans la section machine-readable/llms.txt du guide citant Rippletide comme exemple de documentation bien structurée pour LLM consumption

View file

@ -0,0 +1,80 @@
# Évaluation: "The Software Development Lifecycle Is Dead" — Boris Tane
**Source**: https://boristane.com/blog/the-software-development-lifecycle-is-dead/
**Type**: Blog post (conceptuel, opinion)
**Auteur**: Boris Tane (CTO co-fondateur, Highlight.io)
**Date évaluation**: 2026-02-26
**Évaluateur**: Claude Sonnet 4.6
**Reviewer**: technical-writer agent (challenge)
---
## Score final: 2/5 — Ne pas intégrer
**Décision**: Watch only. Réévaluer si l'auteur publie des métriques de production.
---
## Résumé du contenu
- **Thèse**: L'SDLC traditionnel est obsolète avec les agents IA, qui compressent tout en une boucle: "Intent → Agent → Code + Tests + Déployé → Ça marche ? → Itérer ou shipper."
- **Ingénieurs AI-native**: Ceux qui ont commencé post-Cursor n'ont jamais connu sprint planning, story points ou PR reviews et bâtissent quand même des produits.
- **Chaque phase se transforme**: Requirements = itératif, Design = découvert en collaboration avec l'agent, Testing = simultané à la génération, Code Review = à repenser de zéro.
- **Observabilité = tissu conjonctif**: Pas une étape finale mais le mécanisme de feedback permettant aux agents de détecter et corriger les régressions de façon autonome.
- **Avantage compétitif = context engineering**: Fournir un contexte de qualité aux agents plutôt que maîtriser des processus et cérémonies.
**Données/métriques**: Aucune. Article purement conceptuel.
---
## Comparatif vs guide existant
| Aspect | Cet article | Guide actuel |
|--------|-------------|-------------|
| Context engineering | ✅ Évoqué (conceptuel) | ✅ Présent, mieux sourcé (ArXiv, Anthropic Engineering, lignes 1732, 13375, 18333) |
| Agentic workflows | ✅ Couvert | ✅ Documenté avec patterns concrets |
| Observabilité comme feedback | Angle intéressant | ✅ `guide/observability.md` existe |
| PR review avec agents | ✅ Challenge le status quo | ✅ Guide recommande PR auto-review via GitHub Actions |
| Data/métriques | ❌ Aucune | ✅ Guide cite métriques validées (Fountain, CRED) |
| Pattern actionnable | ❌ Conceptuel uniquement | ✅ Templates concrets disponibles |
---
## Raisons du rejet
1. **Zéro donnée empirique**: Claims non vérifiables, aucune métrique de production. "The SDLC is dead" est un claim extraordinaire présenté sans evidence.
2. **Concepts déjà couverts**: "Context engineering" et "observability feedback loop" documentés depuis de meilleures sources. Intégrer cet article ajouterait une source faible sur un sujet déjà solide.
3. **Conflit d'intérêt potentiel**: Tane est CTO de Highlight.io, plateforme d'observabilité. Le claim "abandonner les PR reviews" favorise directement son produit (plus d'erreurs en prod = plus de valeur pour l'observabilité). Ce biais source n'est pas signalé dans l'article.
4. **Risque de non-intégration = quasi nul**: La narrative "SDLC is dead" est omniprésente. Le guide n'a pas besoin d'un énième think-piece sans données.
---
## Challenge (technical-writer agent)
Score abaissé de 3/5 à 2/5 sur la base de:
- Conflit d'intérêt de l'auteur non identifié initialement (CTO observabilité qui recommande de supprimer les gates humains)
- Comparaison défavorable avec "Boris Tane — How I use Claude Code" (4/5): cet article-là documentait un pattern concret reproductible (Annotation Cycle). Celui-ci ne propose rien d'actionnable.
- "Watch only. Revisiter si Tane publie des données ou qu'un second praticien indépendant corrobore l'abandon des PR reviews avec des résultats mesurables."
---
## Fact-check
| Affirmation | Vérifiée | Source |
|-------------|----------|--------|
| Boris Tane = auteur | ✅ | URL + byline boristane.com |
| Highlight.io = plateforme observabilité | ✅ | Identifiable depuis le blog |
| Aucune stat/métrique dans l'article | ✅ | Assumé par l'article lui-même |
| "Context engineering" déjà couvert dans guide | ✅ | ultimate-guide.md lignes 1732, 13375, 15008, 18333 |
| Guide a un PR auto-review GitHub Actions | ✅ | `examples/github-actions/claude-pr-auto-review.yml` |
Aucune hallucination détectée. L'absence de stats dans l'article est elle-même un signal de faiblesse.
---
## Si réévaluation future
Conditions pour repasser à 3-4/5:
- Publication de métriques concrètes (coût, vélocité, taux de défauts en prod après abandon des PR reviews)
- Corroboration indépendante du claim "abandon PR workflows" par un praticien sans conflit d'intérêt
- Étude de cas avec before/after mesurable

View file

@ -68,6 +68,7 @@ Les documents de travail bruts (prompts Perplexity, audits clients) restent dans
| **Snyk ToxicSkills** (Supply Chain Audit) | 4/5 | **4/5** | ✅ Intégré (security-hardening.md §1.1, §1.2, §1.5) | [snyk-toxicskills-evaluation.md](./snyk-toxicskills-evaluation.md) |
| **System Prompts Opus 4.6** (Official Update) | 2/5 | **2/5** | ⚠️ Watch only (2nd eval, same URL, already covered) | [system-prompts-opus-4-6-update.md](./system-prompts-opus-4-6-update.md) |
| **qmd Token Savings** (Simone Ruggiero, Medium) | 2/5 | **2/5** | ❌ Ne pas intégrer (redundant avec grepai, claims non vérifiables) | [2026-02-14-simone-ruggiero-qmd-token-savings-medium.md](./2026-02-14-simone-ruggiero-qmd-token-savings-medium.md) |
| **Rippletide** (AI Reliability Platform) | 2/5 | **2/5** | ⚠️ Watch only (MCP server tiers, claims non vérifiables, pas de traction) | [072-rippletide-ai-reliability-platform.md](./072-rippletide-ai-reliability-platform.md) |
## Watch List
@ -75,4 +76,4 @@ Ressources surveillées mais pas encore intégrées : [watch-list.md](./watch-li
---
**Dernier update**: 2026-02-14 (60 évaluations)
**Dernier update**: 2026-02-28 (72 évaluations)