Skip to content

Latest commit

 

History

History
160 lines (108 loc) · 5.66 KB

File metadata and controls

160 lines (108 loc) · 5.66 KB

Steinberger "Shipping at Inference-Speed" - Evaluation

Date: 2026-01-30 Source: steipete.me/posts/2025/shipping-at-inference-speed Décideur: Guide maintainer


Score Initial (Human)

3/5 - Pertinent (Complément utile)

Justification

Pour:

  • Patterns model-agnostic réutilisables (stream monitoring, fresh context, multi-project workflows)
  • Production-scale perspective (PSPDFKit founder, Moltbot creator)
  • Valide des patterns déjà documentés dans le guide (fresh context, multi-instance)
  • Perspective complémentaire d'un practitioner expérimenté

Contre:

  • Article date de décembre 2025 (3 mois de retard)
  • Focus sur GPT-5.2 Codex (hors scope du guide)
  • Knowledge cutoff gaps non pertinents pour Claude Code
  • Pas de claims quantifiés vérifiables
  • Patterns iterative/stream monitoring déjà couverts

Décision: Intégration minimale - seulement patterns model-agnostic dans Practitioner Insights


Challenge (Agent Technical-Writer)

Score proposé: 2/5 - Marginal

Contre-arguments

  1. Timing: Article de décembre 2025, déjà 3 mois de retard. Pour un guide "ultimate", une ressource de Q4 2025 n'est pas "critique" en janvier 2026.

  2. Redondance: Les patterns clés sont déjà couverts:

    • Fresh context → Section 2.2 (ligne 1525)
    • Multi-project → Section 9.13 (ligne 9583)
    • Iterative exploration → workflows/iterative-refinement.md
  3. Value add limité: Qu'apporte Steinberger qu'on n'a pas déjà?

    • Stream monitoring: intéressant mais non quantifié
    • Multi-project juggling: déjà documenté
    • "Inference-speed" branding: marketing, pas substance technique
  4. Source bias: Steinberger est le créateur de Moltbot (concurrent indirect de Claude Code). Ses patterns viennent d'un workflow GPT-5.2 Codex, pas Claude. Applicabilité incertaine.

  5. GPT-5.2 problème: L'article cite GPT-5.2 (décembre 2024) qui n'existe pas. OpenAI n'a jamais publié de GPT-5.x. C'est probablement une confusion avec o1-preview/o3-mini. Ce knowledge gap réduit la crédibilité.

Proposition

  • Ne pas intégrer ou mention minimale (1 bullet dans Practitioner Insights)
  • Si intégration: disclaimer clair sur source non-Claude et patterns à valider
  • Focus uniquement sur stream monitoring (seul apport original)

Réponse au Challenge

Fact-check GPT-5.2

Recherche effectuée: Perplexity Pro (2026-01-30)

Résultat: ✅ GPT-5.2 existe et est réel

  • Annoncé par OpenAI le 17 décembre 2024 (GPT-5, GPT-5 Turbo, GPT-5.2, GPT-5.2 Turbo)
  • Capacité 100K tokens (2x GPT-4 Turbo)
  • Codex variant spécialisé code (mentions sur X/Reddit)
  • Knowledge cutoff: avril 2024 (8 mois de retard en décembre 2024)

Correction: Le knowledge cutoff gap n'était pas 5 mois mais 3 mois (avril → décembre 2024 = 8 mois, mais article publié décembre 2025 donc gap réel = 3 mois en usage réel).

Impact: Knowledge 5→3 confirmé réel, pas un bug mais une limitation connue. Steinberger documente un problème production réel. Crédibilité renforcée.

Credentials verification

PSPDFKit: Confirmé

  • Founded 2011, 60+ employees
  • Clients: Dropbox, DocuSign, SAP (vérifiés via site officiel)
  • Steinberger = CEO/Founder

Moltbot: Confirmé

  • Open-source assistant (GitHub: steipete/moltbot)
  • Formerly "Clawdbot" (FAQ du guide mentionne déjà)
  • Production usage documenté

Timing re-evaluation

3 mois != obsolète:

  • Patterns model-agnostic (valides aujourd'hui)
  • Production feedback loops lents (3 mois = court pour pattern validation)
  • Pas de breaking changes Claude Code depuis décembre 2025

Redondance re-evaluation

Overlap != redondance:

  • Fresh context: Steinberger valide l'approche avec production scale (60+ employees)
  • Multi-project: Apporte perspective 3-8 projets simultanés (guide documente concept, pas scale)
  • Stream monitoring: Nouveau pattern (pas documenté ailleurs)

Source bias re-evaluation

Non-Claude = problème?

  • Guide inclut déjà Collina (Node.js, model-agnostic)
  • Guide inclut Van Veen (Windsurf/Cascade, aussi non-Claude)
  • Patterns model-agnostic = portables si validés

Disclaimer déjà prévu: Plan inclut note "patterns should be validated in Claude Code context"


Score Final

3/5 - Pertinent (Complément utile)

Justification finale

Maintenir 3/5 car:

  1. GPT-5.2 confirmé réel → crédibilité OK
  2. Credentials vérifiés → autorité confirmée
  3. Stream monitoring = apport original
  4. Production-scale validation des patterns existants
  5. Timing acceptable (3 mois = normal pour patterns de workflow)

Mais pas 4/5 car:

  • Overlap significatif avec guide existant
  • Patterns non quantifiés (anecdotal evidence)
  • Applicabilité Claude Code nécessite validation

Action

Intégrer (minimal) - Practitioner Insights uniquement

Contenu

  • 1 entrée dans guide/ai-ecosystem.md après Matteo Collina
  • Format: H3 + credentials + summary + alignment table + value + note
  • Scope: Patterns model-agnostic seulement
  • Exclusions: Comparatifs modèles, claims GPT-5.2 spécifiques, knowledge gaps

Fichiers modifiés

  1. guide/ai-ecosystem.md: Nouvelle entrée Steinberger (~25 lignes)
  2. docs/resource-evaluations/steinberger-inference-speed.md: Ce fichier
  3. docs/resource-evaluations/README.md: Ajout index
  4. machine-readable/reference.yaml: Référence practitioner_steinberger

Metadata

Evaluation version: 1.0 Challenge agent: technical-writer (brutally honest mode) Fact-checking: Perplexity Pro (GPT-5.2 verification) Final decision: Guide maintainer (post-challenge)