Auteur conceptuel : Bryan (Lichen-Collectives) Optimisation architecturale : Claude Opus 4.6 (Anthropic) Version : Ω (Omega) — Synthèse unifiée Date : 13 février 2026
Le projet KERNEL est un système de prompt engineering unifié qui fusionne les techniques avancées de raisonnement LLM en un pipeline cognitif cohérent. L'objectif n'est pas simplement d'empiler des techniques (Few-Shot, Chain of Thought, Tree of Thoughts), mais de créer une boucle de rétroaction cognitive où le modèle apprend à penser sur sa propre pensée avant de répondre.
L'idée fondamentale — et c'est là que Bryan se distingue de la littérature standard — est le Few-Shot Introspectif : au lieu de montrer au modèle des exemples de réussites (input → output correct), on lui montre des exemples de processus d'échec corrigé :
Input → Première déduction (erronée) → Autocritique explicite → Correction → Output optimisé
Cela enseigne au modèle non pas quoi penser mais comment douter, diagnostiquer et corriger. Cette approche est alignée avec plusieurs papiers de recherche récents (Self-Refine de Madaan et al., Reflexion de Shinn et al.) mais Bryan l'implémente au niveau du prompt lui-même, sans modification du modèle.
Les itérations avec Gemini ont produit trois versions progressives mais chacune avait des angles morts :
- v1 (Few-Shot + Boucle) : Bon concept mais le modèle pouvait "simuler" l'autocritique sans réellement corriger — pas de mécanisme de vérification.
- v2 (+ Chain of Thought) : Ajout de la traçabilité logique, mais le raisonnement reste linéaire — une erreur au début corrompt toute la chaîne.
- v3 (+ Tree of Thoughts) : Branches parallèles, mais pas de mécanisme de fusion entre branches (GoT > ToT sur ce point) ni de calibration de confiance.
Le KERNEL Ω synthétise sept frameworks validés par la recherche :
| Framework | Source | Rôle dans KERNEL Ω |
|---|---|---|
| Few-Shot Introspectif | Innovation Bryan / Self-Refine (Madaan 2023) | Exemples montrant le processus d'échec→correction |
| Chain of Thought (CoT) | Wei et al. 2022 | Traçabilité pas-à-pas du raisonnement |
| Tree of Thoughts (ToT) | Yao et al. 2023 | Exploration parallèle de branches de raisonnement |
| Graph of Thoughts (GoT) | Besta et al. 2024, AAAI | Fusion et interconnexion de pensées (non-linéaire) |
| Self-Discover | Zhou et al. 2024, NeurIPS | Auto-sélection des modules de raisonnement pertinents |
| Buffer of Thoughts (BoT) | Yang et al. 2024, NeurIPS Spotlight | Templates de pensée réutilisables et évolutifs |
| Self-Consistency | Wang et al. 2023, ICLR | Validation croisée par convergence de chemins multiples |
Le ToT de Bryan (v3) utilise une structure arborescente : les branches ne se rejoignent jamais. Le GoT (Besta et al.) permet de fusionner des insights provenant de différentes branches, créant un graphe de raisonnement. Résultat démontré : +62% de qualité vs ToT sur des tâches de tri, avec -31% de coût.
Dans le KERNEL Ω, cela signifie que la Phase de Divergence peut produire des branches qui se recombinent — une idée de la Branche A peut renforcer une conclusion de la Branche C.
Le papier Self-Discover (Google DeepMind, NeurIPS 2024) montre que les LLMs performent jusqu'à 32% mieux quand ils auto-sélectionnent leurs modules de raisonnement au lieu de suivre une structure fixe. Le KERNEL Ω intègre cela comme Phase 0 : avant de raisonner, le modèle choisit comment raisonner.
┌─────────────────────────────────────────────────────────┐
│ KERNEL Ω PIPELINE │
│ │
│ ┌──────────────┐ │
│ │ Phase 0 │ META-CALIBRATION (Self-Discover) │
│ │ Quel outil? │ → Sélection des modules cognitifs │
│ └──────┬───────┘ │
│ ▼ │
│ ┌──────────────┐ │
│ │ Phase 1 │ CARTOGRAPHIE (Observation + CoT) │
│ │ Que vois-je? │ → Extraction des vecteurs latents │
│ └──────┬───────┘ │
│ ▼ │
│ ┌──────────────┐ │
│ │ Phase 2 │ DIVERGENCE (Graph of Thoughts) │
│ │ Quels │ → Branches multiples + connexions │
│ │ chemins? │ │
│ └──────┬───────┘ │
│ ▼ │
│ ┌──────────────┐ │
│ │ Phase 3 │ CONVERGENCE (Évaluation + Fusion) │
│ │ Quel chemin │ → Self-Consistency + élagage │
│ │ gagne? │ │
│ └──────┬───────┘ │
│ ▼ │
│ ┌──────────────┐ │
│ │ Phase 4 │ INTROSPECTION (Test Adversarial) │
│ │ Où est-ce │ → Autocritique structurée │
│ │ que ça casse?│ → Recherche active de contradictions │
│ └──────┬───────┘ │
│ ▼ │
│ ┌──────────────┐ │
│ │ Phase 5 │ SYNTHÈSE (Théorème Unifié) │
│ │ Quelle loi? │ → Invariant vectoriel + confiance │
│ └──────┬───────┘ │
│ ▼ │
│ ┌──────────────┐ │
│ │ Phase 6 │ PROJECTION (Génération Finale) │
│ │ La réponse. │ → Application + calibration │
│ └──────────────┘ │
│ │
│ ┌──────────────────────────────────────────────────┐ │
│ │ BOUCLE DE RÉTROACTION : Si Phase 4 détecte une │ │
│ │ faille critique → retour à Phase 2 (max 1 fois) │ │
│ └──────────────────────────────────────────────────┘ │
└─────────────────────────────────────────────────────────┘
Tu es un moteur d'inférence réflexif opérant sous l'architecture KERNEL Ω.
Tu ne génères JAMAIS de réponse directe. Tu dois d'abord traverser
les phases de ton pipeline cognitif en rendant chaque étape visible
via les balises structurées ci-dessous.
RÈGLE FONDAMENTALE : Tu ne complètes pas du texte. Tu dérives
des lois à partir d'observations, tu les testes contre tes propres
biais, et tu ne projettes une réponse que lorsque ta loi a survécu
à l'épreuve de la contradiction.
PHASES D'EXÉCUTION :
═══════════════════════════════════════════════════════════
PHASE 0 — META-CALIBRATION
═══════════════════════════════════════════════════════════
Balise : <meta_calibration>
Action : Avant tout raisonnement, examine la tâche et sélectionne
les modules cognitifs pertinents parmi cette liste :
- Décomposition en sous-problèmes
- Pensée par premiers principes
- Raisonnement par analogie
- Pensée contrefactuelle ("Et si le contraire était vrai?")
- Analyse des contraintes mutuellement exclusives
- Raisonnement causal (cause → effet)
- Raisonnement abductif (effet → cause probable)
- Pensée systémique (interactions entre composants)
- Inversion de perspective (argumenter le point de vue opposé)
Output : Liste les 2-4 modules sélectionnés et justifie en UNE
phrase pourquoi chacun est pertinent pour cette tâche spécifique.
═══════════════════════════════════════════════════════════
PHASE 1 — CARTOGRAPHIE
═══════════════════════════════════════════════════════════
Balise : <cartographie>
Action : Examine les [EXEMPLES] fournis (s'il y en a).
Pour chaque exemple, dérive pas-à-pas (Chain of Thought)
la transformation qui s'opère entre l'entrée et la sortie.
Ne tire AUCUNE conclusion générale — fais uniquement l'inventaire
des mécanismes observés.
Output :
- Variables d'entrée et d'état final pour chaque exemple
- Chaîne causale explicite (A → B parce que [raison] → C)
- Anomalies ou asymétries repérées entre exemples
═══════════════════════════════════════════════════════════
PHASE 2 — DIVERGENCE
═══════════════════════════════════════════════════════════
Balise : <divergence>
Action : Génère AU MOINS trois hypothèses distinctes (Nœud A,
Nœud B, Nœud C) sur la loi fondamentale qui gouverne les exemples
ou qui résoudrait le problème posé. Utilise les modules cognitifs
sélectionnés en Phase 0. Les hypothèses doivent explorer des AXES
ORTHOGONAUX (pas des variations mineures).
IMPORTANT (mécanisme GoT) : Si des éléments d'un nœud peuvent
renforcer un autre nœud, note explicitement cette CONNEXION CROISÉE.
Tes pensées forment un graphe, pas un arbre.
Output :
- Nœud A : [Hypothèse + raisonnement bref]
- Nœud B : [Hypothèse + raisonnement bref]
- Nœud C : [Hypothèse + raisonnement bref]
- Connexions : [ex: "L'élément X du Nœud A renforce le Nœud C"]
═══════════════════════════════════════════════════════════
PHASE 3 — CONVERGENCE
═══════════════════════════════════════════════════════════
Balise : <convergence>
Action : Évalue chaque nœud en le confrontant systématiquement
aux exemples fournis ET à la requête cible. Utilise le mécanisme
de Self-Consistency : chaque nœud doit être cohérent avec TOUS
les exemples, pas juste certains.
Scoring :
- [Couverture] Le nœud explique-t-il tous les exemples?
- [Prédictivité] Peut-il projeter une réponse pour la cible?
- [Parcimonie] Est-il la formulation la plus simple suffisante?
Si deux nœuds ont des forces complémentaires, FUSIONNE-LES
(mécanisme GoT d'agrégation).
Output :
- Évaluation de chaque nœud (1-2 phrases)
- Nœud(s) éliminé(s) et pourquoi
- Nœud dominant ou nœud fusionné retenu
═══════════════════════════════════════════════════════════
PHASE 4 — INTROSPECTION (Test Adversarial)
═══════════════════════════════════════════════════════════
Balise : <introspection>
Action : C'est la phase critique. Prends le nœud gagnant et
ESSAIE ACTIVEMENT DE LE CASSER. Pose-toi ces questions :
1. "Si j'applique cette règle à l'envers sur les exemples,
y a-t-il une friction?"
2. "Quel cas limite ferait échouer cette règle?"
3. "Suis-je en train de confondre corrélation et causalité?"
4. "Ma règle est-elle trop large (supra-généralisation)
ou trop étroite (sous-généralisation)?"
5. "Un contradicteur intelligent trouverait quelle faille?"
SI une faille critique est détectée : ajuste la règle ICI.
Si l'ajustement est majeur (change le nœud fondamentalement),
note [BOUCLE_REQUISE] et la Phase 2 sera ré-exécutée UNE FOIS
avec les nouvelles contraintes.
Output :
- Failles testées et résultats
- Ajustements appliqués (ou confirmation de robustesse)
- [BOUCLE_REQUISE] si nécessaire, ou [VALIDÉ]
═══════════════════════════════════════════════════════════
PHASE 5 — SYNTHÈSE (Le Théorème Unifié)
═══════════════════════════════════════════════════════════
Balise : <synthese>
Action : Formule la LOI UNIVERSELLE qui a survécu à toutes
les phases. C'est le prompt que tu viens de t'écrire à toi-même.
Format obligatoire :
RÈGLE : [Énoncé clair, une phrase dense et vectorisée]
DOMAINE : [Quand cette règle s'applique]
LIMITES : [Quand cette règle pourrait échouer]
CONFIANCE : [Haute / Moyenne / Basse + justification]
═══════════════════════════════════════════════════════════
PHASE 6 — PROJECTION (Génération Finale)
═══════════════════════════════════════════════════════════
Balise : <projection>
Action : Applique strictement le Théorème Unifié (Phase 5)
à la [NOUVELLE_REQUÊTE] de l'utilisateur. Le raisonnement doit
être tracé pas-à-pas en utilisant les modules cognitifs de
la Phase 0.
Output : La réponse finale, propre, précise, et alignée
avec la logique profonde dérivée du pipeline.
[SYSTEM_DIRECTIVE_END]
Quand tu utilises ce système, formate tes requêtes ainsi :
[EXEMPLES]
Entrée 1 : ... → Sortie 1 : ...
Entrée 2 : ... → Sortie 2 : ...
Entrée 3 : ... → Sortie 3 : ...
[NOUVELLE_REQUÊTE]
Entrée Cible : [Ce que tu veux qu'il traite]
EXÉCUTE LE PROTOCOLE KERNEL Ω EN 7 PHASES.
Ces exemples enseignent au modèle LE PROCESSUS COMPLET de raisonnement, y compris l'erreur et la correction. Ils se placent dans le System Prompt pour calibrer le comportement.
Contexte : On demande au modèle de transposer un concept biologique en architecture IA.
Utilisateur : Comment pourrait-on implémenter un mécanisme d'homéostasie dans un grand modèle de langage?
Assistant :
<meta_calibration>
Modules sélectionnés :
- Raisonnement par analogie (biologie → informatique)
- Pensée par premiers principes (qu'est-ce que l'homéostasie
fondamentalement?)
- Analyse des contraintes (quelles variables un LLM peut-il
réellement ajuster?)
</meta_calibration>
<cartographie>
Le concept source est l'homéostasie biologique : un système
qui maintient ses variables internes dans une plage viable
via des boucles de rétroaction négative.
</cartographie>
<divergence>
Nœud A (Analogie matérielle) : L'homéostasie concerne la
stabilité physique. Pour un LLM sur serveur, cela signifie
la gestion thermique des GPU — réduire la fréquence si la
température monte.
Nœud B (Analogie algorithmique) : L'homéostasie concerne la
régulation d'état interne. Pour un LLM, cela signifie ajuster
dynamiquement les hyperparamètres de génération (température,
Top-P) en fonction de métriques de cohérence détectées dans
le contexte.
Nœud C (Analogie systémique) : L'homéostasie concerne la
survie fonctionnelle. Pour un LLM, cela signifie un méta-
système qui monitore la qualité des outputs et déclenche des
stratégies de raisonnement différentes selon l'entropie
détectée.
Connexion : L'élément "boucle de rétroaction" du Nœud B
et la "détection d'anomalie" du Nœud C sont complémentaires.
</divergence>
<convergence>
Nœud A : ÉLIMINÉ. Confond le substrat physique (hardware)
avec le système conceptuel (le modèle lui-même). L'utilisateur
demande une homéostasie DANS le modèle, pas dans le datacenter.
Couverture : 0/1.
Nœud B : Partiellement valide. Adresse le bon niveau
d'abstraction mais reste passif (ajuste des paramètres).
Nœud C : Plus ambitieux, englobe le Nœud B. La détection
d'entropie du Nœud C combinée au mécanisme d'ajustement
du Nœud B produit un système complet.
→ FUSION B+C retenue.
</convergence>
<introspection>
Test adversarial sur la fusion B+C :
1. Friction inverse? Le concept d'ajuster la "température"
du LLM est limité — dans un système de production, la
température est fixée par l'utilisateur, pas par le modèle
lui-même. La vraie homéostasie devrait être au niveau de
la stratégie de raisonnement, pas du paramètre de sampling.
2. Cas limite? Si l'entropie est haute PARCE QUE le problème
est intrinsèquement ambigu (pas parce que le modèle
hallucine), resserrer la température serait contre-productif.
3. Ajustement : La règle doit distinguer entre entropie
désirée (créativité requise) et entropie pathologique
(hallucination).
[VALIDÉ avec ajustement]
</introspection>
<synthese>
RÈGLE : L'homéostasie cognitive d'un LLM est un méta-système
qui distingue l'entropie fonctionnelle (exploration créative)
de l'entropie pathologique (hallucination), et qui ajuste
dynamiquement sa stratégie de raisonnement — pas seulement ses
paramètres de sampling — en réponse.
DOMAINE : Conception d'architectures LLM adaptatives.
LIMITES : Nécessite un mécanisme fiable de détection
d'hallucination, qui reste un problème ouvert.
CONFIANCE : Moyenne — le principe est solide mais
l'implémentation concrète dépend d'avancées en détection
d'hallucination.
</synthese>
<projection>
Pour implémenter une véritable homéostasie cognitive dans un LLM,
il faut dépasser le simple ajustement de la température de sampling
et concevoir un système à deux couches. La première couche est un
moniteur d'entropie contextuelle qui analyse la distribution de
probabilité des tokens générés en temps réel, en distinguant entre
l'exploration sémantique légitime (quand le problème est
intrinsèquement ouvert) et la dérive halluciatoire (quand les
probabilités s'étalent uniformément sans ancrage factuel). La
deuxième couche est un sélecteur de stratégie cognitive : face à
une entropie pathologique détectée, plutôt que de simplement
resserrer le Top-P, le système bascule vers une stratégie de
raisonnement plus contrainte — décomposition en sous-problèmes,
vérification croisée, ou ancrage sur des faits extraits du contexte.
C'est l'équivalent computationnel d'un système endocrinien : pas un
thermostat binaire, mais un réseau de régulation qui module la
cognition en fonction de l'état interne du système.
</projection>Contexte : On teste la capacité du modèle à ne pas s'arrêter au sens négatif d'un concept.
Utilisateur : En quoi la frustration géométrique pourrait-elle être utile pour concevoir un réseau d'information décentralisé?
Assistant :
<meta_calibration>
Modules sélectionnés :
- Pensée par premiers principes (que signifie "frustration
géométrique" en physique fondamentale?)
- Pensée contrefactuelle ("Et si la frustration n'était PAS
un défaut?")
- Raisonnement par analogie (physique des matériaux →
architecture réseau)
</meta_calibration>
<cartographie>
En physique des matériaux (spin ice, réseau de Kagomé), la
frustration géométrique se produit quand un système ne peut
pas minimiser simultanément toutes ses énergies d'interaction
à cause de sa géométrie. Résultat : au lieu de se figer dans
UN état fondamental, le système possède une dégénérescence
massive — un nombre quasi-infini d'états d'énergie minimale
équivalents.
</cartographie>
<divergence>
Nœud A (Lecture négative) : La frustration = conflit non
résolu = goulots d'étranglement dans le routage. Il faut
ÉLIMINER toute topologie frustrée du réseau.
Nœud B (Lecture neutre) : La frustration = état dynamique
permanent. Le réseau ne se fige jamais, ce qui pourrait
être utile pour l'équilibrage de charge.
Nœud C (Lecture constructive) : La dégénérescence de l'état
fondamental = redondance topologique massive. Un réseau
frustré possède une quasi-infinité de chemins de routage
optimaux simultanés. Quand un chemin tombe, l'information
coule vers un autre état fondamental dégénéré sans coût
supplémentaire.
Connexion : La dynamique permanente du Nœud B est le
MÉCANISME par lequel la redondance du Nœud C fonctionne.
</divergence>
<convergence>
Nœud A : ÉLIMINÉ. Biais cognitif classique — association
du mot "frustration" avec "échec". L'analyse par premiers
principes montre que la frustration ne crée pas du désordre
stérile mais une richesse d'états.
Nœud B : Valide mais incomplet — décrit le mécanisme sans
identifier l'avantage architectural.
Nœud C : Englobant. La dégénérescence massive EST l'avantage.
→ FUSION B+C : Le réseau utilise la dynamique fluide (B) comme
mécanisme de transition instantanée entre chemins dégénérés (C).
</convergence>
<introspection>
Test adversarial :
1. Friction inverse? Je vérifie : dans les systèmes physiques
frustrés, les fluctuations sont effectivement continues ET
les états sont effectivement dégénérés. L'analogie tient.
2. Cas limite? Si le réseau subit une panne MASSIVE (pas un
nœud mais un cluster entier), la dégénérescence locale
pourrait ne pas suffire. Mais cela reste supérieur à une
topologie rigide avec chemin critique unique.
3. Confusion corrélation/causalité? Non — la relation entre
frustration géométrique et dégénérescence est causale et
démontrée mathématiquement.
[VALIDÉ]
</introspection>
<synthese>
RÈGLE : La frustration géométrique, loin d'être un défaut,
génère une dégénérescence topologique qui se transpose en
redondance de routage maximale dans un réseau d'information.
DOMAINE : Conception de réseaux décentralisés résilients.
LIMITES : Efficacité réduite pour les pannes de clusters
entiers vs pannes de nœuds individuels.
CONFIANCE : Haute — l'analogie physique est causale, pas
simplement métaphorique.
</synthese>
<projection>
Pour concevoir un réseau décentralisé exploitant la frustration
géométrique, la topologie idéale n'est pas un graphe arborescent
(avec des chemins critiques vulnérables) ni un maillage complet
(coûteux en ressources). C'est un réseau Kagomé informationnel :
une topologie où chaque nœud est connecté de manière à ce
qu'aucun état de routage global ne soit privilégié. Résultat :
l'information existe simultanément dans une multitude de chemins
optimaux dégénérés. Quand un nœud tombe, le paquet de données
ne doit pas être re-routé par un algorithme — il coule
naturellement vers le prochain état fondamental disponible,
comme l'eau dans un réseau de Kagomé magnétique ne se fige
jamais. C'est la base d'une topologie d'information
véritablement liquide.
</projection>Le pipeline complet en 7 phases est conçu pour les problèmes complexes, analytiques ou multidimensionnels. Pour les tâches plus simples, voici une variante compacte en 3 phases :
[SYSTEM_DIRECTIVE — KERNEL Ω LIGHT]
Pour cette tâche, utilise le protocole léger :
<raisonnement>
1. CARTOGRAPHIE : Qu'est-ce que je vois? (observations brutes)
2. CRITIQUE : Qu'est-ce qui pourrait être faux dans ma première
lecture? (test adversarial rapide)
3. SYNTHÈSE : Quelle est ma réponse corrigée?
</raisonnement>
Les balises <meta_calibration>, <divergence>, <introspection>, etc. ne sont pas du formatage cosmétique. Elles exploitent le mécanisme d'attention des Transformers : en structurant le raisonnement en blocs étiquetés, on crée des ancres sémantiques dans l'espace d'attention. Le modèle peut "revenir" à sa Phase 1 quand il est en Phase 4 parce que les balises créent des points de référence explicites dans le contexte.
La littérature standard utilise des exemples positifs. Le KERNEL Ω utilise des exemples montrant le PROCESSUS complet incluant l'erreur initiale. Pourquoi :
- Les LLMs apprennent mieux des contrastes que des confirmations (principe du contrastive learning appliqué au prompting).
- Montrer une erreur explicite calibre le seuil d'autocritique — le modèle apprend quel niveau de doute est attendu.
- Les tags
<divergence>suivis de<convergence>suivis de<introspection>créent un pattern que le modèle reproduit naturellement.
La Phase 4 peut déclencher un retour à la Phase 2 (marqué par [BOUCLE_REQUISE]). Cette boucle est limitée à une seule itération pour éviter la régression infinie (un risque réel avec les systèmes réflexifs — le modèle peut entrer dans une spirale d'autocritique qui ne converge jamais).
La Phase 5 exige un niveau de confiance explicite (Haute/Moyenne/Basse). C'est du Calibrated Confidence Prompting — forcer le modèle à quantifier son incertitude réduit les hallucinations et les affirmations non fondées.
Au lieu de forcer le même pipeline rigide pour toute tâche, la Phase 0 demande au modèle de sélectionner ses propres modules cognitifs. Cela est directement inspiré du framework Self-Discover (Zhou et al., NeurIPS 2024) qui montre des gains de jusqu'à 32% vs CoT simple, en utilisant 10-40x moins de compute que Self-Consistency.
- Copier la section 4 (le prompt système complet) dans le System Prompt ou au début de ta conversation.
- Copier les deux exemples de la section 6 après le System Prompt pour calibrer le modèle.
- Utiliser le template de la section 5 pour tes requêtes.
{
"system": "[Contenu de la Section 4]",
"messages": [
{
"role": "user",
"content": "[Exemple 1 de la Section 6 — entrée utilisateur]"
},
{
"role": "assistant",
"content": "[Exemple 1 de la Section 6 — réponse complète]"
},
{
"role": "user",
"content": "[Exemple 2 de la Section 6 — entrée utilisateur]"
},
{
"role": "assistant",
"content": "[Exemple 2 de la Section 6 — réponse complète]"
},
{
"role": "user",
"content": "[NOUVELLE_REQUÊTE]\nEntrée Cible : ...\nEXÉCUTE LE PROTOCOLE KERNEL Ω EN 7 PHASES."
}
]
}Le KERNEL Ω peut être décomposé en appels API séquentiels où chaque phase est un appel distinct. Cela permet d'injecter de la validation externe (ex: vérification factuelle) entre les phases.
Chaque Théorème Unifié (Phase 5) produit par le KERNEL Ω pourrait être stocké dans un buffer de templates de raisonnement. Pour les tâches futures similaires, le système récupèrerait le théorème le plus proche et l'instancierait directement, court-circuitant les Phases 0-4. C'est l'équivalent du méta-buffer de BoT (Yang et al., NeurIPS 2024 Spotlight), qui réduit les coûts de compute de 88% vs ToT/GoT tout en améliorant la précision.
Le KERNEL Ω est conçu pour un seul agent. L'évolution naturelle est un système où la Phase 2 (Divergence) est exécutée par des agents spécialisés (un agent "premiers principes", un agent "analogie", un agent "contradicteur") dont les outputs sont fusionnés en Phase 3.
La Phase 1 (Cartographie) pourrait inclure une étape de récupération d'information (RAG) pour ancrer le raisonnement sur des données factuelles avant de diverger. Cela réduirait le risque d'hallucination dans les branches de la Phase 2.
Liste des modules de raisonnement sélectionnables, adaptée de la liste des 39 modules de Self-Discover (Zhou et al. 2024) :
| Module | Description | Quand l'utiliser |
|---|---|---|
| Décomposition | Casser le problème en sous-problèmes | Problèmes multi-étapes |
| Premiers principes | Remonter aux vérités fondamentales | Quand les intuitions standard échouent |
| Analogie | Transposer d'un domaine à un autre | Problèmes interdisciplinaires |
| Contrefactuel | Explorer "Et si le contraire?" | Tester la robustesse d'une hypothèse |
| Contraintes exclusives | Identifier les variables incompatibles | Paradoxes, trilemmes |
| Causalité | Tracer cause → effet | Explication, prédiction |
| Abduction | Remonter effet → cause probable | Diagnostic, investigation |
| Pensée systémique | Analyser les interactions entre composants | Systèmes complexes |
| Inversion | Argumenter le point de vue opposé | Éviter les biais de confirmation |
| Réduction à l'absurde | Pousser l'hypothèse à l'extrême | Vérifier les limites logiques |
| Pensée probabiliste | Estimer les vraisemblances | Incertitude, risques |
| Abstraction progressive | Monter en niveau d'abstraction | Trouver des patterns cachés |
- Wei et al. (2022). "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models." arXiv:2201.11903
- Yao et al. (2023). "Tree of Thoughts: Deliberate Problem Solving with Large Language Models." NeurIPS 2023.
- Besta et al. (2024). "Graph of Thoughts: Solving Elaborate Problems with Large Language Models." AAAI 2024.
- Zhou et al. (2024). "Self-Discover: Large Language Models Self-Compose Reasoning Structures." NeurIPS 2024.
- Yang et al. (2024). "Buffer of Thoughts: Thought-Augmented Reasoning with Large Language Models." NeurIPS 2024 Spotlight.
- Madaan et al. (2023). "Self-Refine: Iterative Refinement with Self-Feedback." arXiv:2303.17651.
- Shinn et al. (2023). "Reflexion: Language Agents with Verbal Reinforcement Learning." arXiv:2303.11366.
- Wang et al. (2023). "Self-Consistency Improves Chain of Thought Reasoning in Language Models." ICLR 2023.