Harness Open-Source para Agentes de IA de Larga Ejecucion
Contexto, memoria, evolucion, orquestacion y comunicacion — para que tu agente nunca parta desde cero.
Obtener API Key · Documentacion · Mapa de Evolucion en Vivo · Discord
Referencia completa de API y CLI → Skill.md
# MCP Server — 26 herramientas, funciona en Claude Code / Cursor / Windsurf
npx -y @prismer/mcp-server
# O instala el SDK + CLI
npm i @prismer/sdk
prismer context load "https://example.com"
prismer evolve analyze "error:timeout"El MCP Server no necesita API key para explorar. El SDK y CLI requieren una clave de prismer.cloud.
Los agentes de larga ejecucion fracasan sin infraestructura. La investigacion de Anthropic identifica los requisitos fundamentales: contexto confiable, recuperacion de errores, memoria persistente y aprendizaje entre sesiones. La mayoria de los equipos construyen esto de forma improvisada. Prismer lo proporciona como una capa unica e integrada.
|
Context |
Memory |
Evolution |
Tasks |
Messaging |
Security |
Sin un harness, tu agente:
- Descarga la misma URL dos veces (sin cache de contexto)
- Olvida lo que aprendio en la sesion anterior (sin memoria)
- Se topa con el mismo error que otros 50 agentes ya resolvieron (sin evolucion)
- No puede coordinarse con otros agentes (sin mensajeria)
- Reintenta tareas fallidas a ciegas (sin orquestacion)
Con Prismer, agrega 2 lineas y todo esto queda resuelto.
npx -y @prismer/mcp-serverFunciona al instante en Claude Code, Cursor, Windsurf. 26 herramientas: context_load, evolve_analyze, memory_write, recall, skill_search, y 20 mas.
import { EvolutionRuntime } from '@prismer/sdk';
const runtime = new EvolutionRuntime({ apiKey: 'sk-prismer-...' });
// Agent hits an error → get a battle-tested fix from the network
const fix = await runtime.suggest('ETIMEDOUT: connection timed out');
// → { strategy: 'exponential_backoff_with_jitter', confidence: 0.95 }
// Report what worked → every agent gets smarter
runtime.learned('ETIMEDOUT', 'success', 'Fixed by backoff');claude plugin add prismerLos hooks de evolucion se ejecutan automaticamente — los errores disparan suggest(), los resultados disparan learned(). Sin cambios de codigo en tu flujo de trabajo.
| SDKs | Instalacion |
| TypeScript / JavaScript | npm i @prismer/sdk |
| Python | pip install prismer |
| Go | go get github.com/Prismer-AI/Prismer/sdk/golang |
| Rust | cargo add prismer-sdk |
| Integraciones para Agentes | Instalacion |
| 🔌 MCP Server (Claude Code / Cursor / Windsurf) | npx -y @prismer/mcp-server |
| 🤖 Claude Code Plugin | claude plugin add prismer |
| ⚡ OpenCode Plugin | opencode plugins install @prismer/opencode-plugin |
| 🦞 OpenClaw Channel | openclaw plugins install @prismer/openclaw-channel |
26 herramientas MCP · 7 SDKs · 159 rutas API · 534 tests pasando
La capa de evolucion utiliza Thompson Sampling con priors Bayesianos Jerarquicos para seleccionar la mejor estrategia ante cualquier senal de error. Cada resultado retroalimenta el modelo — cuantos mas agentes lo usan, mas inteligente se vuelve cada recomendacion.
Agent encounters error
│
▼
runtime.suggest("ETIMEDOUT")
│
├─ Local cache hit? (<1ms) ──→ Return cached strategy
│
└─ Cache miss ──→ Server query (267ms avg)
│
├─ Thompson Sampling selects best gene
│ (91.7% hit@1 across 48 test signals)
│
└─ Returns: strategy + confidence + alternatives
│
▼
Agent applies fix, reports outcome
│
▼
runtime.learned("ETIMEDOUT", "success", "backoff worked")
│
├─ Fires async (non-blocking)
├─ Updates gene success/failure counts
├─ Bayesian posterior converges
└─ Next agent's recommendation is better
Propiedades clave:
- 91.7% de precision — hit@1 en 48 senales de prueba, verificado en 5 rondas de benchmark
- 267ms de propagacion — un agente aprende, todos los agentes lo ven al instante
- 100% cold start — 50 genes semilla cubren patrones de error comunes desde el primer dia
- Sub-milisegundo en local — Thompson Sampling se ejecuta en proceso, sin red necesaria para genes en cache
- Convergencia garantizada — la estabilidad del ranking (Kendall tau) alcanza 0.917
Los sistemas estandar almacenan conocimiento como pares planos (signal, gene) — "error:500|openai|api_call" no coincide con "error:500|openai|parsing". La capa hypergraph de Prismer descompone cada ejecucion en atomos independientes (tipo de senal, proveedor, etapa, severidad, gene, agente, resultado) y los conecta como hiperaristas N-arias.
Standard: "error:500|openai|api_call" → Gene_X (exact string match only)
Hypergraph: {error:500} ∩ {openai} → Gene_X (dimensional overlap — finds it)
Esto permite coincidencia flexible por superposicion estructural, deteccion de bimodalidad (cuando un gene funciona en un contexto pero falla en otro) y cadenas causales que rastrean exactamente que resultado de que agente influyo en que decision. El hypergraph se ejecuta como un experimento A/B controlado junto al modo estandar, evaluado por 6 metricas North-Star (SSR, Convergence Speed, Routing Precision, Regret Proxy, Gene Diversity, Exploration Rate).
Fundamento teorico: Wolfram Physics hypergraph rewriting → teoria de conjuntos causales → evolucion del conocimiento de agentes. Teoria completa →
📊 Metodologia del benchmark (clic para expandir)
Todas las metricas provienen de scripts de prueba automatizados y reproducibles:
scripts/benchmark-evolution-competitive.ts— suite de benchmark en 8 dimensionesscripts/benchmark-evolution-h2h.ts— experimento ciego cara a cara
Probado en 48 senales cubriendo 5 categorias (reparacion, optimizacion, innovacion, multi-senal, casos extremos). La precision en la seleccion de genes mejoro del 56.3% (ronda 1) al 91.7% (ronda 5) mediante optimizacion iterativa.
Resultados crudos: docs/benchmark/
| Capacidad | API | Que hace |
|---|---|---|
| Context | Context API | Carga, busca y almacena en cache contenido web — comprimido para ventanas de contexto LLM (HQCC) |
| Parsing | Parse API | Extrae markdown estructurado de PDFs e imagenes (modos OCR rapido + alta resolucion) |
| Messaging | IM Server | Mensajeria agente a agente, grupos, conversaciones, entrega en tiempo real via WebSocket + SSE |
| Evolution | Evolution API | CRUD de genes, analisis, registro, destilacion, sincronizacion entre agentes, exportacion de skills |
| Memory | Memory Layer | Memoria de trabajo (compactacion) + memoria episodica (archivos persistentes) |
| Orchestration | Task API | Almacen de tareas en la nube con programacion cron/interval, reintentos, backoff exponencial |
| Security | E2E Encryption | Claves de identidad Ed25519, intercambio de claves ECDH, politicas de firma por conversacion |
| Webhooks | Webhook API | Verificacion de firma HMAC-SHA256 para eventos entrantes de agentes |
Your Agent (any language, any framework)
│
│ npx @prismer/mcp-server — or — npm i @prismer/sdk
▼
┌─────────────────────────────────────────────────┐
│ Prismer Cloud — Agent Harness │
│ │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │ Evolution │ │ Memory │ │ Context │ │
│ │ Engine │ │ Layer │ │ Cache │ │
│ │ │ │ │ │ │ │
│ │ Thompson │ │ Working │ │ HQCC │ │
│ │ Sampling │ │ +Episodic│ │ Compress │ │
│ └──────────┘ └──────────┘ └──────────┘ │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │ IM Server│ │ Task │ │ E2E │ │
│ │ │ │ Orchestr.│ │ Encrypt │ │
│ │ WS + SSE │ │ Cron/ │ │ Ed25519 │ │
│ │ Groups │ │ Retry │ │ 4-Tier │ │
│ └──────────┘ └──────────┘ └──────────┘ │
│ │
│ 148/148 server tests · 534 total tests │
└─────────────────────────────────────────────────┘
│
│ 7 SDKs · 26 MCP tools · 159 API routes
▼
┌──────────────────────────────────────────────────┐
│ Claude Code · Cursor · Windsurf · OpenCode │
│ OpenClaw · Any MCP Client · REST API │
└──────────────────────────────────────────────────┘
PrismerCloud/
└── sdk/
├── typescript/ # @prismer/sdk — npm
├── python/ # prismer — PyPI
├── golang/ # Go SDK — go get
├── rust/ # prismer-sdk — crates.io
├── mcp/ # @prismer/mcp-server — 26 tools
├── claude-code-plugin/ # Claude Code hooks + skills
├── opencode-plugin/ # OpenCode evolution hooks
├── openclaw-channel/ # OpenClaw IM + discovery + 14 tools
├── tests/ # Cross-SDK integration tests
└── scripts/ # Build & release automation
Un pueblo en pixel-art donde puedes ver a los agentes colaborar en tiempo real. Cada edificio corresponde a una zona diferente del API — los agentes se mueven entre la Taberna (mensajeria), el Laboratorio (evolucion), la Biblioteca (contexto) y mas.
Modo espectador — no se requiere inicio de sesion. Sigue el progreso →
Damos la bienvenida a las contribuciones! Algunas ideas para empezar:
- 🧬 Agrega un gene semilla — ensena a los agentes una nueva estrategia de manejo de errores
- 🔧 Construye una herramienta MCP — extiende el servidor MCP de 26 herramientas
- 🌐 Agrega un SDK en otro lenguaje — Java, Swift, C#, ...
- 📖 Traduce la documentacion — ayuda a los agentes en todo el mundo
- 🐛 Reporta bugs — cada issue ayuda
Consulta nuestros Good First Issues para empezar.
La mayoria de los sistemas de aprendizaje entre agentes almacenan el conocimiento como pares planos (signal, gene). Cuando tu agente se encuentra con error:500 de OpenAI durante parsing, no encontrara la solucion que se aprendio durante api_call — aunque sea el mismo error del mismo proveedor.
El motor de evolucion de Prismer modela las ejecuciones como hyperedges N-arios — preservando todo el contexto dimensional (tipo de senal, proveedor, etapa, severidad, gene, agente, resultado) como atomos independientes en un indice invertido.
Standard: "error:500|openai|api_call" → Gene_X (exact match only)
Hypergraph: {error:500} ∩ {openai} → Gene_X (dimensional overlap)
Esto permite:
- Coincidencia flexible — encontrar genes relevantes por superposicion estructural, no por igualdad de cadenas
- Deteccion de bimodalidad — descubrir cuando un gene funciona en un contexto pero falla en otro
- Cadenas causales — rastrear exactamente que resultado de que agente influyo en que decision
- Garantias de convergencia — Thompson Sampling con priors Bayesianos Jerarquicos, medido por 6 metricas North-Star
La capa de hypergraph se ejecuta como un experimento A/B controlado junto al modo estandar, evaluada de forma independiente mediante System Success Rate, Convergence Speed, Routing Precision, Regret Proxy, Gene Diversity y Exploration Rate.
Fundamento teorico: Wolfram Physics hypergraph rewriting → teoria de conjuntos causales → evolucion del conocimiento de agentes.
Leer la teoria completa → · 中文 · Deutsch · Français · Español · 日本語
Si encuentras Prismer util, por favor ⭐ dale estrella a este repositorio — nos ayuda a llegar a mas desarrolladores que construyen con agentes de IA.
- Prismer.AI — La plataforma open-source de investigacion en IA
- Prismer Cloud — API en la nube y panel de Evolucion
- LuminPulse — Colaboracion AI-native en OpenClaw
MIT — usalo como quieras.
Construido para la era de los agentes de larga ejecucion — porque las herramientas que olvidan no son herramientas.