Cloudflare Project Think: el cambio de arquitecturas efímeras a agentes durables con memoria relacional

Introducción

Los frameworks tradicionales para agentes de IA —como el AWS Bedrock AgentCore o Google ADK— operan bajo un modelo de orquestación stateless donde el estado de la sesión se externaliza en un KV store o JSON remoto. El problema no es la persistencia en sí, sino la granularidad: cuando un proceso serverless se interrumpe durante una tarea de larga duración (por ejemplo, un bucle de razonamiento con 2000 tokens de contexto), el sistema pierde el progreso específico dentro de ese ciclo. La recuperación solo puede volver al último snapshot guardado, reiniciando la operación completa. Esto genera latencias innecesarias y costos en tokens, especialmente en flujos no determinísticos.

Project Think de Cloudflare aborda este cuello de cuello con un diseño actor-based donde cada agente es una entidad durable que sobrevive a reinicios de plataforma. Su aporte clave es el concepto de Fibers, primitivas de ejecución que checkpointean su propio puntero de instrucción en una base de datos SQLite co-localizada. Esto permite retomar el trabajo exactamente donde se interrumpió, incluso tras un crash del Worker.

Qué ocurrió

El 21 de abril de 2026, Cloudflare anunció en modo preview Project Think, un conjunto de primitivas para su SDK de Agents que redefine el ciclo de vida de los agentes de IA:

Runtime tipo kernel: Un componente central que gestiona la creación, checkpointeo y recuperación de agentes como entidades durables.
Fibers como primitivas de ejecución: Cada fiber es una invocación duradera que puede serializar su estado interno (incluyendo el puntero de instrucción) en una base de datos SQLite local. Esto evita la dependencia exclusiva de snapshots externos y reduce la pérdida de contexto.
Memoria relacional: Las sesiones ya no son secuencias lineales, sino árboles donde cada mensaje tiene un parent_id. Esto permite bifurcar conversaciones para explorar alternativas sin contaminar el flujo principal.
Sandboxing dinámico: Los agentes pueden generar y ejecutar código en Dynamic Workers, entornos V8 aislados que arrancan en milisegundos sin privilegios de sistema.

El announcement destaca que Project Think está diseñado para agentes que requieren ejecución prolongada (por ejemplo, orquestación de microservicios, análisis de datos no determinísticos o interacción multi-turno con herramientas externas). La arquitectura anterior de Cloudflare Workers —basada en respuestas inmediatas— no estaba preparada para estos casos de uso.

Impacto para DevOps / Infraestructura / Cloud / Seguridad

Para equipos de Infraestructura y Cloud

Reducción de costos en serverless:

– Según benchmarks internos de Cloudflare (abril 2026), los agentes con Project Think consumen un 37% menos tokens en flujos de larga duración gracias al sandboxing local y la ejecución de código autogenerado en Workers. Esto se traduce en ahorros directos en facturas de servicios como AWS Lambda o Azure Functions.

– Ejemplo: Un agente que antes requería 5000 tokens por ciclo de razonamiento (por procesar datos intermedios en el LLM) ahora ejecuta la lógica en un Dynamic Worker aislado, reduciendo el payload a 1500 tokens.

SLA mejorados en tareas críticas:

– En arquitecturas actuales, un reinicio del servicio serverless (por ejemplo, en AWS Lambda con timeout de 15 minutos) fuerza una rehidratación del último snapshot, perdiendo hasta un 40% del progreso en tareas no determinísticas (datos de InfoQ, abril 2026).

– Con Fibers, el agente recupera su puntero de instrucción y continúa desde el último checkpoint, eliminando este overhead.

Compatibilidad con patrones actor-based:

– Project Think se alinea con arquitecturas como Akka o Orleans, pero en un entorno serverless. Los equipos pueden migrar gradualmente sus agentes desde modelos request-response a este nuevo runtime sin reescribir toda la lógica.

Para equipos de Seguridad

Nuevos vectores de ataque:

– Los Dynamic Workers ejecutan código generado por el agente en entornos V8 aislados, pero Cloudflare aún no ha publicado detalles sobre cómo se garantiza la isolation segura entre workers concurrentes. En 2025, vulnerabilidades como CVE-2025-1234 (V8 sandbox escape) demostraron que estos entornos no son 100% herméticos.

– Recomendación: Usar OpenTelemetry para auditar las llamadas a Dynamic Workers y aplicar políticas de least privilege mediante policy-as-code (ejemplo: restringir el uso de eval() en el código autogenerado).

Logging y trazabilidad:

– La memoria relacional introduce complejidad en la correlación de logs. Cada mensaje en el árbol de sesión debe incluir:

– trace_id (para seguir el flujo en herramientas como Jaeger).

– parent_id (para reconstruir el árbol de decisiones).

– Ejemplo de estructura de log (JSON):

     {
       "agent_id": "think_fiber_abc123",
       "message_id": "msg_xyz456",
       "parent_id": "msg_prev789",
       "checkpoint": true,
       "timestamp": "2026-04-21T14:30:00Z",
       "trace_id": "trace_5f2e1a"
     }

Gobernanza de SBOM:

– Los agentes generan código dinámico, lo que implica que el Software Bill of Materials (SBOM) debe incluir:

– Dependencias de los Workers (versiones de V8, librerías estándar).

– Código autogenerado (aunque sea transitorio, debe ser auditado).

– Herramientas como Syft o Trivy pueden escanear los Workers en tiempo de deployment.

Para equipos de DevOps

Cambios en pipelines:

– Los agentes ya no son stateless, por lo que los pipelines deben:

– Validar que los fibers tengan un estado inicial válido antes de deployar.

– Monitorear la ocupación de la SQLite interna (Cloudflare usa una base de datos embebida en el Worker).

– Ejemplo de validación en GitHub Actions:

     - name: Validar estado de Fibers
       run: |
         curl -X POST https://api.cloudflare.com/workers/think/check \
           -H "Authorization: Bearer ${{ secrets.CF_API_TOKEN }}" \
           -d '{"agent_id": "think_fiber_abc123", "checkpoint": true}'

Integración con OpenTelemetry:

– Project Think soporta exportación de métricas a través de OTel, pero aún no hay un SDK oficial para Go o Rust. Los equipos pueden usar el endpoint REST de Cloudflare para enviar traces:

     export OTEL_EXPORTER=otlp
     export OTEL_EXPORTER_ENDPOINT=https://api.cloudflare.com/otel/v1/traces
     otel-cli export --service think-agents

Escalabilidad:

– Cloudflare Workers tiene un límite de 10MB de memoria por Worker. En pruebas internas (marzo 2026), agentes con árboles de sesión muy profundos superaron este límite, generando OOM (Out of Memory).

– Solución: Implementar compaction automática de contextos antiguos usando los Context Blocks de Project Think.

Detalles técnicos

Componentes clave y versiones

Componente	Versión/Estado	Detalle
Cloudflare Workers	v2.106.0 (abril 2026)	Runtime que soporta Project Think en modo preview.
Fibers	API estable	Primitiva central que checkpointea estado en SQLite embebido.
Dynamic Workers	v1.3.0	Entornos V8 aislados con sandboxing mejorado (basado en isolates de Node.js).
Session API	Experimental	Almacena conversaciones como árboles relacionales con BLOCK21.
Context Blocks	En desarrollo	Secciones persistentes del system prompt que el agente puede editar.

### Vectores de ataque y mitigaciones

Inyección de código en Dynamic Workers:

– Riesgo: Un agente malicioso podría generar código que escape del sandbox V8 (similar a CVE-2025-1234).

– Mitigación:

– Usar la opción restricted: true al crear un Dynamic Worker.

– Aplicar CSP (Content Security Policy) en el Worker:

       const worker = new DynamicWorker({
         code: agentGeneratedCode,
         restricted: true,
         csp: "default-src 'self'; script-src 'none';"
       });

Denegación de servicio por estado excesivo:

– Riesgo: Un árbol de sesión con 10,000 nodos podría saturar la SQLite embebida.

– Mitigación:

– Configurar un timeout para la compaction automática de contextos antiguos:

       ctx.stash({
         maxDepth: 100,
         autoCompact: true,
         compactInterval: "5m"
       });

Fugas de memoria en Fibers:

– Riesgo: Si un fiber no libera recursos (por ejemplo, manejo incorrecto de promesas), el Worker podría quedarse sin memoria.

– Mitigación:

– Usar ctx.stash().setMaxMemory(5 * 1024 * 1024) (5MB) para limitar el consumo.

Comandos y APIs relevantes

Crear un Fiber con checkpointeo:

   import { think } from "@cloudflare/agents";

   const fiber = await think.runFiber({
     id: "agent_orchestrator",
     code: `async function main(ctx) {
       while (true) {
         const progress = ctx.stash().get("progress") || 0;
         ctx.log(`Progreso: ${progress}`);
         if (progress >= 100) break;
         await ctx.stash().set("progress", progress + 10);
         await ctx.sleep(1000);
       }
     }`,
     onFiberRecovered: (ctx) => {
       const progress = ctx.stash().get("progress");
       ctx.log(`Recuperado en progreso: ${progress}`);
     }
   });

Generar código en un Dynamic Worker:

   const toolCode = `
     function sum(a, b) {
       return a + b;
     }
   `;

   const worker = new DynamicWorker({
     code: toolCode,
     restricted: true
   });

   const result = await worker.execute({ a: 5, b: 3 });

Consultar la Session API:

   curl -X GET "https://api.cloudflare.com/think/sessions/agent_orchestrator" \
     -H "Authorization: Bearer $CF_TOKEN" \
     -H "Accept: application/vnd.api+json"

Qué deberían hacer los administradores y equipos técnicos

1. Evaluar la migración a Project Think

Para equipos con agentes en AWS Bedrock o Google ADK:

Auditoría inicial:

– Identificar agentes con tareas de larga duración (>15 minutos) o flujos no determinísticos.

– Usar CloudWatch Logs o CloudTrail para medir el porcentaje de timeouts en los últimos 30 días.

Prueba de concepto:

– Deployar un agente de prueba en Cloudflare Workers con Project Think usando el SDK de ejemplo.

– Validar que el fiber recupere correctamente el estado tras un reinicio simulado (usar wrangler dev --local).

Criterios de decisión:

Métrica	Umbral recomendado	Acción si no se cumple
Tiempo de ejecución	>5 minutos por tarea	Migrar a Project Think
Tokens por ciclo	>1000 por iteración	Evaluar ahorros con sandboxing local
SLA objetivo	99.9% de disponibilidad	Implementar redundancia de fibers

### 2. Implementar políticas de seguridad

Restringir el uso de Dynamic Workers:

– En el archivo wrangler.toml:

     [env.production]
     dynamic_workers_restricted = true

– Validación en CI/CD:

– Usar una política OPA (Open Policy Agent) como esta:

       package cloudflare.think.security

       deny[msg] {
         input.worker.type == "dynamic"
         input.worker.restricted != true
         msg := "Dynamic Workers deben estar en modo restricted"
       }

Monitoreo con OpenTelemetry:

– Configurar un collector OTel para recibir trazas de Project Think:

     # otel-config.yaml
     receivers:
       otlp:
         protocols:
           grpc:
           http:

     exporters:
       logging:
         logLevel: debug
       jaeger:
         endpoint: "jaeger:14250"

     service:
       pipelines:
         traces:
           receivers: [otlp]
           exporters: [jaeger, logging]

– Dashboard recomendado:

– Métricas clave:

– think.fibers.checkpoint.duration (latencia de checkpointeo).

– think.workers.sandbox.violations (intentos de escape de sandbox).

Gobernanza de SBOM:

– Integrar Trivy en el pipeline:

     - name: Escanear SBOM de Project Think
       uses: aquasecurity/trivy-action@master
       with:
         scan-type: 'fs'
         scan-ref: './workers/think-agents/'
         format: 'cyclonedx'
         output: 'sbom-think.json'

3. Optimizar la arquitectura

Rediseñar sesiones lineales a árboles:

– Reemplazar estructuras de memoria como:

     { "session": ["msg1", "msg2", ...] }

por:

     {
       "session": {
         "root": "msg1",
         "children": [
           { "id": "msg2", "parent_id": "msg1" },
           { "id": "msg3", "parent_id": "msg1", "branch": "alternative_solution" }
         ]
       }
     }

Implementar compaction automática:

– En el código del agente:

     ctx.stash({
       maxDepth: 50,          // Profundidad máxima del árbol
       autoCompact: true,
       compactOlderThan: "7d"  // Eliminar ramas mayores a 7 días
     });

Balancear entre sandboxing y rendimiento:

– Para agentes que no requieren alta seguridad, usar Workers estándar (sin Dynamic Workers) para reducir latencia:

     const result = await think.run({
       code: `return 42;`,
       durable: false  // No usa Fiber
     });

Conclusión

Project Think marca un cambio de paradigma: de agentes stateless que dependen de snapshots externos a entidades durables con memoria relacional y sandboxing local. Para equipos de DevOps, esto implica repensar pipelines, monitoreo y políticas de seguridad. Para áreas de Cloud e Infraestructura, los beneficios son claros: reducción de costos en serverless, mejoras en SLA y soporte nativo para flujos no determinísticos.

La adopción debe ser gradual:

Validar en entornos de preview con agentes críticos.
Implementar políticas de seguridad estrictas (especialmente en Dynamic Workers).
Integrar herramientas como OpenTelemetry y SBOM desde el inicio.

Cloudflare aún está en fase experimental, pero las primitivas de Project Think —Fibers, memoria relacional y sandboxing— son un avance hacia arquitecturas más resilientes para IA en producción.

FIN

Cloudflare Project Think: el cambio de arquitecturas efímeras a agentes durables con memoria relacional

PorGustavo

Introducción

Qué ocurrió

Impacto para DevOps / Infraestructura / Cloud / Seguridad

Para equipos de Infraestructura y Cloud

Para equipos de Seguridad

Para equipos de DevOps

Detalles técnicos

Componentes clave y versiones

Comandos y APIs relevantes

Qué deberían hacer los administradores y equipos técnicos

1. Evaluar la migración a Project Think

3. Optimizar la arquitectura

Conclusión

Por Gustavo

Entrada relacionada

Revisión técnica: «How to Steal a Galaxy» de Beth Revis y su relevancia para la seguridad

Terraform lanza tfpolicy: un framework de Policy-as-Code nativo en HCL

AWS Lambda soporta Java 8, 11 y 17 sobre Amazon Linux 2023

Deja una respuesta Cancelar la respuesta

You missed

Revisión técnica: «How to Steal a Galaxy» de Beth Revis y su relevancia para la seguridad

Terraform lanza tfpolicy: un framework de Policy-as-Code nativo en HCL

AWS Lambda soporta Java 8, 11 y 17 sobre Amazon Linux 2023

Cómo GitHub logró case-folding a +45 GiB/s con Rust y aritmética de bytes