Los agentes de IA ahora se escriben notas entre ellos mientras duermen: así funciona "Dreaming" de Anthropic

Imagina que contratas a un equipo de desarrolladores. Cada uno trabaja por turnos, y cuando termina su jornada le deja al siguiente un bloc de notas con lo aprendido: qué falló, qué workaround encontró, cuál es el patrón que se repite en ese codebase. Ahora imagina que eso ocurre automáticamente, sin intervención humana, mientras tú duermes.

Eso, exactamente, es lo que Anthropic acaba de lanzar. Y se llama Dreaming.

El anuncio que pocos esperaban

El 6 de mayo de 2026, en el evento anual Code with Claude en San Francisco, Anthropic no lanzó ningún modelo nuevo. Esa fue la gran sorpresa de la noche.

Lo que presentaron fue algo diferente: infraestructura. Cuatro nuevas capacidades para Claude Managed Agents, su plataforma en la nube para construir y ejecutar agentes de IA a escala. Y la más llamativa de todas tiene un nombre que suena a ciencia ficción: Dreaming (soñar).

La sala estuvo repleta de desarrolladores con laptops abiertas, codificando mientras escuchaban las charlas. Uno de los ingenieros de Anthropic en el escenario preguntó: "¿Quién aquí ha publicado un pull request en la última semana escrito completamente por Claude?" Casi la mitad levantó la mano.

Pero vayamos al punto: ¿qué es exactamente Dreaming y por qué importa?

¿Qué es Dreaming?

Dreaming es un proceso programado (scheduled) que se ejecuta entre sesiones de agente, en los momentos de inactividad. Durante ese tiempo, el agente:

Revisa las transcripciones de sesiones anteriores.
Extrae patrones: qué salió bien, qué falló, qué errores se repitieron.
Actualiza su memoria con notas curadas que mejoran su desempeño en el siguiente run.

La analogía con el sueño humano no es decorativa. De la misma forma en que el cerebro consolida lo aprendido durante el día mientras dormimos, los agentes de Claude consolidan sus aprendizajes entre sesiones de trabajo. Como lo describió Anthropic en el lanzamiento: "Dreaming refina esa memoria entre sesiones, extrayendo aprendizajes compartidos entre agentes y manteniéndola actualizada."

Un detalle crítico que muchos pasaron por alto: Dreaming no modifica los pesos del modelo. No es entrenamiento. Es más cercano a un sistema estructurado de toma de notas que a un proceso de fine-tuning. Eso lo hace controlable y auditable.

Cómo funciona por dentro

La arquitectura tiene tres capas que trabajan juntas:

1. Memoria por sesión

Cada agente captura lo que aprende mientras trabaja. Si descubrió que cierto tipo de archivo requiere un workaround especial, lo anota. Esa nota queda almacenada en su memoria persistente.

2. Dreaming como proceso de consolidación

De forma programada —puedes configurar la frecuencia— Dreaming entra en acción. Revisa todas esas notas individuales, identifica patrones que se repiten, y produce una versión curada y sintetizada de la memoria.

3. Memoria compartida entre agentes

Aquí viene lo realmente interesante para arquitecturas multi-agente: cuando 20 sub-agentes trabajan en paralelo sobre el mismo dominio, Dreaming puede agregar lo que aprendieron colectivamente y publicar esos insights en un repositorio de memoria compartida. Algo que ninguna sesión individual podría producir por sí sola.

Tú decides el nivel de control: Dreaming puede actualizar la memoria automáticamente, o puedes revisar los cambios antes de que entren en efecto. Si una nota contiene un patrón incorrecto ("siempre saltarse el paso 3"), un humano puede eliminarla antes de que el agente la aplique.

Resultados reales: el caso de Harvey

No todo fue teoría en el evento. Anthropic presentó cuatro estudios de caso de producción. El más impactante fue Harvey, la plataforma de IA legal que coordina trabajo complejo como redacción de documentos largos y análisis de contratos.

Con Dreaming habilitado, los agentes de Harvey comenzaron a recordar entre sesiones: workarounds específicos para tipos de archivo, patrones de herramientas, preferencias del equipo. El resultado fue una mejora de 6x en tasas de completación de tareas. No hubo cambio de modelo. No hubo reentrenamiento. Solo memoria que persiste y mejora.

Netflix también fue mencionado: su equipo de plataforma usa un agente de análisis que procesa logs de cientos de builds en paralelo. El problema no era potencia, sino ruido. Con orquestación multi-agente más Dreaming, el sistema ahora surfea solo los patrones que se repiten en múltiples builds, ignorando los fallos individuales sin relevancia sistémica.

Las otras tres funciones que llegaron con Dreaming

Dreaming no llegó sola. Las tres funciones complementarias que se anunciaron en el mismo evento son parte del mismo sistema:

Outcomes (beta pública): Defines una rúbrica de lo que es una buena respuesta. Un evaluador separado —otra instancia de Claude, con su propio contexto— califica el output del agente contra esa rúbrica. Si falla, identifica exactamente qué cambiar y el agente da otra pasada. En los benchmarks internos de Anthropic, esto mejoró la tasa de éxito hasta 10 puntos en los problemas más difíciles.

Orquestación multi-agente (beta pública): Un agente líder puede delegar subtareas a hasta 20 agentes especializados trabajando en paralelo, cada uno con su propio modelo, prompt y conjunto de herramientas. Todo trazable desde la consola de Claude.

Webhooks: Triggers externos que permiten iniciar flujos de agentes desde eventos del sistema, no solo desde prompts manuales.

Por qué esto cambia la arquitectura de tus proyectos

Si estás construyendo productos sobre agentes de IA —ya sea un SaaS, una automatización, o un sistema interno— Dreaming cambia una pregunta fundamental: antes te preguntabas "¿cómo hago que mi agente sea más capaz?" Ahora la pregunta es "¿cómo hago que mi agente aprenda con el uso?"

Tres escenarios concretos donde esto importa:

1. Agentes de soporte técnico: Cada ticket resuelto enseña algo. Con Dreaming, ese aprendizaje no se pierde al cerrar la sesión. El agente del mes 3 es estructuralmente más competente que el del mes 1, sin ninguna intervención del desarrollador.

2. Automatización de procesos internos: Si tienes un agente revisando PRs o generando reportes, cada excepción que aprende a manejar queda consolidada. El equipo no necesita documentar manualmente los edge cases; el agente los aprende solo.

3. Plataformas multi-tenant: En un SaaS con múltiples clientes, puedes tener memorias aisladas por tenant (cada cliente tiene su propio contexto) o memorias compartidas (el sistema aprende de la base de usuarios entera). Dreaming hace ambas arquitecturas viables sin código adicional.

Las críticas legítimas

No todo el mundo celebró el anuncio con la misma emoción. Varios ingenieros de IA señalaron que Dreaming, técnicamente, no es tan novedoso: se reduce a pruning de memoria programado más extracción de patrones, aplicado a las notas persistentes del agente.

El framework open-source Hermes Agent, por ejemplo, lleva casi un año ofreciendo memoria cross-sesión, construcción de skills desde la experiencia, y revisión programada. La diferencia, según Anthropic, es que ahora es un primitivo de primera clase en la plataforma: no algo que tienes que construir y mantener tú mismo.

El propio equipo de Harvey lo resumió bien: Dreaming funciona mejor cuando está emparejado con una rúbrica de Outcomes bien definida, para que cualquier deriva en la memoria sea capturada por el evaluador en el siguiente run.

El contexto más amplio: ¿hacia dónde va todo esto?

En el mismo evento, el CEO Dario Amodei citó una probabilidad del 60% de que los modelos de IA estén entrenándose a sí mismos en dos años. En ese contexto, Dreaming empieza a verse como lo que probablemente es: un primer paso controlado hacia la auto-mejora de sistemas.

La clave de la arquitectura de Dreaming es que mantiene la capa de mejora completamente separada de la capa del modelo. Las notas son texto. Los humanos pueden leerlas. Pueden corregirlas. Pueden auditarlas. Eso lo diferencia de fine-tuning opaco y lo mantiene dentro de un paradigma donde el humano sigue siendo el árbitro de qué es verdadero y qué no.

El creador de Claude Code, Boris Cherny, lo dijo sin rodeos en el evento: ya no hay código escrito manualmente en Anthropic. Los agentes coordinan entre sí por Slack, codifican en loops y resuelven issues a través del codebase. Dreaming es la infraestructura que hace eso sostenible a escala.

¿Cómo acceder a Dreaming hoy?

A la fecha de publicación de este artículo (junio 2026), la disponibilidad es la siguiente:

Dreaming: Research preview — requiere solicitar acceso a través de la consola de Claude Platform.
Outcomes: Beta pública — disponible para todos los desarrolladores con acceso a Claude Managed Agents.
Orquestación multi-agente: Beta pública — disponible para todos.
Webhooks: Disponible para todos.

El punto de entrada es Claude Managed Agents en la plataforma de Anthropic. Si ya tienes proyectos corriendo sobre la API de Claude, vale la pena evaluar si migrar la capa de memoria a Managed Agents o mantener tu propio stack.

En conclusión, la carrera en IA ya no se gana con el modelo más potente. Se gana con la infraestructura más inteligente alrededor del modelo.

Dreaming no es un truco de marketing con un nombre poético. Es la respuesta de Anthropic a un problema real que cualquier equipo que opera agentes en producción conoce bien: los agentes olvidan, los equipos tienen que documentar manualmente los edge cases, y la mejora no escala.

La pregunta que debería quedarte después de leer esto no es si Dreaming es técnicamente revolucionario. La pregunta es: ¿cuánto conocimiento institucional está perdiendo tu sistema cada vez que se cierra una sesión?

Ahora hay una respuesta práctica a eso. Y se llama soñar.

¿Quieres profundizar en arquitecturas de agentes con memoria persistente? Suscríbete al blog para recibir el próximo artículo sobre "cómo estructurar sistemas multi-agente en producción con Next.js y Supabase".

Buscar en este blog

EL JUBILADO INFORMATICO