Чт. Май 7th, 2026

La IA de Anthropic (Claude) aprende de forma autónoma a través de la «simulación de sueños»

Anthropic ha introducido una notable actualización para sus agentes de inteligencia artificial que revoluciona el modo en que estos sistemas aprenden. La compañía, responsable del desarrollo de Claude, ha presentado diversas funcionalidades para su infraestructura de agentes autónomos, denominada Managed Agents. Entre ellas, destaca una característica con un nombre inesperado en el ámbito de la IA: la capacidad de «soñar».

Según Anthropic, la función de ‘Soñar’ (Dreaming), tal como su denominación sugiere, opera durante los periodos en que el agente no está activamente procesando tareas. Durante estos lapsos, el sistema revisa las interacciones recientes, identifica patrones en los éxitos y fallos, y actualiza su memoria con estas lecciones aprendidas. Este proceso es programado y se ejecuta mientras la IA no está ocupada con otras funciones.

La compañía se inspira en la experiencia humana nocturna. De manera análoga a cómo el cerebro humano consolida recuerdos y fortalece conexiones neuronales durante el sueño, el agente de IA reorganiza el conocimiento adquirido entre sesiones. Los desarrolladores de Claude afirman que la combinación de memoria y este mecanismo de «sueño» permite que los agentes mejoren de manera autónoma a lo largo del tiempo.

En una publicación oficial, Anthropic señala que el enfoque de «soñar» aborda un desafío común en la IA. Cuando un agente se enfoca en una única tarea, le resulta difícil detectar patrones que se manifiestan a lo largo de múltiples sesiones. La función ‘Dreaming’ es capaz de identificar errores recurrentes o flujos de trabajo que el agente tiende a repetir, incluso cuando varios agentes dentro de un mismo equipo comparten metodologías o preferencias similares.

Respecto al control sobre este proceso, los usuarios tienen la opción de permitir que funcione de manera completamente automática o de revisar los cambios antes de que se incorporen a la memoria del agente. Actualmente, la función ‘Dreaming’ se encuentra en una fase de investigación y está disponible para desarrolladores que soliciten acceso a través de la plataforma de Claude.

Anthropic apuesta por IAs que sueñan, se autoevalúan y dividen el trabajo

Además de la función de «sueño», Anthropic ha lanzado otras dos características diseñadas para aumentar la autonomía y la fiabilidad de sus agentes. La primera se denomina ‘Outcomes’ y se basa en la premisa de que un agente rinde mejor cuando es consciente de su propio desempeño.

Con ‘Outcomes’, es posible establecer una rúbrica de éxito para una tarea específica. Un agente evaluador independiente compara el resultado obtenido con estos criterios. Si se detectan discrepancias, el evaluador señala los puntos débiles y el agente realiza una nueva iteración. Este proceso se repite hasta que el resultado cumple con el estándar definido, eliminando la necesidad de supervisión humana en cada intento.

Anthropic destaca que ‘Outcomes’ es particularmente valioso en tareas que requieren una alta atención al detalle o una cobertura exhaustiva. Las pruebas internas de la compañía indican que esta función ha mejorado el éxito en tareas hasta en un 10% en comparación con los enfoques convencionales mediante prompts.

Finalmente, la plataforma incorporará una funcionalidad de orquestación multiagente. Esta característica se aplica cuando una tarea es demasiado compleja o extensa para ser manejada por un solo agente. En tales escenarios, un agente principal puede dividir la tarea en subcomponentes y asignarlos a agentes especializados que trabajan en paralelo.

Cada agente especializado opera con su propio modelo, instrucciones y herramientas. El agente principal mantiene la supervisión general y puede consultar el estado de los demás durante la ejecución. Toda la actividad queda registrada en la consola de Claude, permitiendo visualizar detalladamente las acciones de cada agente, su orden y las razones detrás de ellas.

A diferencia de ‘Dreaming’, las funciones de ‘Outcomes’ y la orquestación multiagente ya están disponibles en fase beta pública dentro de la plataforma Managed Agents de Anthropic.

By Артём Науменко

Артём Науменко - петербургский журналист, освещающий темы науки, общества и технологий. Автор популярного цикла статей о российских научных достижениях.

Related Post