En respuesta a las recientes actualizaciones de herramientas como Claude Code, OpenAI ha lanzado una nueva versión de su aplicación de escritorio Codex. Esta actualización redefine la herramienta, ampliando sus capacidades más allá de la generación de código para convertirla en una especie de «superapp». Ahora, Codex puede crear imágenes, retomar proyectos y operar el ordenador de forma independiente.
Según la información proporcionada por OpenAI, una de las características más notables es la capacidad de Codex para interactuar con el ordenador en segundo plano. La herramienta puede observar la pantalla, mover el cursor y hacer clic en aplicaciones instaladas sin interferir con las tareas del usuario. Esto se logra mediante la ejecución de múltiples agentes en paralelo, permitiendo la modificación de archivos, la prueba de aplicaciones o la interacción con herramientas que carecen de API.
Además, Codex introduce un navegador integrado. Dentro de esta función, los usuarios pueden interactuar con elementos de páginas web o dar instrucciones directas a los agentes. Por ejemplo, para cambiar el estilo de un elemento web, basta con hacer clic sobre él y la IA interpretará la instrucción sin necesidad de un prompt detallado.
La integración de GPT-Image-1.5 en Codex permite la generación de imágenes, gráficos y diagramas. Esto facilita a los agentes la creación de elementos visuales para proyectos de diseño de interfaz, conceptualización de productos, maquetas o desarrollo de juegos, todo dentro del mismo entorno de trabajo sin necesidad de cambiar de aplicación.
OpenAI destaca que el uso de Codex por parte de los desarrolladores ha evolucionado significativamente. Inicialmente utilizado para escribir código, ahora se emplea para comprender sistemas, recopilar información, revisar trabajos, depurar problemas y facilitar la colaboración en proyectos a largo plazo.
En cuanto a la automatización, Codex puede mantener el contexto de conversaciones previas, permitiendo la reutilización de sesiones pasadas. También puede programar tareas futuras y reactivarse de forma autónoma para continuar con proyectos extensos. Esta funcionalidad ya se está aplicando en entornos profesionales para gestionar solicitudes de extracción (pull requests) o supervisar conversaciones en plataformas como Slack, Gmail y Notion.
Una novedad importante es la implementación de una función de memoria en la nueva aplicación Codex. Esta característica permite a la IA retener información sobre preferencias del usuario, correcciones o datos relevantes, con el objetivo de mejorar la rapidez y calidad de las tareas futuras, similar a lo que ofrecen otras aplicaciones de IA.
Otras mejoras incluyen sugerencias proactivas, gestión de comentarios en GitHub, la apertura de múltiples pestañas de terminal y la conexión a entornos remotos vía SSH. Codex también ofrece la capacidad de previsualizar diversos tipos de documentos, como PDF, hojas de cálculo, presentaciones y documentos de texto.
La actualización de Codex estará disponible de inmediato para los usuarios de macOS con una cuenta de ChatGPT. Algunas de las funciones más avanzadas, como la personalización, las sugerencias contextuales, la memoria y el control del ordenador, se implementarán posteriormente para usuarios en Europa y Reino Unido, debido a los tiempos necesarios para asegurar el cumplimiento de las regulaciones de manejo de datos.

