Пт. Май 1st, 2026

GPT-5.5 y Claude Mythos: IA Avanzada en Ciberseguridad y Riesgos Potenciales

El Instituto de Seguridad de la Inteligencia Artificial del Reino Unido (AISI) ha publicado una evaluación exhaustiva sobre las capacidades ofensivas de GPT-5.5 en el ámbito de la ciberseguridad. Tras analizar previamente a Claude Mythos, el AISI ha dirigido su atención al nuevo modelo de OpenAI, concluyendo que ambas inteligencias artificiales tienen la aptitud de ejecutar ciberataques multifacéticos de principio a fin, sin intervención humana.

Según el informe oficial del AISI, GPT-5.5 se convierte así en el segundo modelo de inteligencia artificial en lograr de forma autónoma una simulación completa de ataque corporativo en red. Previamente, Claude Mythos Preview, a mediados de abril, demostró su habilidad para perpetrar ataques sofisticados y resolver desafíos de vulnerabilidad de alta complejidad.

Para llegar a estas conclusiones, el organismo empleó un conjunto de 95 tareas de ciberseguridad, clasificadas por niveles de dificultad. Mientras que las pruebas de nivel básico han sido consistentemente superadas por modelos de IA desde principios de 2026, los desafíos avanzados presentan un panorama distinto.

Estas pruebas, diseñadas en colaboración con Crystal Peak Security e Irregular, demandan habilidades especializadas como ingeniería inversa de firmware, desarrollo de exploits y ataques criptográficos avanzados. En las tareas de nivel experto, GPT-5.5 obtuvo una tasa de éxito promedio del 71.4%, superando a Claude Mythos Preview (68.6%), GPT-5.4 (52.4%) y Opus 4.7 (48.6%).

En las simulaciones de entornos reales, los resultados son aún más reveladores. La primera simulación, ‘The Last Ones’, emula una intrusión empresarial completa con 32 pasos interconectados a través de cuatro subredes y aproximadamente veinte dispositivos. En este escenario, la IA, partiendo sin credenciales, debe tomar el control del sistema y extraer datos de una base de datos interna protegida. Mientras que un atacante humano podría tardar 20 horas, GPT-5.5 logró completar la tarea en 2 de cada 10 intentos, una cifra comparable a los 3 intentos de Claude Mythos.

La segunda simulación, ‘Cooling Tower’, representa un entorno de sistemas de control industrial enfocado en comprometer una planta de energía. Ninguno de los modelos evaluados ha logrado completarla hasta la fecha, incluyendo GPT-5.5. En esta prueba, la IA se vio limitada en las fases de IT convencionales, sin llegar a los desafíos específicos de tecnología operacional.

Además de evaluar las capacidades ofensivas, el AISI examinó las protecciones de GPT-5.5 contra usos malintencionados. Un equipo de expertos logró desarrollar un ‘jailbreak’ universal capaz de sortear las salvaguardas y generar contenido prohibido en consultas maliciosas. OpenAI actualizó sus medidas de seguridad tras los hallazgos, si bien los investigadores no pudieron verificar la plena efectividad de estas modificaciones.

«GPT-5.5 demuestra que la mejora rápida en tareas cibernéticas puede ser parte de una tendencia más general», señaló el AISI. «Si la habilidad ciberofensiva emerge como un subproducto de mejoras más amplias en autonomía, razonamiento y codificación a largo plazo, deberíamos esperar aumentos continuos en la capacidad cibernética de los modelos en un futuro cercano, posiblemente en rápida sucesión».

Es importante destacar que, al igual que con Claude Mythos, la evaluación de ciberseguridad de GPT-5.5 se realizó en entornos controlados y simulados, donde no estaban presentes elementos de defensa como el monitoreo activo o los sistemas de respuesta a incidentes. Los investigadores concluyeron que, al igual que Claude Mythos, GPT-5.5 puede explotar sistemas empresariales con escasa seguridad. Aunque no es capaz de comprometer de forma autónoma sistemas robustos, su uso por parte de un atacante humano podría representar un riesgo significativo.

By Артём Науменко

Артём Науменко - петербургский журналист, освещающий темы науки, общества и технологий. Автор популярного цикла статей о российских научных достижениях.

Related Post