A pocas semanas de su lanzamiento, Claude Mythos, el novedoso modelo de inteligencia artificial de Anthropic, está revolucionando el panorama de la ciberseguridad. La empresa ha anunciado que su herramienta ya ha detectado más de 10.000 fallos de seguridad de alta o crítica gravedad en sistemas fundamentales de internet.
Anthropic detalló en una publicación en su sitio web los resultados del Project Glasswing, una iniciativa cuyo objetivo es fortalecer el software esencial antes de que pueda ser explotado por actores maliciosos. Entre las vulnerabilidades identificadas en compañías como Cloudflare y Mozilla, se encuentran fallos de diversa índole.
Según el informe, Cloudflare halló 2.000 errores en sus sistemas de ruta crítica, de los cuales 400 eran de alta o crítica severidad, superando en precisión a los evaluadores humanos. Por su parte, Mozilla reportó 271 vulnerabilidades en Firefox 150 al emplear Mythos Preview, una cifra significativamente mayor que la detectada con Claude Opus 4.6 en Firefox 148.
Un caso notable documentado por Anthropic involucra a wolfSSL, una librería criptográfica de código abierto utilizada en miles de millones de dispositivos. Mythos Preview logró crear un exploit capaz de falsificar certificados digitales, lo que permitiría a un atacante suplantar la identidad de entidades como bancos o proveedores de correo electrónico mediante sitios web fraudulentos pero de apariencia legítima. Esta vulnerabilidad, identificada como CVE-2026-5194, ya ha sido corregida.
El Impacto de Claude Mythos en el Software de Código Abierto
Además de los trabajos con socios, Anthropic ha estado analizando más de 1.000 proyectos de código abierto que son la base de gran parte de la infraestructura de internet. El modelo ha descubierto 6.202 vulnerabilidades de alta o crítica gravedad, de las cuales una firma independiente ha verificado 1.752. Se estima que el número de fallos críticos confirmados en código abierto podría superar los 3.900 a este ritmo.
Si bien Claude Mythos está identificando vulnerabilidades a una velocidad sin precedentes, la IA también está generando un cuello de botella. Algunos desarrolladores de proyectos de código abierto han solicitado a Anthropic que modere su ritmo de comunicación, debido a la limitada capacidad para crear parches a la misma velocidad. En promedio, un fallo crítico descubierto por Mythos tarda dos semanas en ser corregido.
Esta discrepancia podría desencadenar problemas a corto plazo. La creciente disponibilidad de modelos de IA con capacidades similares a Mythos Preview en un futuro cercano, reducirá el margen temporal entre la identificación de una vulnerabilidad y su potencial explotación.
«En última instancia, los modelos de la clase Mythos permitirán a los desarrolladores crear software mucho más seguro al detectar errores antes de su implementación», afirmó Anthropic. «Sin embargo, este período de transición, donde las vulnerabilidades se descubren rápidamente y se corrigen lentamente, presenta nuevos riesgos».
Para agilizar este proceso, Anthropic ha lanzado Claude Security en beta pública para clientes empresariales. Esta herramienta, diseñada para escanear código y generar correcciones automáticas, ya ha solucionado más de 2.100 vulnerabilidades en tan solo tres semanas. La compañía también ha habilitado un programa que permite a investigadores de seguridad legítimos utilizar los modelos bajo ciertas condiciones que buscan prevenir abusos.
Anthropic ha prometido que lanzará una versión pública de Claude Mythos, pero solo después de que se hayan implementado medidas de seguridad más robustas.

