Una nueva IA vulnera Linux mejor que los expertos en seguridad, por eso la han ocultado.

Anthropic anunció el lanzamiento del Proyecto Glasswing, una amplia iniciativa para proteger software crítico. Al proyecto se sumaron Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA y Palo Alto Networks. El motivo fue el nuevo conjunto de modelos de lenguaje aún no publicado, Claude Mythos Preview, que, según la empresa, ya es capaz de buscar y explotar vulnerabilidades mejor que casi cualquier persona, salvo los especialistas más destacados.
Anthropic afirma que Claude Mythos Preview ya encontró miles de vulnerabilidades peligrosas, incluidas fallas en sistemas operativos y navegadores web de gran escala. La compañía considera que el desarrollo de estos sistemas va demasiado rápido y que, por ello, capacidades semejantes pronto podrían estar al alcance de actores malintencionados. Anthropic describe las posibles consecuencias de forma contundente: aumento de ataques, perjuicios para la economía y riesgos para la seguridad pública y la seguridad nacional.
El Proyecto Glasswing fue creado como un intento de orientar esas capacidades hacia la defensa y no hacia el ataque. Los participantes del proyecto usarán Claude Mythos Preview para tareas defensivas, y Anthropic prometió compartir sus hallazgos con el sector. El acceso al modelo no se limitó a las empresas participantes: también se incluyeron más de 40 organizaciones adicionales que desarrollan o mantienen sistemas de software e infraestructura importantes, incluidos proyectos de código abierto. Anthropic destinó hasta 100 millones de dólares en créditos para el uso del modelo y asignará además 4 millones de dólares directamente a organizaciones que trabajan en la seguridad del software de código abierto.
La compañía describe la situación como un punto de inflexión para toda la industria. El software que sustenta sistemas bancarios, bases de datos médicas, redes logísticas y redes eléctricas siempre ha contenido errores. Muchas fallas permanecen invisibles durante años porque buscarlas y explotarlas exigía una alta cualificación. Anthropic señala que los modelos de lenguaje modernos han reducido drásticamente la barrera de entrada y ahora no solo saben leer código, sino identificar dónde se ocultan las vulnerabilidades y cómo podrían explotarse en la práctica.
Según la empresa, en las últimas semanas Claude Mythos Preview halló miles de vulnerabilidades de día cero, es decir, problemas que los desarrolladores desconocían hasta entonces. Entre los ejemplos que cita Anthropic figuran una vulnerabilidad de 27 años en OpenBSD que permitía provocar la caída remota del sistema, un error de 16 años en FFmpeg que las pruebas automáticas pasaron por alto millones de veces, y una cadena de vulnerabilidades en el núcleo de Linux que permitía a un usuario común obtener control total sobre la máquina. Todos los problemas mencionados, asegura la empresa, ya se comunicaron a los desarrolladores y se corrigieron mediante actualizaciones.
Anthropic subraya por separado que en varios casos Claude Mythos Preview actuó de forma completamente autónoma, sin indicaciones humanas. La empresa califica ese nivel como peligroso, pero al mismo tiempo útil para los defensores. La lógica es sencilla: si el sistema puede encontrar y vincular vulnerabilidades más rápido que una persona, la misma herramienta puede emplearse para cerrar preventivamente puntos débiles en software crítico.
Los socios del proyecto llevan varias semanas probando el modelo internamente. Cisco declaró que los enfoques tradicionales para fortalecer sistemas ya no alcanzan la nueva velocidad de las amenazas. Amazon Web Services indicó que utiliza el modelo para revisar código crítico. Microsoft informó de mejoras en sus propias comprobaciones de seguridad. CrowdStrike advirtió que la ventana entre la detección de una vulnerabilidad y el ataque se estrecha de meses a minutos. Palo Alto Networks añadió que los atacantes tarde o temprano obtendrán herramientas similares, por lo que los defensores deben prepararse desde ahora.
Anthropic no tiene intención de abrir Claude Mythos Preview al acceso general. La compañía afirma de forma explícita que el modelo es demasiado peligroso para su distribución libre. En el futuro, Anthropic quiere lanzar versiones más seguras de sistemas de esta clase y a la vez desarrollar mecanismos de protección que filtren las respuestas de mayor riesgo relacionadas con ciberataques.
El Proyecto Glasswing también incluye una parte práctica para los próximos meses. Los participantes del programa recibirán acceso a Claude Mythos Preview para buscar y corregir vulnerabilidades en sistemas base que conforman una parte importante de la superficie de ataque global. Se trata de detección local de vulnerabilidades, pruebas de binarios en modo «caja negra», protección de dispositivos finales y comprobaciones de penetración.
Tras la fase de investigación, Anthropic planea ofrecer el modelo a los participantes con una tarifa de 25 dólares por millón de tokens de entrada y 125 dólares por millón de tokens de salida. El acceso se promete a través de Claude API, Amazon Bedrock, Vertex AI en Google Cloud y Microsoft Foundry. Además, la empresa ya entregó 2,5 millones de dólares a las organizaciones Alpha-Omega y OpenSSF mediante la Linux Foundation, y otorgó 1,5 millones de dólares a la Apache Software Foundation para que los proyectos abiertos acompañantes puedan reaccionar con mayor rapidez a los nuevos riesgos.
Anthropic se compromete a publicar en un plazo de 90 días el primer informe sobre los resultados del Proyecto Glasswing, informar sobre las vulnerabilidades cerradas y divulgar conclusiones que no perjudiquen la seguridad. Paralelamente, la compañía mantiene conversaciones con las autoridades estadounidenses y considera que el avance de estos sistemas ya plantea una cuestión de seguridad nacional. Anthropic espera que con el tiempo en torno al Proyecto Glasswing surja una coalición más amplia que incluya al sector privado y al gobierno.
El nombre Proyecto Glasswing hace referencia a la mariposa Greta oto, de alas transparentes. Anthropic utiliza esa imagen como metáfora de las vulnerabilidades que pasan desapercibidas durante largos periodos y de la transparencia que la empresa considera necesaria en la nueva era de la ciberseguridad.