¿Qué ocurre con Mythos? Anthropic promete vencer los jailbreaks, pero oculta la mayor debilidad de su producto

13:45 / 15.04.2026

El investigador de seguridad Marcus Hutchins descubrió en los informes de la empresa datos sumamente comprometedores.

Las declaraciones ruidosas sobre avances en ciberseguridad suenan cada vez con más frecuencia en el contexto del auge de la inteligencia artificial, pero no todos los especialistas están dispuestos a aceptar esas valoraciones sin más. Ha surgido una nueva polémica en torno al último desarrollo de Anthropic, que la empresa presentó como un paso serio adelante en la búsqueda de vulnerabilidades.

El analista británico de malware Marcus Hutchins, conocido por detener la epidemia de WannaCry, dudó públicamente en las declaraciones de Anthropic sobre las capacidades del modelo Mythos. El motivo fue una presentación en la que la empresa afirma que el sistema es capaz de encontrar y explotar vulnerabilidades mejor que la mayoría de las personas.

El desarrollador también afirmó que el modelo ya ha detectado miles de problemas previamente desconocidos en sistemas operativos, navegadores y software popular. El acceso a Mythos está todavía limitado — lo están probando grandes empresas tecnológicas y organizaciones de ciberseguridad en el marco del proyecto Glasswing.

Hutchins analizó uno de los ejemplos presentados — vulnerabilidad en OpenBSD — que el sistema supuestamente encontró por menos de 20.000 dólares en costes computacionales. Según su valoración, se trata de la desreferenciación de un puntero nulo, un tipo de error que normalmente provoca un fallo y no la toma de control del sistema. Según el especialista, ese hallazgo no parece un logro significativo.

También surgieron dudas sobre el coste declarado. Hutchins sugirió que la cifra refleja el precio de los tokens de la API, no los gastos reales en infraestructura. En un contexto de fuerte financiación por parte de fondos de capital riesgo, el coste de la computación puede estar artificialmente reducido. Recalculado en costes reales, la suma podría resultar considerablemente mayor.

El especialista considera que el problema clave no está en las tecnologías, sino en la economía. Las vulnerabilidades permanecen sin corregir no por falta de herramientas, sino por la ausencia de motivación y remuneración por su búsqueda. Incluso con el uso de la IA, la auditoría del código requiere inversiones, y sin un cambio en el modelo de financiación la situación no cambiará.

Hutchins también señaló que los atacantes utilizan con más frecuencia la ingeniería social y el phishing que ataques técnicos complejos. Por esta razón, las nuevas herramientas de búsqueda de vulnerabilidades no cambian de forma fundamental el equilibrio de fuerzas en la ciberseguridad.

Anteriormente, el analista ya había criticado las declaraciones grandilocuentes sobre el papel de la IA en la industria. En otoño refutó un estudio del MIT que afirmaba que el 80 por ciento de los ataques con ransomware estaban relacionados con la inteligencia artificial. Posteriormente ese material fue retirado del sitio web de la universidad.

Онлайн

ИЮНЯ

16:20

Product Backstage*: безопасная разработка и защита контейнеров

17 июня обсудим обновления PT Application Inspector, PT BlackBox и безопасность контейнеров.

Зарегистрироваться

Реклама. 18+. АО «Позитив Текнолоджиз», ИНН 7718668887 · *Продуктовое закулисье

¿Qué ocurre con Mythos? Anthropic promete vencer los jailbreaks, pero oculta la mayor debilidad de su producto

Noticias sobre el tema

Botas, nieve y batería agotada: ingenieros llevan un Unitree G1 a un volcán en Ecuador

Un solo golpe, cuatro bancos: Teherán vuelve a la era de los pagos en efectivo

Hackers chinos espiaron durante una década en una red corporativa cerrada y nadie se enteró

Descubrió una vulnerabilidad en AMD y se quedó sin recompensa: cómo la empresa «estafó» a un cazador de bugs por $10.000

¿Atrapaste a todos los Pokémon? Los escaneos de Pokémon Go alimentan la IA de navegación de drones militares

Alquiló una máquina virtual y consiguió acceso root al host: vulnerabilidad en el kernel de Linux que pasó desapercibida durante dos años

¿Instalaste fondos de pantalla animados en Chrome? Enhorabuena: los estafadores ya han conseguido su primer millón a tu costa

Motín en directo: ingenieros de Meta* interrumpen una presentación por desacuerdos sobre los protocolos de la IA

¿Crees que la memoria RAM está cara ahora? Espera hasta finales de 2026.